- 주문 내역에서 추가로 주문한 상품 정보를 조회한다.
- 하나의 주문에 상품은 여러 개가 있을 수 있으므로 xToMany형태의 컬렉션 조회가 될 것이다.
- 지금까지 게시글로 원하는 API 반환을 위해서는 API 스펙에 맞춰 DTO 클래스를 설계하여 반환해야한다는 것을 알고 있다는 가정 하, DTO로 변환하여 반환하는 코드로 작성
- 조건 : API 반환으로 원하는 조건은 { 주문 번호, 사용자 이름, 주문 날짜, 주문 상태, 배송지 정보, 주문한 상품 정보} 이다. 이 스펙에 맞춰 DTO를 개발해야한다.
위 조건에 대해
1. < API 스펙에 맞는 DTO 설계 API 개발 > : 엔티티에 의존하는 API 개발 한계 해결
2. < DTO + 페치 조인 API 개발 > : DTO 개발 설계 시 발생하는 비효율성 한계 해결
까지 진행했다. 하지만 2번으로 진행할 시 컬렉션 조회의 경우 페이징 처리가 불가능했다.
페치 조인으로 API 컬렉션 개발을 할 경우 페이징 처리가 불가능하다는 것은 페치 조인을 사용하면 안된다는 뜻이고,
페치 조인을 사용하지 않으면 전처럼 1+N 문제가 발생하여 매우 비효율적이게 된다.
(1+N 문제가 무엇인지 알 수 있는 게시글)
https://wonsjung.tistory.com/424?category=1024251
API 개발 : 간단한 주문 조회 (지연 로딩)
이번 게시글은 지난 게시글과는 달리 회원이 아닌 주문을 조회한다고 가정했을 경우이다. 조회이기 때문에 REST API : GET Method는 동일하다. 이번 간단한 주문 조회의 가정은 컬렉션 조회가 아닌 xTo
wonsjung.tistory.com
이번 게시글을 통해 1+N문제가 발생하지 않으면서 페이징 처리를 할 수 있는 방법에 대해 알아본다.
페이징과 한계 돌파
- 컬렉션을 페치 조인하면 페이징이 불가능하다.
- 컬렉션을 페치 조인하면 일대다 조인이 발생하므로 데이터가 예측할 수 없이 증가한다.
- 일대다에서 일(1)을 기준으로 페이징을 하는 것이 목적이다. 그런데 데이터는 다(N)를 기준으로 row가 생성된다.
- Order를 기준을 페이징 하고 싶은데, 다(N)인 OrderItem을 조인하면 OrderItem이 기준이 되어버린다.
- 이 경우 하이버네이트는 경고 로그를 남기고 모든 DB 데이터를 읽어서 메모리에서 페이징을 시도한다. 최악의 경우 장애로 이어질 수 있다.
권장 방안
- 먼저 ToOne(OneToOne, ManyToOne) 관계를 모두 페치조인 한다. ToOne 관계는 row수를 증가시키지 않으므로 페이징 쿼리에 영향을 주지 않는다.
- 컬렉션은 지연 로딩으로 조회한다.
- 지연 로딩 성능 최적화를 위해 hibernate.default_batch_fetch_size, @BatchSize 를 적용한다.
- hibernate.default_batch_fetch_size : 글로벌 설정
- @BatchSize : 개별 최적화
- 이 옵션을 사용하면 컬렉션이나, 프록시 객체를 한 꺼번에 설정한 size만큼 IN 쿼리로 조회한다.
즉, 지연로딩을 하게 되면 원하는 정보를 모두 담기 위해 각각에 테이블에 쿼리문을 날리게 된다.
1 <-> N <-> M 이렇게 연관관계가 있다고 가정해보자. 우리가 원하는 정보를 얻기 위해서는 1테이블을 시작으로 해서 M 테이블까지 정보를 가져와야한다.
그럼 1개를 가져오기 위한 쿼리문을 날리고, 그 안에 정보와 연관이 있는 N개의 정보를 위해 N개의 쿼리문을 날리고, 또 N과 연관관계가 있는 M개의 정보를 가져오기 위해 M개의 쿼리문을 날려야한다. (1 + N + M)문제가 발생하게 된다.
이것을 BatchSize를 통해 한 번에 설정한 size만큼 끌어가져오는 것이다. 만약 size가 max(N, M)보다 클 경우에는 쿼리문 한 번에 모든 정보를 IN 쿼리로 가져오는 것이다.
ex) N이 1000이고 size가 100이면 10번의 IN쿼리로 가져오는 것이다.
이를 구현하는 방법은
< OrderApiController class >
@GetMapping("/api/v3.1/orders")
public List<OrderDto> ordersV3_page(
@RequestParam(value = "offset", defaultValue = "0") int offset,
@RequestParam(value = "limit", defaultValue = "100") int limit) {
List<Order> orders = orderRepository.findAllWithMemberDelivery(offset, limit);
List<OrderDto> result = orders.stream()
.map(o -> new OrderDto(o))
.collect(Collectors.toList());
return result;
}
}
< OrderRepository class >
public List<Order> findAllWithMemberDelivery(int offset, int limit){
return em.createQuery(
"select o from Order o" +
" join fetch o.member m" +
" join fetch o.delivery d", Order.class)
.setFirstResult(offset)
.setMaxResults(limit)
.getResultList();
}
이렇게 우리가 원하는 크기를 @RequestParam을 통해 설정해주고 쿼리문에도 등록해주는 것이다.
< 최적화 옵션 - application.yml >
spring:
jpa:
properties:
hibernate:
default_batch_fetch_size: 1000
※ 개별로 설정하려면 @BatchSize를 적용하면 된다. (컬렉션은 컬렉션 필드에, 엔티티는 엔티티 클래스에 적용)
- 장점
- 쿼리 호출 수가 1 + N --> 1 + 1로 최적화
- 조인보다 DB 데이터 전송량이 최적화 된다. (Order와 OrderItem을 조인하면 Order가 OrderItem 만큼 중복해서 조회된다. 이 방법은 각각 조회하므로 전송해야할 중복 데이터가 없다.)
- 페치 조인 방식과 비교해서 쿼리 호출 수가 약간 증가하지만, DB 데이터 전송량이 감소한다.
- 컬렉션 페치 조인은 페이징이 불가능하지만 이 방법은 가능하다
- 결론
- ToOne관계는 페치 조인해도 페이징에 영향을 주지 않는다. 따라서 ToOne관계는 페치 조인으로 쿼리 수를 줄여 해결하고, 나머지는 hibernate.default_batch_fetch_size로 최적화한다.
※ 참고 : default_batch_fetch_size의 크기는 적당한 사이즈를 골라야 하는데, 100 ~ 1000 사이를 선택하는 것을 권장
이 전략을 SQL IN 절을 사용하는데, 데이터베이스에 따라 IN 절 파라미터를 1000으로 제한하기도 한다. 1000으로 잡으면 한 번에 1000개를 DB에서 애플리케이션에 불러오므로 DB에 순간 부하가 증가할 수 있다. 하지만 애플리케이션은 100이든 1000이든 결국 전체 데이터를 로딩해야 하므로 메모리 사용량이 같다.
1000으로 설정하는 것이 성능상 가장 좋지만, 결국 DB든 애플리케이션이든 순간 부하를 어디까지 견딜 수 있는지로 결정하면 된다.
'Spring > API' 카테고리의 다른 글
Spring Boot OpenAPI 3.0 + Swagger version 3 적용 및 설정하기, Swagger에 JWT 기능 설정하기 (1) | 2023.06.21 |
---|---|
[Spring] ResponseEntity란? (0) | 2022.07.25 |
API 개발 - 컬렉션 조회 (페치 조인 최적화) (0) | 2022.07.01 |
API 개발 : 컬렉션 조회 (0) | 2022.06.28 |
API 개발 : 간단한 주문조회 (지연로딩 최적화 - 패치 조인) (0) | 2022.06.26 |