오라클 성능 고도화 원리와 해법 II (2012년)
병렬 조인 0 0 58,754

by 구루비스터디 병렬처리 Partition Wise 병렬조 PQ_DISTRIBUTE [2018.04.01]


병렬 조인

성능 최적화 포인트

  • 각 병렬 프로세스들이 독립적으로 일 할 수 있도록 데이터 적절하게 분배


조인 방법

  • 양 쪽 모두 Join 컬럼에 대해 Partition 되어 있을 경우
  • 한 쪽 테이블만 Join 컬럼에 대해 Parition 되어 있을 경우
  • 둘 다 Join 컬럼에 대해 Partition 없어서 동적 파티셔닝
  • 둘 다 Join 컬럼에 대해 Partition 없어서 Broadcast


1번 경우(양쪽 모두 Join 컬럼 기준 파티션)



Full Partition Wise


순서
  1. 양쪽 테이블을 각각 같은 파티션으로 나눠 프로세스 분배
  2. 각 프로세스 내부에서 조인
  3. 최종 결과 QC 전송


플랜에는
  • PX PARTITION RANGE ALL
  • PARTITION RANGE ITERATOR


특징
  • 하나의 서버집합만 필요(Partition degree * 1 개 Process)
  • 파티션 기반 병렬처리이므로 파티션 갯수 이하로 병렬도 제한
  • 파티션 방식, 조인 방식에 무관하게 동작 가능
  • 양 테이블이 같은 컬럼, 같은 기준으로 파티션 되어 있어야 가능


2번 경우(한 쪽 테이블만 Join 컬럼에 대해 Parition)



Partial Partition Wise


순서
  1. 첫 서버 집합이 비 파티션 테이블을 파티션 테이블 기준으로 동적 파티셔닝
  2. 각 프로세스 내부에서 조인
  3. 최종 결과 QC 에 전송


플랜에는
  • PARTITION (KEY)
  • PART (KEY)


특징
  • 두 개의 서버집합 필요(Partition degree * 2 개 Process)
  • 각 서버집합 간 데이터 통신 발생


3번 경우(둘 다 Join 컬럼에 대해 Partition 없어서 동적 파티셔닝)



순서
  1. 첫 서버 집합이 outer 테이블 읽어 두 번째 서버 집합에 분배
  2. 첫 서버 집합이 inner 테이블 읽어 두 번째 서버 집합에 분배
  3. 두 번째 서버 집합이 각 프로세스 내부에서 조인
  4. 최종 결과 QC 에 전송


플랜에는
  • PQ Distribute HASH
  • PX SEND HASH


특징
  • 조인 전에 메모리나 TEMP TBS 를 많이 사용
  • 전체범위 처리 필요
  • 조인컬럼 내부 데이터 분포 불균등할 경우 프로세스 간 처리 데이터 차이 발생 가능
  • 둘 다 대용량이고 조인컬럼 데이터 분포 균일할 때 효과적


4번 경우(둘 다 Join 컬럼에 대해 Partition 없어서 broadcast)



순서
  1. 첫 서버 집합이 작은 테이블 전체를 두 번째 집합의 모든 프로세스에 전송
  2. 첫 서버 집합이 큰 테이블을 두 번째 집합의 각 프로세스에 동적 파티셔닝 해 전송
  3. 두 번째 서버 집합이 각 프로세스 내부에서 조인
  4. 최종 결과 QC 에 전송


특징
  • broadcasat 되는 테이블은 비교적 작아서 Serial 하게 읽는것이 일반적
  • 조인 방식에 무관하게 동작 가능
  • 작은 테이블은 전체범위 필요, 큰 테이블은 부분범위 가능


"구루비 데이터베이스 스터디모임" 에서 2012년에 "오라클 성능 고도화 원리와 해법 II " 도서를 스터디하면서 정리한 내용 입니다.

- 강좌 URL : http://www.gurubee.net/lecture/3311

- 구루비 강좌는 개인의 학습용으로만 사용 할 수 있으며, 다른 웹 페이지에 게재할 경우에는 출처를 꼭 밝혀 주시면 고맙겠습니다.~^^

- 구루비 강좌는 서비스 제공을 위한 목적이나, 학원 홍보, 수익을 얻기 위한 용도로 사용 할 수 없습니다.

댓글등록
SQL문을 포맷에 맞게(깔끔하게) 등록하려면 code() 버튼을 클릭하여 작성 하시면 됩니다.
로그인 사용자만 댓글을 작성 할 수 있습니다. 로그인, 회원가입