[SQL 튜닝] 오라클 힌트(hint)의 개념/ 사용법 정리
💡 힌트(Oracle Hint)란 무엇일까?
힌트란 SQL 튜닝의 핵심 부분으로 일종의 지시 구문이다.
즉, 오라클 옵티마이저(Optimizer)에게 SQL문 실행을 위한 데이터를 스캐닝하는 경로, 조인하는 방법 등을 알려주기 위해 SQL사용자가 SQL 구문에 작성하는 것을 뜻한다. 오라클이 항상 최적의 실행 경로를 만들어 내기는 불가능하기 때문에 직접 최적의 실행 경로를 작성해 주는 것이다. 사용자가 특정 SQL 문장에서 어떤 인덱스가 선택도가 높은지 알고 있는 경우 Optimizer에 의존한 실행 계획보다 훨씬 효율적인 실행 계획을 구사할 수 있다.
단, 힌트, 인덱스, 조인의 개념을 정확히 알고 사용하지 않은 무분별한 힌트의 사용은 성능의 저하를 초래하기 때문에 잘 알고 최적의 실행 경로를 알고 있을 경우 적절하게 사용하여야 한다.
(힌트에 오타가 있는 경우는 큰 관계가 없다. 왜냐하면, 잘못 사용된 힌트는 무시되어 힌트가 없는 것처럼 동작하기 때문)
💡힌트의 쓰임과 사용방법
힌트를 사용하여 아래와 같은 것들을 할 수 있다.
액세스 경로, 조인 순서, 병렬 및 직렬 처리, Optimizer의 목표(Goal)를 변경 가능하다.
데이터 값을 정렬해야 하는 경우, 힌트의 사용이 필요하다. 참고 링크👉🏻클릭
또한, 드라이빙 테이블을 원하는 대로 선정하고자 할 때도 사용된다. 참고 링크👉🏻 클릭
드라이빙 테이블이 무엇인지 궁금하다면,
2020/03/09 - [👩💻TIL/DB] - [SQL 튜닝] 드라이빙 테이블(DRIVING TABLE)의 개념/결정 규칙
모든 힌트의 기본 사용법은 쿼리 서두에 힌트를 명시하는 것이다. 예를 들어 아래와 같다.
-- index_asc, index 힌트 : 인덱스 영역에서 순방향으로 스캔 하라는 뜻
SELECT /*+ index_asc(e idx_myemp1_ename) */
EMPNO, ENAME, SAL FROM MYEMP1 e
WHERE ENAME >= '가'
(앞부분에 +기호가 붙는다는 점에서 주석과의 차이 유의)
1. OPTIMIZER_MODE 지정가능 값
/*+ ALL_ROWS */
목적 : Best Throughput
용 도 : 전체 RESOURCE 소비를 최소화시키기 위한 힌트. Cost-Based 접근방식으로 ALL_ROWS는 Full Table Scan을 선호하며 CBO(Cost Based Optimization)는 default로 ALL_ROWS를 선택한다.
/*+ FIRST_ROWS */
목적 : Best Response Time
용도 : 조건에 맞는 첫 번째 row를 리턴하기 위한 Resource 소비를 최소화시키기 위한 힌트이며 Cost-Based 접근방식을 사용.
특징 - Index Scan 이 가능하다면 Optimizer가 Full Table Scan 대신 Index Scan을 선택한다.
- Index Scan 이 가능하다면 Optimizer가 Sort-Merge 보다 Nested Loop을 선택한다.
- Order By절에 의해 Index Scan이 가능하면, Sort과정을 피하기 위해 Index Scan을 선택한다.
- Delete/Update Block에서는 무시된다.
- 다음을 포함한 Select 문에서도 제외된다.
집합 연산자 (UNION, INTERSECT, MINUS, UNION ALL)
Group By
For UpDate
Group 함수
Distinct
- Full Table Scan보다는 index scan을 선호하며 Interactive Application인 경우 best response time을 제공한다
- sort merge join보다는 nested loop join을 선호한다.
/*+ CHOOSE */
목적 : access 되는 테이블에 통계치 존재 여부에 따라 Optimizer로 하여금 Rule-Based Approach와 Cost-Based Approach 중 하나를 선택할 수 있게 한다.
용 도 : Data Dictionary가 해당 테이블에 대해 통계정보를 가지고 있다면 Optimizer는 Cost-Based Approach를 선택하고, 그렇지 않다면 Rule-Based Approach를 선택한다. Hint Level의 CHOOSE는 RBO(Rule Based Optimization)인지 CBO(Cost Based Optimization) 인지를 선택한다. 만약 주어진 table의 통계 정보가 없다면 Rule Based 접근 방식을 사용한다.
/*+ RULE */
: Rule Based 접근 방식을 사용하도록 지정한다.
2. Access Methods - 접근 방법
/*+ FULL(table_name) */
: Table을 Full Scan 하길 원할 때 사용
/*+ HASH(table) */
: Hash scan을 선택하도록 지정 (HASHKEYS Parameter로 만들어진 Cluster내에 저장된 Table에만 적용)
/*+ CLUSTER(table_name) */
: Cluster Scan을 선택하도록 지정. 따라서 Clustered Object만 적용
/*+ HASH_AJ */
: NOT IN SubQuery를 HASH Anti-join으로 변형
/*+ HASH_SJ */
: Correlated Exists Subquery를 Hash Semi-join으로 변형
/*+ INDEX(table_name index_name) */
: 지정된 index를 강제적으로 쓰게끔 지정
- in list predicat에 대해서도 가능.
- Multi-column inlists는 index를 사용할 수 없다.
/*+ INDEX_COMBINE(table_name index_name) */
: Index명이 주어지지 않으면 Optimizer는 해당 테이블의 Best Cost로 선택된 Boolean Combination Index를 사용하며 Index 명이 주어지면 주어진 특정 Bitmap Index의 Boolean Combination의 사용
/*+ INDEX_ASC(table_name index_name) */
: 지정된 index를 오름차순으로 쓰게끔 지정(기본은 오름차순)
/*+ INDEX_DESC(table_name index_name) */
: 지정된 index를 내림차순으로 쓰게끔 지정
SQL> SELECT /*+ index_desc(emp pk_emp) */ empno
FROM emp
WHERE rownum = 1 ;
(위 문장은 제일 큰 것 하나만 조회되므로, max function의 기능을 대신할 수 있다.)
/*+ INDEX_FFS(table index) */
: Full table scan보다 빠른 Full index scan을 유도
/*+ ROWID(table) */
: Rowid로 Table Scan을 하도록 지정
/*+MERGE_AJ*/
: NOT IN Subquery를 Merge Anti-join으로 변형
/*+MERGE_SJ*/
: Correalted EXISTS Subquery를 Merge Semi-join으로 변형
/*+AND_EQUAL(Table Index1, Index 2...) */
: Single-Column Index의 Merge를 이용한 Access Path 선택. 적어도 두 개 이상의 Index가 지정되어야 한다. Max로 5개까지 지정 가능
/*+USE_CONCAT*/
: 조건절의 OR를 UNION ALL 형식으로 변형한다. 일반적으로 변형은 비용 측면에서 효율적일 때만 일어난다.
3. Join Orders
/*+ ORDERED */
: From절에 기술된 테이블 순서대로 join이 일어나도록 유도
/*+ STAR*/
: Star Query Plan이 사용 가능하다면 이를 이용하기 위한 Hint. Star Plan은 규모가 가장 큰 테이블이 Query에서 Join Order상 마지막으로 위치하게 하고 Nested Loop으로 Join이 일어나도록 유도한다. 적어도 3개 테이블 이상이 조인에 참여해야 하며 Large Table의 Concatenated Index는 최소 3 칼럼 이상을 Index에 포함해야 한다. 테이블이 Analyze 되어 있다면 Optimizer가 가장 효율적인 Star Plan을 선택한다.
4. Join Operations
/*+ USE_NL(table1 table 2...) */
: 테이블의 Join 시 테이블의 각 Row가 Inner 테이블을 Nested Loop 형식으로 Join 한다. 지정된 table이 inner table이 된다. ( inner table <-> driving(outer) table )
흔히 ORDERED Hint와 함께 쓴다.
/*+ USE_HASH (table_name) */
: 각 테이블 간 HASH JOIN이 일어나도록 유도한다
/*+ USE_MERGE (table_name) */
: 지정된 테이블들의 조인이 SORT-MERGE형식으로 일어나도록 유도한다.
/*+ DRIVING_SITE(table_name) */
: QUERY의 실행이 ORACLE에 의해 선택된 SITE가 아닌 다른 SITE에서 일어나도록 유도.
5. Parallel Execution
/*+ NOPARALLEL(table_name) */
: Parallel Query Option을 사용하지 않도록 할 수 있음.
/*+ PARALLEL(table_name, degree) */
: PARALLEL hint를 사용하면 query에 포함된 table의 degree를 설정할 수 있다. 예를 들어, 다음과 같이 hint를 적어 degree 4로 parallel query option을 실행하도록 할 수 있다. 이때 parallel이란 글자와 괄호( '(' ) 사이에 blank를 넣지 않도록 주의해야 함
=> DEGREE의 의미 및 결정
- Parallel Query에서 degree란 하나의 operation 수행에 대한 server process의 개수를 의미하며 이러한 degree 결정에 영향을 주는 요인들에는 다음과 같은 것들이 있다.
(1) system의 CPU 개수
(2) system의 maximum process 개수
(3) table이 striping 되어 있는 경우, 그 table이 걸쳐있는 disk의 개수
(4) data의 위치 (즉, memory에 cache 되어 있는지, disk에 있는지)
(5) query의 형태 (예를 들어 sorts 혹은 full table scan)
SQL> SELECT /*+ PARALLEL(emp, 4) */ * FROM emp;
6. Additional Hints
/*+ CACHE(table) */
: full table scan시 retrieve 된 block을 LRU list에서 most recently used end에 놓는다.
즉, memory에 오래 존재하게 한다.
/*+ NOCACHE(table) */
: full table scan시 retrieve된 block을 LRU list에서 least recently used end에 놓는다.
즉, memory에서 금방 내려가게 한다.
/*+ MERGE(view) */
: COMPLEX_VIEW_MERGING = FALSE로 되어 있을 때 view 또는 subquery의 내용을 merge가능.
/*+ NOMERGE(view) */
: COMPLEX_VIEW_MERGING = TRUE로 되어 있을 때 사용
view 또는 subquery의 내용을 merge불가능.
view 또는 subquery자체의 query문에 의한 영향을 많이 받게 됨.
/*+ PUSH_SUBQ */
: nomerged subqueries가 execution plan에서 가능한 가장 빠른 위치에서 evaluation 되도록 한다.
일반적으로, merge 되지 않은 subqueries는 execution plan에서 마지막 step으로써 수행된다.
subqueries가 상대적으로 inexpensive 하고 rows의 수를 줄일 수 있다면, subqueries를 더 일찍 evaluation 하는 것이 performance를 향상할 것이다. subquery가 remote table에 적용되거나, merge join을 사용하는 join 된 table에 적용된다면 이 hint는 적용되지 않는다.
힌트는 반드시 써야 되는 상황이 있고, 알고 제대로 쓰면 튜닝에 많은 도움이 된다. 그러나 힌트를 안 써도 대부분의 CBO에서는 데이터를 효율적으로 잘 가지고 오기 때문에 굳이 잘못 작성된 힌트로 인해 성능을 떨어 뜨리는 경우는 피해야 한다. 개발 시 주변에서 어떤 힌트를 쓰니까 빨라졌다고 해서 비슷해 보이는 쿼리에 힌트를 남발하는 것은 위험할 수 있다! 많이 공부하고 사용하자📚
'👩💻TIL > DB' 카테고리의 다른 글
[MySQL] The server time zone 에러 해결 (0) | 2020.04.10 |
---|---|
[MyBatis] BindingException: Invalid bound statement (not found) 에러 (0) | 2020.04.10 |
[SQL 튜닝] 드라이빙 테이블(DRIVING TABLE)의 개념/결정 규칙 (3) | 2020.03.09 |
[DB]트랜잭션(Transaction)이란?/트랜잭션의 개념,특징, 연산과정/savepoint (2) | 2020.02.16 |
[DB]SQL(관계형 데이터베이스)과 NoSQL(비 관계형 데이터베이스) 개념/비교/차이 (2) | 2020.02.13 |
댓글