SQL에서 문자열 비교와 대소문자 구분 – LIKE, =, ILIKE의 차이점

Posted by heoncode
2025. 4. 16. 14:14 SQL 기초 정리
728x90
반응형
SMALL

SQL에서 문자열 비교와 대소문자 구분 – LIKE, =, ILIKE의 차이점

SQL에서 문자열을 비교할 때, 사용되는 연산자나 함수에 따라 대소문자 구분 여부가 달라질 수 있습니다. 이로 인해 예상치 못한 결과가 나올 수 있으므로, 문자열 비교 시 어떤 연산자를 사용해야 할지 정확히 이해하는 것이 중요합니다. 이 글에서는 SQL에서 LIKE, =, ILIKE의 차이점과 대소문자 구분에 대해 정리합니다.

1. = 연산자: 정확한 일치 비교

= 연산자는 두 문자열이 완전히 동일한지 비교할 때 사용됩니다. 이 연산자는 대소문자를 구분합니다. 즉, Aa는 다른 값으로 간주됩니다.

예시:

SELECT * FROM users
    WHERE username = 'JohnDoe';

위 쿼리는 username이 정확히 'JohnDoe'인 경우만 반환합니다. 만약 johnDoeJOHNDOE가 있다면 결과에 포함되지 않습니다.

2. LIKE 연산자: 패턴 일치 비교

LIKE 연산자는 문자열의 일부분이 일치하는지 확인할 때 사용됩니다. 이때 대소문자 구분 여부는 사용하는 DBMS에 따라 다릅니다. 예를 들어, MySQL에서는 기본적으로 대소문자를 구분하지 않지만, PostgreSQL에서는 기본적으로 대소문자를 구분합니다.

예시:

SELECT * FROM users
    WHERE username LIKE 'john%';

위 쿼리는 username이 'john'으로 시작하는 모든 값을 반환합니다. MySQL에서는 'john'과 'John'이 모두 매칭될 수 있지만, PostgreSQL에서는 'john'만 매칭됩니다.

3. ILIKE 연산자: 대소문자 구분 없는 비교 (PostgreSQL 전용)

PostgreSQL에서는 ILIKE 연산자를 사용하여 대소문자를 구분하지 않고 문자열을 비교할 수 있습니다. 이 연산자는 LIKE와 동일한 방식으로 패턴을 비교하지만, 대소문자를 무시합니다.

예시:

SELECT * FROM users
    WHERE username ILIKE 'john%';

위 쿼리는 username이 'john', 'John', 'JOHN' 등 어떤 형태든 'john'으로 시작하면 모두 매칭됩니다. 단, ILIKE는 PostgreSQL에서만 사용 가능하므로 다른 DBMS에서는 동작하지 않습니다.

실무 팁

  • Oracle이나 SQL Server에서는 ILIKE가 지원되지 않기 때문에, 대소문자 무시 비교를 하려면 UPPER() 또는 LOWER() 함수를 함께 사용해야 합니다.
  • 인덱스를 활용하고 싶다면 가공된 컬럼(예: LOWER(username))에 대해 별도 인덱스를 생성해야 성능 저하를 방지할 수 있습니다.

예시 (Oracle 기준):

SELECT * FROM users
    WHERE LOWER(username) = 'johndoe';

이렇게 하면 대소문자를 구분하지 않고 비교할 수 있습니다.

결론

SQL에서 문자열 비교 시 대소문자 구분 여부는 연산자와 DBMS에 따라 다릅니다. =는 항상 구분하며, LIKE는 DBMS에 따라 다르고, PostgreSQL에서는 ILIKE로 대소문자 무시 비교가 가능합니다. 실무에서는 이러한 차이를 이해하고 상황에 맞는 비교 방식을 선택해야 합니다.

#sql #문자열비교 #like #ilike #대소문자구분 #sql기초

728x90
반응형
LIST

서브쿼리 성능 최적화 – 서브쿼리에서 성능을 끌어올리는 5가지 방법

Posted by heoncode
2025. 4. 16. 09:12 오라클 실무 쿼리 튜닝
728x90
반응형
SMALL

서브쿼리는 SQL에서 매우 유용하게 쓰이는 기능이지만, 잘못 사용하면 전체 쿼리 성능을 크게 떨어뜨릴 수 있습니다. 특히 실무 환경에서는 서브쿼리가 느려지는 원인을 정확히 파악하고, 효율적으로 개선하는 것이 중요합니다. 이 글에서는 서브쿼리를 성능 저하 없이 사용하는 실전 최적화 팁 5가지를 소개합니다.

1. 불필요한 서브쿼리는 조인으로 대체

단순히 조건 확인용으로 쓰이는 서브쿼리는 조인으로 바꾸는 것이 더 나은 경우가 많습니다. 서브쿼리가 테이블을 여러 번 조회할 가능성이 있기 때문에, 조인으로 바꾸면 물리적 접근 횟수를 줄일 수 있습니다.

예시:

SELECT E.ename, D.dname
FROM emp E
JOIN dept D ON E.deptno = D.deptno
WHERE D.loc = 'DALLAS';

이와 같은 방식으로 WHERE 절 서브쿼리를 JOIN으로 바꾸면 쿼리 최적화에 유리해집니다.

2. 스칼라 서브쿼리는 주의해서 사용

SELECT 절에서 서브쿼리를 쓰는 경우, 특히 테이블 로우마다 반복 실행되기 때문에 성능 저하의 주범이 될 수 있습니다. 이런 경우도 조인으로 바꾸는 게 훨씬 효율적입니다.

비효율적인 예:

SELECT ename,
       (SELECT dname FROM dept D WHERE D.deptno = E.deptno) AS dname
FROM emp E;

대체 가능한 방식:

SELECT E.ename, D.dname
FROM emp E
JOIN dept D ON E.deptno = D.deptno;

3. EXISTS vs IN – 상황에 따라 구분

서브쿼리 안에서 IN을 사용하는 경우와 EXISTS를 사용하는 경우는 성능 차이가 발생할 수 있습니다. 일반적으로 EXISTS는 조건을 만족하는 첫 행만 찾으면 종료되므로 더 빠르게 처리됩니다.

-- EXISTS 예시
SELECT ename
FROM emp E
WHERE EXISTS (SELECT 1 FROM dept D WHERE D.deptno = E.deptno AND D.loc = 'DALLAS');

-- IN 예시
SELECT ename
FROM emp
WHERE deptno IN (SELECT deptno FROM dept WHERE loc = 'DALLAS');

두 방식 모두 테스트 후 더 빠른 쪽을 선택하는 것이 좋습니다.

4. 서브쿼리 결과를 뷰 또는 인라인 뷰로 활용

복잡한 서브쿼리를 여러 번 사용할 경우, 해당 서브쿼리를 뷰로 분리하거나 인라인 뷰로 활용하는 것이 성능을 개선하는 데 도움이 됩니다.

SELECT E.ename, V.dname
FROM emp E
JOIN (SELECT deptno, dname FROM dept WHERE loc = 'DALLAS') V
  ON E.deptno = V.deptno;

이렇게 하면 서브쿼리 결과를 캐시처럼 활용할 수 있어 반복 실행을 방지할 수 있습니다.

5. 서브쿼리 내부에도 인덱스가 필요하다

서브쿼리가 아무리 작아도, 내부에서 WHERE, JOIN, IN 등을 사용하는 경우 해당 조건 컬럼에 인덱스가 없다면 성능 병목이 생깁니다. 서브쿼리라고 해서 옵티마이저가 무시하지 않기 때문에, 내부 테이블의 통계 정보 및 인덱스 구성도 반드시 확인해야 합니다.


서브쿼리는 무조건 나쁘다는 오해가 많지만, 목적과 상황에 맞게 작성하면 충분히 강력한 도구가 됩니다. 위의 팁들을 실제 쿼리에 적용해보고, 옵티마이저 실행 계획을 분석해 보며 성능 개선 효과를 확인해보시기 바랍니다.


#서브쿼리 #SQL성능최적화 #오라클튜닝 #서브쿼리조인 #EXISTSvsIN #인라인뷰

728x90
반응형
LIST

WHERE 조건은 인덱스를 타는데 왜 느릴까? – INDEX RANGE SCAN의 함정과 대처법

Posted by heoncode
2025. 4. 15. 14:12 오라클 실무 쿼리 튜닝
728x90
반응형
SMALL

오라클에서 실행 계획을 보면 INDEX RANGE SCAN이 잡히는 경우가 있습니다. 일반적으로 이는 인덱스를 잘 활용하고 있다는 의미로 받아들여지지만, 실제로는 쿼리 성능이 기대만큼 나오지 않거나 오히려 느려지는 경우도 존재합니다.

이번 글에서는 인덱스를 타고 있음에도 성능이 저하되는 이유를 다양한 관점에서 분석하고, 이를 해결하기 위한 실무적인 팁을 함께 소개합니다.

1. INDEX RANGE SCAN이란?

INDEX RANGE SCAN은 인덱스를 통해 일부 범위만 탐색하는 방식입니다. 예를 들어 조건절이 WHERE AGE BETWEEN 20 AND 30처럼 범위 조건일 때 사용됩니다.

실행 계획에서 다음처럼 보입니다:

INDEX RANGE SCAN on IDX_EMP_AGE

인덱스가 사용되므로 성능이 좋을 것으로 기대되지만, 아래와 같은 이유로 성능이 떨어질 수 있습니다.

2. 인덱스를 타는데 느린 이유

① TABLE ACCESS BY ROWID가 병목

인덱스를 타더라도 최종 데이터를 읽기 위해 테이블 본문을 조회해야 하는 경우가 많습니다. 이는 TABLE ACCESS BY ROWID 단계에서 발생하며, 인덱스로 찾은 ROWID를 따라가 테이블을 반복해서 읽는 구조입니다.

행 수가 많다면 디스크 I/O가 상당히 증가합니다.

② 인덱스 조건은 탔지만 FILTER 조건에서 제외됨

예를 들어 다음 쿼리에서:

SELECT * FROM EMP
WHERE AGE BETWEEN 30 AND 40 AND GENDER = 'M';

AGE 컬럼에만 인덱스가 있을 경우, GENDER = 'M' 조건은 인덱스에서 필터링되지 않고, 테이블 조회 후 FILTER 단계에서 제거됩니다. 불필요한 행을 먼저 읽는 구조가 되므로 비효율적입니다.

③ 인덱스 컬럼이 NULLABLE이거나 정렬도가 낮음

조건 컬럼이 NULL 값을 많이 포함하거나, 정렬도가 낮은 컬럼일 경우 오라클 옵티마이저는 예측보다 많은 범위를 탐색하게 됩니다. 결국 인덱스를 사용하고도 실제 I/O 비용은 높은 상황이 됩니다.

④ 조건 범위가 지나치게 넓음

INDEX RANGE SCAN이라도 WHERE AGE > 0 같은 조건이라면 거의 전체 테이블을 읽는 것과 다름없는 범위를 탐색하게 됩니다. 이럴 경우에는 오히려 FTS(FULL TABLE SCAN)가 더 빠를 수 있습니다.

3. 개선 방법

✅ 필요한 컬럼만 SELECT

필요한 컬럼만 조회하면 INDEX ONLY SCAN으로 전환할 수 있습니다. 이 경우 테이블을 조회하지 않고 인덱스만으로 결과를 반환하므로 매우 빠릅니다.

예시:

SELECT AGE FROM EMP WHERE AGE BETWEEN 20 AND 30;

AGE만 필요하면 INDEX ONLY SCAN이 가능해집니다.

✅ 복합 인덱스 설계

위 예시처럼 AGEGENDER를 모두 조건으로 사용하는 경우, 두 컬럼을 포함하는 복합 인덱스를 설계하면 FILTER 단계를 제거할 수 있습니다.

CREATE INDEX IDX_EMP_AGE_GENDER ON EMP(AGE, GENDER);

✅ 인덱스 힌트와 실행 계획 확인

실행 계획을 항상 확인하여 실제 인덱스가 어떤 방식으로 사용되는지 점검해야 합니다. 때로는 옵티마이저가 인덱스를 사용하더라도 성능상 불리할 수 있으며, 이럴 경우 힌트를 통해 명시적으로 FTS로 유도하는 것도 방법입니다.


마무리하며

실행 계획에 INDEX RANGE SCAN이 떴다고 해서 반드시 빠른 쿼리라고 단정지을 수는 없습니다. 실제 쿼리 성능은 테이블 접근 방식, 조건의 범위, 필터 조건 처리 방식 등 다양한 요소가 복합적으로 작용합니다.

이전에 작성한 INDEX가 안 잡힐 때 확인할 조건SELECT COUNT(*)가 느릴 때 – 성능 개선 전략과 대안 글과 함께 참고하면, 인덱스 관련 성능 이슈를 보다 정확하게 진단하고 해결할 수 있습니다.

#오라클 #SQL튜닝 #인덱스성능 #INDEXRANGESCAN #실행계획 #실무팁 #SQL최적화

728x90
반응형
LIST

SELECT COUNT(*)가 느릴 때 – 성능 개선 전략과 대안

Posted by heoncode
2025. 4. 15. 12:00 오라클 실무 쿼리 튜닝
728x90
반응형
SMALL

오라클에서 SELECT COUNT(*)는 가장 단순한 집계 함수 중 하나입니다. 하지만 실무에서는 이 간단한 쿼리조차 예상보다 오래 걸리는 경우가 많습니다. 특히 대용량 테이블을 대상으로 할 때 COUNT가 심각하게 느려진다면, 단순히 "집계 함수니까 느리다"는 설명만으로는 부족합니다.

이번 글에서는 SELECT COUNT(*)가 느려지는 원인을 분석하고, 이를 개선할 수 있는 실질적인 전략들을 정리합니다.

1. COUNT(*)는 인덱스를 사용할까?

많은 개발자들이 SELECT COUNT(*)가 자동으로 인덱스를 사용할 것이라 생각하지만, 조건절이 없다면 테이블 전체를 스캔하게 됩니다. 오라클은 COUNT를 계산하기 위해 반드시 모든 행을 확인해야 하며, 조건이 없다면 풀 테이블 스캔(Full Table Scan)이 수행됩니다.

조건이 있는 경우, 해당 조건에 적절한 인덱스가 존재한다면 옵티마이저가 인덱스를 사용할 수도 있습니다.

예시:

SELECT COUNT(*) FROM EMP WHERE DEPTNO = 10;

위 쿼리는 DEPTNO 컬럼에 인덱스가 존재한다면 INDEX RANGE SCAN으로 수행될 수 있습니다.

2. COUNT가 느린 주요 원인

다음은 실무에서 자주 발생하는 COUNT 성능 저하 원인입니다:

  • 조건이 없어 전체 테이블을 스캔하는 경우
  • 대용량 테이블에 파티션이 없거나 적절하지 않은 경우
  • 블록 내 저장된 행 수가 불균형하거나, CHAINED ROW가 많은 경우
  • VIEW나 서브쿼리 내부의 조인 비용이 높을 경우
  • DISTINCT, GROUP BY 등이 함께 쓰이는 경우

단순 COUNT일지라도 내부적으로 의외로 복잡한 연산 경로를 탈 수 있습니다. 실행 계획(EXPLAIN PLAN) 확인이 필요합니다.

3. 성능 개선 전략

✅ 조건을 최대한 활용하라

WHERE 절이 없는 COUNT는 테이블 전체를 스캔하기 때문에 매우 느립니다. 가능한 조건을 활용해 인덱스를 탈 수 있도록 쿼리를 구성하는 것이 좋습니다.

예시:

SELECT COUNT(*) FROM LOG_TABLE WHERE CREATE_DT >= SYSDATE - 1;

조건이 있다면 해당 컬럼에 인덱스를 추가하여 효율적인 COUNT가 가능합니다.

✅ 파티션 테이블 도입

대용량 로그성 테이블에서는 파티셔닝(partitioning)이 COUNT 성능에 큰 영향을 미칩니다. 예를 들어 일자별 RANGE 파티션을 구성하면, 최근 1일치 데이터에 대한 COUNT를 빠르게 조회할 수 있습니다.

✅ COUNT 대신 메타데이터 활용

전체 행 수만 필요하다면 DBA_TABLES, ALL_TABLES, USER_TABLESNUM_ROWS 컬럼을 사용할 수 있습니다. 단, 통계 정보가 최신이어야 정확합니다.

예시:

SELECT NUM_ROWS FROM USER_TABLES WHERE TABLE_NAME = 'EMP';

이 값은 DBMS_STATS.GATHER_TABLE_STATS 수행 시 갱신됩니다.

✅ COUNT 결과 캐싱 고려

변경이 자주 없는 테이블이나 집계용 로그 테이블의 경우, COUNT 결과를 별도 컬럼이나 캐시 테이블에 저장해두고 주기적으로 갱신하는 전략도 있습니다. 특히 대시보드 등에서 반복적으로 COUNT 쿼리가 실행된다면 효과적입니다.


마무리하며

SELECT COUNT(*)는 단순하지만, 그만큼 무심코 쓰기 쉬운 쿼리입니다. 특히 대용량 테이블에서는 성능 이슈로 이어지기 쉬우므로, COUNT 쿼리를 쓸 때도 항상 실행 계획을 점검하고 조건, 인덱스, 파티션 여부 등을 함께 고려해야 합니다.

이전에 작성한 INDEX가 안 잡힐 때 확인할 조건 글과 함께 참고하면, 쿼리의 성능 문제를 보다 체계적으로 점검할 수 있습니다.

#오라클 #SQL튜닝 #카운트성능 #대용량테이블 #파티셔닝 #DBMS_STATS #실무팁

728x90
반응형
LIST

INDEX가 안 잡힐 때 확인할 조건 – 오라클 인덱스 미사용 원인 정리

Posted by heoncode
2025. 4. 15. 09:37 오라클 실무 쿼리 튜닝
728x90
반응형
SMALL

오라클에서 인덱스를 생성했음에도 불구하고 실제 실행 계획에서 인덱스가 사용되지 않는 경우는 실무에서 자주 발생하는 문제입니다. 이 글에서는 인덱스가 정상적으로 사용되지 않을 때 확인해야 할 주요 원인들을 정리하고, 각각의 사례에 대한 설명과 개선 방법을 함께 다룹니다.

1. WHERE 절의 컬럼에 함수 사용

인덱스가 설정된 컬럼에 함수가 사용되면 옵티마이저는 해당 인덱스를 사용할 수 없습니다.

예시:

SELECT * FROM EMP WHERE TO_CHAR(HIREDATE, 'YYYY') = '2020';

위 쿼리는 HIREDATE 컬럼에 함수가 적용되어 있어 인덱스를 타지 않습니다. 가능한 방법은 함수를 제거하거나, 함수 기반 인덱스(function-based index) 를 따로 생성하는 것입니다.

2. 형 변환 발생

숫자 타입 컬럼에 문자열을 비교하거나, 반대로 문자열 컬럼에 숫자를 비교하는 경우 암묵적 형 변환이 일어나 인덱스가 무시될 수 있습니다.

예시:

SELECT * FROM EMP WHERE EMPNO = '7369';  -- EMPNO가 NUMBER형일 경우

이 경우 '7369'가 암묵적으로 TO_NUMBER 처리되며 인덱스가 무시됩니다. 조건절의 리터럴 타입을 컬럼 타입과 맞추는 것이 중요합니다.

3. NOT 조건, 부정 연산자

!=, NOT IN, NOT EXISTS 등 부정 조건이 들어가는 경우 인덱스 사용률이 현저히 낮아집니다. 특히 범위 탐색이 불가능한 조건들은 옵티마이저가 풀 스캔을 선택하는 경향이 있습니다.

가능한 경우 NOT IN 대신 OUTER JOIN + IS NULL 방식 등으로 구조를 바꾸는 것이 도움이 됩니다.

4. 컬럼에 NULL 조건

WHERE COLUMN = NULL 또는 IS NOT NULL 조건도 인덱스 사용을 방해합니다. 오라클 인덱스는 NULL 값을 기본적으로 저장하지 않기 때문에, IS NULL 조건도 인덱스를 타지 않을 가능성이 높습니다.

NULL이 포함되는 조건을 자주 조회한다면 비트맵 인덱스를 고려할 수 있습니다.

5. OR 조건

WHERE A = 'X' OR B = 'Y' 처럼 OR 조건이 있는 경우 옵티마이저는 전체 조건에 대해 풀스캔을 선택할 수 있습니다. 이 경우는 쿼리를 UNION ALL로 분리하는 방식으로 인덱스 사용을 유도할 수 있습니다.

예시:

SELECT * FROM EMP WHERE A = 'X'
UNION ALL
SELECT * FROM EMP WHERE B = 'Y';

6. 통계 정보 미갱신

DBMS_STATS를 통해 테이블 및 인덱스의 통계 정보가 최신 상태로 유지되지 않으면 옵티마이저가 잘못된 판단을 할 수 있습니다.

정기적으로 통계를 갱신하는 스케줄을 운영하는 것이 중요합니다.

7. 인덱스 컬럼 순서 불일치

다중 컬럼 인덱스의 경우, WHERE 절 조건이 인덱스의 선두 컬럼부터 일치해야만 해당 인덱스가 유효하게 작동합니다.

예시: 인덱스 (COL1, COL2)일 때

SELECT * FROM TAB WHERE COL2 = 'Y'; -- 인덱스 사용 불가

COL1 조건이 빠지면 옵티마이저는 인덱스를 사용할 수 없습니다. 컬럼 순서를 기준으로 조건절을 구성해야 합니다.


위에서 다룬 원인들은 대부분 실무에서 흔하게 접할 수 있는 사례입니다. 오라클에서 인덱스가 사용되지 않을 경우, 실행 계획만 보는 것에 그치지 않고 이러한 조건들을 하나씩 점검해보는 습관이 필요합니다. 특히 인덱스를 기준으로 튜닝이 필요한 경우, 조건절을 어떻게 작성하느냐가 성능에 직접적인 영향을 주는 핵심 요소입니다.

이전에 작성한 HAVING 절과 WHERE 절의 차이 글처럼, 조건을 어떻게 거느냐는 쿼리 성능에 큰 차이를 만들 수 있습니다. 인덱스 미사용 문제가 발생했다면 위 내용을 기준으로 체크리스트처럼 점검해보는 것을 추천합니다.

#오라클 #SQL튜닝 #인덱스미사용 #오라클쿼리 #형변환 #통계정보 #함수사용주의 #실무팁

728x90
반응형
LIST

SQL 연산자 총정리 – 산술, 비교, 논리, 문자열 연산자 한눈에 보기

Posted by heoncode
2025. 4. 14. 22:19 SQL 기초 정리
728x90
반응형
SMALL

SQL 연산자 총정리 – 산술, 비교, 논리, 문자열 연산자 한눈에 보기

SQL에서 데이터를 효과적으로 다루기 위해서는 다양한 연산자의 사용법을 이해하는 것이 중요합니다. 이 글에서는 SQL에서 자주 사용되는 연산자들을 정리하고, 각 연산자의 사용 예제를 통해 실무에서 어떻게 활용되는지 알아보겠습니다.

1. 산술 연산자 (Arithmetic Operators)

산술 연산자는 숫자 데이터를 계산할 때 사용됩니다.

연산자 설명 예시
+ 덧셈 SELECT price + tax FROM products;
- 뺄셈 SELECT price - discount FROM products;
* 곱셈 SELECT quantity * price FROM sales;
/ 나눗셈 SELECT total / count FROM statistics;
% 나머지 SELECT amount % 2 FROM payments;

💡 주의: NULL 값이 포함된 산술 연산의 결과는 NULL이 됩니다. 이를 방지하려면 NVL 또는 COALESCE 함수를 사용하세요.

```sql
SELECT price + NVL(discount, 0) AS final_price
FROM products;
```

2. 비교 연산자 (Comparison Operators)

비교 연산자는 두 값을 비교하여 조건을 설정할 때 사용됩니다.

연산자 설명 예시
= 같음 WHERE age = 30
<> 또는 != 같지 않음 WHERE status <> 'active'
> 크다 WHERE score > 80
< 작다 WHERE score < 50
>= 크거나 같다 WHERE salary >= 5000
<= 작거나 같다 WHERE salary <= 3000
BETWEEN ... AND ... 범위 내 포함 WHERE age BETWEEN 20 AND 30
IN (...) 목록 내 포함 WHERE department IN ('HR', 'Sales')
LIKE 패턴 매칭 WHERE name LIKE 'J%'
IS NULL NULL 값 여부 확인 WHERE manager_id IS NULL
IS NOT NULL NULL이 아닌 값 확인 WHERE manager_id IS NOT NULL

📌 BETWEEN은 시작과 끝 값을 포함합니다. LIKE는 와일드카드 %_를 사용하여 패턴을 지정할 수 있습니다.

3. 논리 연산자 (Logical Operators)

논리 연산자는 여러 조건을 조합할 때 사용됩니다.

연산자 설명 예시
AND 모든 조건이 참일 때 WHERE age > 25 AND department = 'HR'
OR 하나 이상의 조건이 참일 때 WHERE role = 'Manager' OR role = 'Director'
NOT 조건의 부정 WHERE NOT status = 'inactive'

🔍 ANDOR를 함께 사용할 때는 괄호 ()를 사용하여 조건의 우선순위를 명확히 하세요.

```sql
SELECT *
FROM employees
WHERE (department = 'Sales' AND age > 30) OR (department = 'HR' AND age < 25);
```

4. 문자열 연산자 (String Operators)

문자열 연산자는 텍스트 데이터를 처리할 때 사용됩니다.

연산자 설명 예시
또는 CONCAT()
LIKE 패턴 매칭 WHERE email LIKE '%@example.com'

🧩 LIKE 연산자에서 %는 0개 이상의 임의의 문자, _는 정확히 하나의 임의의 문자를 의미합니다.

5. 연산자 우선순위

SQL에서는 연산자의 우선순위에 따라 연산이 수행됩니다. 기본적인 우선순위는 다음과 같습니다:

  1. 괄호 ()
  2. 산술 연산자 *, /, %
  3. 산술 연산자 +, -
  4. 비교 연산자
  5. 논리 연산자 NOT
  6. 논리 연산자 AND
  7. 논리 연산자 OR

⚠️ 복잡한 조건을 사용할 때는 괄호를 적절히 사용하여 의도한 순서대로 연산이 수행되도록 하세요.

마무리하며

SQL에서 다양한 연산자를 적절히 활용하면 데이터를 더욱 효과적으로 조회하고 조작할 수 있습니다. 각 연산자의 특성과 사용법을 숙지하여 실무에서 유용하게 활용해보세요.


#sql #연산자 #산술연산자 #비교연산자 #논리연산자 #문자열연산자 #sql기초 #sql정리 #sql공부

728x90
반응형
LIST

VS Code에서 SQL 개발환경 최적화 팁 – 오라클 쿼리까지 편하게 작성하는 방법

Posted by heoncode
2025. 4. 14. 15:53 개발 환경 & 팁 모음
728x90
반응형
SMALL

VS Code에서 SQL 개발환경 최적화 팁 – 오라클 쿼리까지 편하게 작성하는 방법

SQL 쿼리를 자주 작성하는 개발자라면, 편리한 에디터 환경을 갖추는 것이 생산성에 큰 영향을 미칩니다. 특히 오라클을 포함한 다양한 DBMS의 쿼리를 작성해야 하는 경우, Visual Studio Code(이하 VS Code)는 가볍고 강력한 도구가 되어줄 수 있습니다. 이 글에서는 VS Code를 활용한 SQL 개발환경 구성 방법과 유용한 확장 기능들을 소개합니다.

1. SQL용 확장 기능 설치

VS Code는 기본적으로 SQL 문법을 인식하지 않기 때문에, 확장 기능을 설치해주는 것이 좋습니다. 대표적인 확장 기능은 다음과 같습니다.

  • SQLTools: 다양한 DBMS와 연동할 수 있는 인기 확장 기능입니다. 오라클, MySQL, PostgreSQL 등 대부분의 시스템을 지원합니다.
  • SQL Formatter: 쿼리 정렬 및 들여쓰기를 자동화해주는 도구로, 가독성 높은 코드를 작성할 수 있습니다.
  • Oracle Developer Tools for VS Code: 오라클 전용 플러그인으로, SQL Developer와 비슷한 환경을 제공합니다.

2. SQLTools로 오라클 연동하기

SQLTools는 다양한 DB와 연결이 가능하며, 오라클도 지원합니다. 오라클 연동을 위해서는 추가 드라이버 설치가 필요합니다.

  1. SQLTools와 함께 설치되는 SQLTools Oracle Driver를 활성화합니다.

  2. .vscode/settings.json 또는 SQLTools UI에서 다음과 같이 설정합니다:

     {
       "connections": [
         {
           "name": "OracleLocal",
           "driver": "OracleDB",
           "username": "SCOTT",
           "password": "tiger",
           "tns": "localhost:1521/XEPDB1"
         }
       ]
     }
  3. 연결이 정상적으로 이루어지면, VS Code 내에서 바로 SQL 실행이 가능합니다.

3. SQL 문법 자동완성과 하이라이팅

SQL 작성 시 문법 강조가 적용되지 않으면 생산성이 떨어집니다. 위에서 소개한 확장 기능을 통해 다음과 같은 기능을 사용할 수 있습니다:

  • 구문 강조 (Syntax Highlighting)
  • 자동 들여쓰기 및 문법 자동완성
  • 명령어 기반 실행 (Ctrl + E 등 단축키 설정 가능)

4. 쿼리 실행 결과 확인

SQLTools를 통해 쿼리를 실행하면, 결과는 VS Code 내부 Output 창 또는 전용 탭에서 확인할 수 있습니다. 복잡한 SQL을 단계별로 검증하거나, 테스트 데이터를 확인하는 용도로 유용합니다.

5. 쿼리 튜닝에 활용되는 팁들

실제 쿼리를 작성하다 보면, 성능을 고려한 튜닝이 필요합니다. 쿼리 튜닝과 관련된 실무적인 팁은 아래 글을 참고해보세요.

마무리

VS Code는 단순한 코드 에디터 그 이상입니다. SQLTools와 같은 확장 기능을 활용하면 데이터베이스 전용 IDE 못지않은 환경을 구축할 수 있습니다. 오라클을 포함한 다양한 DBMS와 연동하여 효율적인 쿼리 개발을 시작해보세요.

#sql #vscode #오라클 #sql개발환경 #sqltools #oracle연동 #sql확장기능 #sql에디터 #쿼리작성팁 #sqlformatter

728x90
반응형
LIST

뷰(View)와 테이블의 차이 – 언제 뷰를 쓰고 언제 테이블을 써야 할까?

Posted by heoncode
2025. 4. 14. 13:13 SQL 기초 정리
728x90
반응형
SMALL

SQL을 처음 배우거나 실무에서 활용할 때 자주 혼동되는 개념 중 하나가 뷰(View)와 테이블(Table)의 차이입니다. 두 객체 모두 SELECT 쿼리를 통해 데이터를 가져올 수 있지만, 동작 방식과 사용 목적에는 분명한 차이가 있습니다. 이 글에서는 뷰와 테이블의 기본 개념과 차이점, 그리고 언제 각각을 사용하면 좋은지를 설명합니다.

테이블(Table)의 개념

테이블은 데이터베이스에 실제 데이터를 저장하는 기본적인 객체입니다. 모든 데이터는 테이블에 물리적으로 저장되며, SELECT, INSERT, UPDATE, DELETE와 같은 SQL 명령을 통해 데이터를 조작할 수 있습니다.

예시:

CREATE TABLE employee (
    emp_id     NUMBER PRIMARY KEY,
    emp_name   VARCHAR2(100),
    dept_id    NUMBER,
    salary     NUMBER
);

이 테이블은 직원 정보를 저장하는 실제 데이터 저장소입니다.

뷰(View)의 개념

뷰는 하나 이상의 테이블을 기반으로 한 SELECT 쿼리 결과를 저장한 논리적 객체입니다. 뷰는 물리적으로 데이터를 저장하지 않고, SELECT 쿼리가 실행될 때마다 참조된 테이블에서 데이터를 가져옵니다. 즉, 뷰는 일종의 가상 테이블입니다.

예시:

CREATE VIEW high_salary_emp AS
SELECT emp_id, emp_name, salary
FROM employee
WHERE salary > 5000;

이 뷰는 salary가 5000 이상인 직원만 필터링해 보여주는 가상 테이블입니다.

뷰와 테이블의 주요 차이점

구분 테이블
데이터 저장 실제 데이터를 저장함 데이터는 저장하지 않음
성능 직접 접근하므로 빠름 쿼리 실행 시 원본 테이블 접근
갱신 INSERT/UPDATE/DELETE 가능 제한적으로 가능
목적 데이터 저장 및 관리 특정 쿼리 결과 재사용 목적

뷰는 특정 조건을 반복해서 조회할 때 유용하며, 복잡한 조인을 단순화하거나 민감 정보를 숨기는 데도 사용됩니다.

뷰는 언제 사용하면 좋을까?

  • 자주 사용하는 SELECT 쿼리를 재사용할 필요가 있을 때
  • 복잡한 조인이나 필터 조건을 단순화하고 싶을 때
  • 특정 테이블의 일부만 사용자에게 보여주고 싶을 때
  • 보안이나 권한 관리를 위해 민감 정보를 숨길 필요가 있을 때

예를 들어 외부 사용자에게 salary 컬럼을 숨기고 싶다면 다음과 같이 뷰를 생성할 수 있습니다.

CREATE VIEW public_employee AS
SELECT emp_id, emp_name, dept_id
FROM employee;

테이블이 필요한 상황은?

  • 데이터를 물리적으로 저장해야 할 때
  • DML(INSERT, UPDATE, DELETE)을 빈번히 수행해야 할 때
  • 기본적인 데이터베이스 구조를 설계할 때

실무 팁

  • 뷰를 너무 많이 계층적으로 중첩해서 만들면 오히려 성능 저하의 원인이 될 수 있습니다.
  • 단순한 필터링 뷰라면 성능에 큰 영향을 주지 않지만, 여러 테이블의 조인을 포함한 복잡한 뷰는 실행 계획을 꼭 확인하는 것이 좋습니다.
  • 자주 갱신되는 데이터를 대상으로 하는 경우 뷰보다는 임시 테이블 또는 머티리얼라이즈드 뷰(Materialized View)를 고려하는 것이 좋습니다.

뷰는 테이블과는 다르게 데이터 저장 목적이 아닌 가공과 재사용 목적으로 사용된다는 점이 가장 큰 차이입니다. SQL을 효율적으로 사용하기 위해서는 이 차이를 정확히 이해하고, 상황에 맞는 선택을 하는 것이 중요합니다.

#SQL #테이블 #뷰 #SQL기초 #가상테이블 #데이터베이스기초

728x90
반응형
LIST

인라인 뷰 vs 테이블 조인 – 같은 결과, 다른 처리 방식

Posted by heoncode
2025. 4. 14. 09:11 오라클 실무 쿼리 튜닝
728x90
반응형
SMALL

SQL을 작성하다 보면 인라인 뷰테이블 조인 중 어떤 방식이 더 좋은지 고민하게 되는 경우가 많습니다. 겉으로는 같은 결과를 도출할 수 있어 보이지만, 실제로는 처리 방식이나 성능 측면에서 차이를 보일 수 있습니다. 이번 글에서는 인라인 뷰와 테이블 조인의 차이점과 실무에서 선택 기준을 어떻게 잡아야 하는지 살펴보겠습니다.

인라인 뷰란?

인라인 뷰는 FROM 절 안에 작성된 서브쿼리로, 마치 임시 테이블처럼 작동합니다. 복잡한 데이터를 미리 가공한 후, 이를 다시 외부 쿼리에서 조인하거나 필터링할 수 있게 해줍니다.

예시:

SELECT emp.empno, emp.ename, dept.dept_name
FROM (
    SELECT * FROM emp WHERE sal > 3000
) emp
JOIN dept ON emp.deptno = dept.deptno;

위 쿼리는 먼저 급여가 3000을 초과하는 직원만 추출한 다음, 해당 결과를 기반으로 부서 테이블과 조인합니다. emp는 인라인 뷰로 사용되고 있습니다.

테이블 조인 방식

테이블 조인은 일반적으로 여러 테이블을 직접 JOIN하여 필요한 데이터를 한 번에 조회하는 방식입니다. 조건이 단순하거나 중간 가공이 필요 없는 경우에 사용됩니다.

예시:

SELECT e.empno, e.ename, d.dept_name
FROM emp e
JOIN dept d ON e.deptno = d.deptno
WHERE e.sal > 3000;

이 방식은 별도의 가공 없이 바로 조건을 걸고, 조인을 수행합니다. 데이터 양이 많지 않거나 단순한 경우, 옵티마이저가 효율적으로 처리해줄 가능성이 높습니다.

어떤 차이가 있을까?

두 방식은 결과적으로 동일한 데이터를 반환할 수 있지만, 옵티마이저의 처리 방식에 따라 성능에 차이를 보일 수 있습니다. 다음은 주요 차이점입니다:

  • 옵티마이저 최적화 수준: 인라인 뷰는 독립적으로 처리되는 경우가 많아 옵티마이저가 전체 쿼리의 실행 계획을 유연하게 조정하지 못하는 경우가 있습니다.
  • 필터 순서 제어: 인라인 뷰 내에서는 WHERE 절이 먼저 처리되므로, 복잡한 필터링이나 가공을 먼저 수행하고 조인을 하게 됩니다.
  • 읽어야 할 데이터 양: 조건에 따라 먼저 필터링을 해서 줄일 수 있다면 인라인 뷰가 더 효율적일 수 있지만, 그렇지 않으면 오히려 중복 연산이 될 수도 있습니다.

실무에서의 선택 기준

  1. 필터링 우선 여부: 먼저 데이터를 가공해야만 하는 경우 → 인라인 뷰
  2. 단순 조건 조합일 경우: 성능을 위해 옵티마이저에 맡기고 싶은 경우 → 테이블 조인
  3. 읽어야 할 데이터 양이 많은 경우: 인라인 뷰가 오히려 느려질 수 있음 → 테이블 조인 권장
  4. 복잡한 가공이나 집계를 별도로 해야 하는 경우: 인라인 뷰 활용

결론

인라인 뷰와 테이블 조인은 단순히 문법 차이가 아닌, 옵티마이저의 쿼리 처리 방식에 영향을 줍니다. 따라서 동일한 결과를 반환한다고 해서 성능도 같을 거라는 가정은 위험합니다. 실무에서는 실제 실행 계획을 확인하면서, 상황에 맞는 방식을 선택하는 것이 중요합니다.


#SQL튜닝 #인라인뷰 #테이블조인 #SQL성능 #서브쿼리 #오라클쿼리팁 #오라클튜닝

728x90
반응형
LIST

ORDER BY의 숨겨진 비용 – 정렬은 왜 성능을 떨어뜨릴까?

Posted by heoncode
2025. 4. 13. 18:26 SQL 기초 정리
728x90
반응형
SMALL

ORDER BY 절은 SQL 쿼리에서 결과를 정렬하는 데 사용되며, 사용자에게 보기 좋은 데이터를 제공할 수 있습니다. 하지만 무심코 사용하는 ORDER BY가 성능에 큰 영향을 미칠 수 있다는 사실은 자주 간과됩니다.

1. ORDER BY는 왜 비용이 클까?

ORDER BY는 단순한 결과 필터링이 아니라, 전체 결과 집합을 대상으로 정렬 연산을 수행합니다. 이 정렬 과정은 메모리 또는 디스크 정렬을 수반하며, 다음과 같은 경우 성능 병목을 일으킬 수 있습니다.

  • 정렬 대상 컬럼에 인덱스가 없을 경우
  • 정렬 대상이 조인 결과나 서브쿼리 결과일 경우
  • 정렬 대상 레코드가 대량일 경우

특히 테이블 전체 스캔 후 정렬이 필요한 경우, 쿼리 성능 저하가 매우 두드러지게 나타납니다.

2. 실행 계획에서의 정렬 확인

Oracle에서 쿼리 실행 계획을 보면 정렬 연산은 다음과 같이 나타납니다:

SORT ORDER BY

이 단계가 포함되어 있다면, 정렬에 따른 자원 사용이 발생했음을 의미합니다. 예를 들어 다음과 같은 쿼리를 보겠습니다.

SELECT name, salary
FROM employee
ORDER BY salary DESC;

인덱스가 없다면, 전 직원 데이터를 불러온 뒤 정렬 작업이 추가로 수행됩니다. 반면, salary에 인덱스가 존재하면 Oracle은 그 인덱스를 활용해 정렬 작업 없이 데이터를 바로 가져올 수 있습니다.

3. 정렬 성능을 개선하는 팁

  • ORDER BY 대상 컬럼에 인덱스를 생성하면 성능 향상 가능성이 높습니다.
  • 불필요한 정렬을 제거할 수 있다면 제거하세요. 애플리케이션에서 정렬하는 방식도 고려해볼 수 있습니다.
  • LIMIT(FETCH FIRST n ROWS)와 함께 쓰는 경우, 인덱스를 활용하면 훨씬 효율적입니다.

예를 들어:

SELECT name
FROM employee
ORDER BY salary DESC
FETCH FIRST 10 ROWS ONLY;

이 쿼리는 상위 몇 개만 필요한 상황인데, 인덱스를 타면 훨씬 빠르게 처리됩니다.

4. 결론

ORDER BY는 눈에 보이지 않게 쿼리 성능을 잡아먹는 연산입니다. 특히 대용량 데이터 처리에서 정렬 연산은 치명적일 수 있으므로, 인덱스 구조와 실행 계획을 고려한 설계가 필요합니다.

정렬이 필요한 이유가 분명한지, 그리고 그것이 최적화된 형태로 실행되는지를 항상 점검하는 습관이 중요합니다.

#SQL기초 #ORDERBY #정렬성능 #실행계획 #쿼리최적화 #인덱스활용

728x90
반응형
LIST