PostgreSQL 교재 · 24편 / 24편 ★완결

확장 — pgvector·PostGIS·pg_stat_statements

PG 의 거대한 확장 생태계. 시리즈 마지막.

고급읽는 시간 8분2026-05-17

24편의 마지막. PostgreSQL 이 다른 DB 와 차이나는 한 가지 — 확장(EXTENSION) 생태계. 임베딩 검색·지리 정보·쿼리 분석·시계열까지, 한 줄 CREATE EXTENSION 으로 새 능력이 붙습니다. 본 편에서는 가장 자주 만나는 3종을 중심으로 PG 의 확장성 생태계를 회고합니다.

EXTENSION 기본

-- 설치 가능한 확장 보기
SELECT name, default_version, installed_version, comment
FROM   pg_available_extensions
ORDER BY name;

-- 설치
CREATE EXTENSION IF NOT EXISTS pg_stat_statements;
CREATE EXTENSION IF NOT EXISTS pgcrypto;
CREATE EXTENSION IF NOT EXISTS uuid-ossp;

-- 제거
DROP EXTENSION pg_stat_statements;

-- 일부는 shared_preload_libraries 에 등록 + 재시작 필요
-- postgresql.conf: shared_preload_libraries = 'pg_stat_statements'

pgvector — LLM 임베딩 검색

CREATE EXTENSION vector;

-- 임베딩 컬럼 (예: OpenAI text-embedding-3-small = 1536차원)
CREATE TABLE docs (
  id      BIGSERIAL PRIMARY KEY,
  content TEXT,
  embedding vector(1536)
);

-- 코사인 유사도 인덱스 (HNSW — PG14+ pgvector 0.5+)
CREATE INDEX ix_docs_emb ON docs USING hnsw (embedding vector_cosine_ops);

-- 입력 (앱에서 임베딩 모델 호출 후 저장)
INSERT INTO docs (content, embedding)
VALUES ('PostgreSQL 은 강력한 오픈소스 RDBMS', '[0.1, 0.2, ...]'::vector);

-- 유사 검색 — "이 질문과 가장 비슷한 문서 5개"
SELECT id, content, embedding <=> '[0.15, 0.18, ...]'::vector AS distance
FROM   docs
ORDER BY embedding <=> '[0.15, 0.18, ...]'::vector
LIMIT  5;

-- 연산자
-- <->  : L2 거리
-- <=>  : 코사인 거리
-- <#>  : 내적

pgvector 의 가치. RAG(Retrieval Augmented Generation) 의 핵심 인프라. 별도 vector DB(Pinecone·Weaviate) 안 띄우고 PG 안에서 텍스트 검색·관계형 쿼리·임베딩 검색을 한 번에. 2024~2026 가장 빠르게 확산된 확장.

pg_stat_statements — 느린 쿼리 자동 추적

# postgresql.conf
shared_preload_libraries = 'pg_stat_statements'   # 재시작 필요
pg_stat_statements.track = all

CREATE EXTENSION pg_stat_statements;

-- 가장 시간 많이 쓴 쿼리 10개
SELECT query,
       calls,
       round(total_exec_time::numeric, 0) AS total_ms,
       round(mean_exec_time::numeric, 2)  AS mean_ms,
       rows
FROM   pg_stat_statements
ORDER BY total_exec_time DESC
LIMIT 10;

-- 통계 리셋
SELECT pg_stat_statements_reset();

17편에서 잠깐 본 이 도구가 운영 환경 튜닝의 가장 강력한 도구. 어떤 쿼리가 진짜 느린지·총 시간 차지하는지가 한 화면에.

PostGIS — 지리 정보

CREATE EXTENSION postgis;

-- 좌표 컬럼
CREATE TABLE places (
  id    BIGSERIAL PRIMARY KEY,
  name  TEXT,
  geom  GEOMETRY(POINT, 4326)        -- WGS84 위경도
);

-- 공간 인덱스 (GiST)
CREATE INDEX ix_places_geom ON places USING GIST (geom);

-- 입력
INSERT INTO places (name, geom) VALUES
  ('서울시청', ST_SetSRID(ST_MakePoint(126.9780, 37.5666), 4326)),
  ('부산역', ST_SetSRID(ST_MakePoint(129.0420, 35.1149), 4326));

-- "현재 위치에서 5km 이내"
SELECT name, ST_Distance(geom::geography, ST_SetSRID(ST_MakePoint($1, $2), 4326)::geography) AS m
FROM   places
WHERE  ST_DWithin(
         geom::geography,
         ST_SetSRID(ST_MakePoint($1, $2), 4326)::geography,
         5000)
ORDER BY geom <-> ST_SetSRID(ST_MakePoint($1, $2), 4326)
LIMIT 20;

지도 검색·배달·물류·여행 서비스가 거의 PostGIS 위에 서 있음. 별도 GIS DB 안 띄우고 같은 PG 에 둠.

pgcrypto — 해시·암호화

CREATE EXTENSION pgcrypto;

-- bcrypt 비밀번호 해시
INSERT INTO users (email, pw)
VALUES ('[email protected]', crypt('mypassword', gen_salt('bf', 10)));

-- 검증
SELECT id FROM users
WHERE  email = '[email protected]'
  AND  pw = crypt('mypassword', pw);

-- UUID 생성
SELECT gen_random_uuid();   -- pgcrypto / built-in (PG 13+)

-- 대칭 암호화
SELECT pgp_sym_encrypt('비밀', 'key');
SELECT pgp_sym_decrypt(encrypted_col::bytea, 'key');

주요 확장 — 한 표

확장	용도
pg_stat_statements	쿼리 통계·느린 쿼리 추적
pgvector	임베딩·유사도 검색 (RAG)
PostGIS	지리·공간 데이터
pg_trgm	LIKE '%x%' 가속 (16편)
pgcrypto	해시·암호화·UUID
pg_partman	파티션 자동 관리 (22편)
pg_cron	DB 안의 cron 잡 스케줄
postgres_fdw	다른 PG 서버를 외부 테이블로
timescaledb	시계열 특화 (별도 라이선스)
citus	분산 PG (수평 샤딩)

📚 24편 시리즈 회고 — 무엇을 익혔나

파트	핵심
Part 1 입문(1-5)	설치·psql·DB/테이블·자료형·CRUD
Part 2 SQL기초(6-13)	WHERE·ORDER·GROUP·JOIN·서브쿼리·윈도우·jsonb·뷰
Part 3 중급(14-19)	트랜잭션·락·인덱스·EXPLAIN·함수·트리거
Part 4 고급(20-24)	백업·복제·파티셔닝·튜닝·확장(이번 편)

다음은? 실제 서비스에 적용. ① 소규모 — Postgres + pgvector + pg_stat_statements 한 대로 시작. ② 중규모 — primary/standby 복제 + 일일 백업 + PgBouncer. ③ 대규모 — RDS/Aurora 등 관리형 + 자동 failover. 그 과정에서 17·23편(EXPLAIN·튜닝) 을 가장 자주 다시 보게 될 거예요.

마지막 한 줄

"PostgreSQL 의 학습 곡선은 평평하지만 끝이 안 보인다." 24편으로 90% 의 일상 운영을 다룰 수 있고, 깊게 들어갈수록 진짜 강력함이 드러납니다. 다음 시즌은 직접 서비스에 적용하면서.

🎓 PostgreSQL 24편 시리즈 완결

설치부터 확장까지. 다시 처음으로 돌아가 1~5편을 보면, 그때 모호했던 표현들이 이제 명확할 거예요. 다음 단계는 진짜 서비스에 적용하기.

📚 PostgreSQL 배우기 — 완결
이전: 23편 성능 튜닝 · 현재: 24편 (졸업작 ★) · 진행: 24/24 ✅