ClickHouse 아키텍처 & 운영 학습 가이드

공식 문서 (architecture.md, core-concepts, best-practices) 기반 학습 자료 개념 이해 → 실무 예제 → 빠른 참조 3단 구성

폴더 구조

clickhouse-guide/
├── chapters/        ← 개념 학습 (1~11장)
├── examples/        ← 실무 도메인 예제 (E-commerce, IoT 등)
├── troubleshooting/ ← 실수 케이스 스터디 (12개 케이스)
└── cheatsheets/     ← 빠른 참조 (엔진, 타입, 버전 등)

📚 chapters — 개념 학습

1부: 아키텍처 기초

1장. ClickHouse 개요와 설계 철학
- OLAP vs OLTP, 컬럼 지향 저장, Vectorized Execution
- 시각화: 행 vs 컬럼 저장 비교, MergeTree vs LSM Tree
2장. 내부 아키텍처 컴포넌트
- Column, Block, Parser, Interpreter, Processor
- 시각화: SQL 실행 파이프라인 전 과정
3장. Context, Thread Pool, 동시성 제어
- 설정 계층, CPU Slot 기반 동시성

2부: 스토리지 엔진 — MergeTree 깊이

4장. Table Parts — 파트의 물리적 구조
5장. Table Partitions — 데이터 lifecycle 관리
- 시각화: 잘못된 파티셔닝이 파트 폭증을 일으키는 과정
6장. Table Part Merges — 백그라운드 머지
- 시각화: 머지 4단계, FINAL 키워드 성능 저하 원인
7장. Primary Index — Sparse Index, ORDER BY 키 설계
- 시각화: ORDER BY 키 순서에 따른 850배 성능 차이

3부: 분산 아키텍처

8장. Shards와 Replicas — 분산 아키텍처
- 시각화: 분산 쿼리 라우팅, 복제 동작

4부: 운영 실무

9장. INSERT 전략 선택 — 동기/비동기, 배칭
10장. 피해야 할 패턴들 — 안티패턴 모음
11장. 모니터링과 트러블슈팅 — 증상별 대응

🛠️ examples — 실무 도메인 예제

실제 서비스에서 마주치는 요구사항을 ClickHouse로 어떻게 풀어내는지.

#	도메인	핵심 개념
01	🛒 E-commerce	복합 엔진 활용, MV 대시보드
02	📊 Observability	Async Insert, Map, Bloom filter
03	🌡️ IoT 시계열	DoubleDelta/Gorilla 코덱, 다단계 집계
04	📈 Product Analytics	HyperLogLog, Funnel, Retention
05	💰 광고 이벤트	Collapsing, 샘플링, 부정 클릭 탐지

🔥 troubleshooting — 케이스 스터디

실수 상황별 증상 → 원인 → 진단 → 해결 과정을 따라가는 케이스 스터디.

A. 파티셔닝 실수

케이스	핵심 증상
A1. 일 단위 파티셔닝	Too many parts, INSERT 중단
A2. 고카디널리티 파티셔닝	파티션 수만 개, 서버 시작 수분

B. 엔진 오용

케이스	핵심 증상
B1. ReplacingMergeTree + FINAL 누락	중복 행, 집계값 2배
B2. CollapsingMergeTree sign 꼬임	잔액/수량 음수 또는 소실
B3. SummingMergeTree String 컬럼	머지 후 문자열 값 임의 변경

C. 쿼리 실수

케이스	핵심 증상
C1. SELECT * 남용	쿼리가 예상보다 10~100배 느림
C2. FINAL 남발	싱글 스레드 실행, CPU 폭증
C3. Distributed GROUP BY OOM	Memory limit exceeded
C4. DISTINCT vs uniq	DAU 쿼리 10초 이상, 메모리 GB

D. 애플리케이션 실수

케이스	핵심 증상
D1. 건당 INSERT	Too many parts, DB 응답 불가
D2. Distributed 테이블에 INSERT	쓰기 지연, 이중 네트워크 홉
D3. Mutation 남발	백그라운드 머지 중단, 디스크 2배

⚡ cheatsheets — 빠른 참조

개념을 아는 상태에서 "어떻게 하더라?" 빠르게 찾기 위한 레퍼런스.

파일	내용
merge_tree_engines.md	7가지 엔진 비교, 선택 플로우차트
type_selection.md	타입 선택 가이드, 압축 코덱
insert_strategy_flowchart.md	INSERT 전략 의사결정 트리
troubleshooting_queries.md	증상별 진단 쿼리 모음
version_history.md	버전별 주요 변경사항 (23.x ~ 25.x), LTS 선택 가이드

핵심 원칙 요약

ClickHouse를 쓸 때 지켜야 할 원칙을 한 페이지에 압축:

설계 원칙

1. OLTP가 필요하면 ClickHouse를 쓰지 말 것
   → 트랜잭션, 단일 행 UPDATE/DELETE가 잦으면 MySQL/PostgreSQL

2. ORDER BY 키는 "쿼리 WHERE 패턴"에 맞춤
   → 저카디널리티 → 고카디널리티 순서
   → 테이블 생성 후 변경 불가, 사전 설계 필수

3. 파티셔닝은 "데이터 관리용"이지 "쿼리 최적화용" 아님
   → TTL, DROP PARTITION에 사용
   → 파티션 수 1,000 이하 유지 (과도하면 파트 폭증)

4. LowCardinality(String)을 기본값으로
   → 수천 고유값 이하면 무조건 적용

5. 타입은 최소한으로
   → 습관적 Int64/Float64 금지

수집 원칙

1. 배치 INSERT (최소 1만 행) 또는 Async Insert
   → 건 단위 INSERT = "Too many parts" 즉사

2. Distributed 테이블에 INSERT 금지
   → 로컬 테이블에 직접 INSERT

3. UPDATE/DELETE 대신 INSERT-only 패턴
   → ReplacingMergeTree, CollapsingMergeTree 활용

쿼리 원칙

1. 필요한 컬럼만 SELECT
   → SELECT * 는 컬럼 지향의 장점을 죽임

2. 대시보드는 Materialized View로 사전 집계
   → 원본 스캔 금지

3. FINAL 키워드 최소화
   → argMax, sum(sign) 등으로 대체

4. DISTINCT 대신 uniq (HyperLogLog)
   → 정확도 ~1% 희생, 메모리/속도 수백 배 절감

참고 자료

공식 Architecture 문서: clickhouse.com/docs/development/architecture
Core Concepts: parts, partitions, merges, primary-indexes, shards
Best Practices: choosing-a-primary-key, avoid-mutations, avoid-optimize-final, selecting-an-insert-strategy
VLDB 2024 Paper: "ClickHouse - Lightning Fast Analytics for Everyone"
ClickHouse SQL Playground: sql.clickhouse.com

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ClickHouse 아키텍처 & 운영 학습 가이드

폴더 구조

추천 학습 경로

🟢 초심자: "ClickHouse가 뭔지 감 잡기"

🟡 실무자: "수집 파이프라인 만들기"

🟠 고급: "장애 대응과 최적화"

📚 chapters — 개념 학습

1부: 아키텍처 기초

2부: 스토리지 엔진 — MergeTree 깊이

3부: 분산 아키텍처

4부: 운영 실무

🛠️ examples — 실무 도메인 예제

🔥 troubleshooting — 케이스 스터디

A. 파티셔닝 실수

B. 엔진 오용

C. 쿼리 실수

D. 애플리케이션 실수

⚡ cheatsheets — 빠른 참조

핵심 원칙 요약

설계 원칙

수집 원칙

쿼리 원칙

참고 자료

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
chapters		chapters
cheatsheets		cheatsheets
examples		examples
troubleshooting		troubleshooting
README.md		README.md

Folders and files

Latest commit

History

Repository files navigation

ClickHouse 아키텍처 & 운영 학습 가이드

폴더 구조

추천 학습 경로

🟢 초심자: "ClickHouse가 뭔지 감 잡기"

🟡 실무자: "수집 파이프라인 만들기"

🟠 고급: "장애 대응과 최적화"

📚 chapters — 개념 학습

1부: 아키텍처 기초

2부: 스토리지 엔진 — MergeTree 깊이

3부: 분산 아키텍처

4부: 운영 실무

🛠️ examples — 실무 도메인 예제

🔥 troubleshooting — 케이스 스터디

A. 파티셔닝 실수

B. 엔진 오용

C. 쿼리 실수

D. 애플리케이션 실수

⚡ cheatsheets — 빠른 참조

핵심 원칙 요약

설계 원칙

수집 원칙

쿼리 원칙

참고 자료

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Packages