AI Research Portfolio

논문 핵심 개념과 실험 결과를 AI 분야별로 정리한 포스트 모음

LLM

00. [기본기] 선형대수+확률

x_i ∈ R^d, P(x|y), softmax 등 BERT 전 필수 베이스

tags: AI, 기본기, 선형대수, 확률, softmax, conditional probability

updated: 2026-03-04 00:10:00Z

01-7. [기본기] 정규화와 학습 안정화

표준화, LayerNorm, gradient vanishing/explosion, clipping으로 학습 안정화 핵심 정리

tags: AI, 기본기, 정규화, LayerNorm, gradient clipping, 안정화

updated: 2026-03-07 00:00:00Z

01-8. [기본기] 텐서 Shape 실전

Batch/Sequence/Hidden 차원 추적, broadcasting 규칙, Transformer 텐서 흐름 정리

tags: AI, 기본기, 텐서, shape, broadcasting, transformer

updated: 2026-03-07 00:00:00Z

TS-1. [기본기] 초기화 (Xavier vs He)

신호 분산 안정화 관점에서 Xavier/He 초기화 원리와 선택 기준 정리

tags: AI, 기본기, 초기화, Xavier, He, Kaiming

updated: 2026-03-07 00:00:00Z

DT-1. [분산학습] Data Parallel (DDP)

모델 replica 동기화, gradient all-reduce, 통신 비용까지 DDP 핵심 흐름 정리

tags: AI, foundations, distributed training, DDP, all-reduce, data parallel

updated: 2026-03-07 00:00:00Z

DT-2. [분산학습] Model/Tensor Parallel

모델/텐서 분할, column-row parallel, 통신 병목까지 핵심 구조 정리

tags: AI, foundations, model parallel, tensor parallel, all-gather, reduce-scatter

updated: 2026-03-07 00:00:00Z

DT-3. [분산학습] Pipeline Parallel

레이어 분할, micro-batch 스케줄, bubble overhead와 효율 식까지 핵심 정리

tags: AI, foundations, pipeline parallel, micro-batch, bubble overhead, distributed training

updated: 2026-03-07 00:00:00Z

DT-4. [분산학습] ZeRO / FSDP

state sharding 단계와 FSDP의 all-gather/reduce-scatter 흐름까지 핵심 정리

tags: AI, foundations, ZeRO, FSDP, sharding, distributed training

updated: 2026-03-07 00:00:00Z

DT-5. [분산학습] Gradient Accumulation

gradient 누적, effective batch size, 평균/합 업데이트 차이까지 핵심 정리

tags: AI, foundations, gradient accumulation, effective batch, DDP

updated: 2026-03-07 00:00:00Z

TK-1. [토크나이징] BPE

subword 토큰화의 merge 규칙과 OOV 완화 원리를 입문 관점에서 정리

tags: AI, llm, tokenization, BPE, subword

updated: 2026-03-07 00:00:00Z

TK-2. [토크나이징] WordPiece

likelihood 기반 merge score와 BPE 대비 차이를 입문 관점에서 정리

tags: AI, llm, tokenization, WordPiece, BERT

updated: 2026-03-07 00:00:00Z

TK-3. [토크나이징] SentencePiece

공백 포함 문자열 학습과 Unigram LM 기반 분해 전략을 입문 관점에서 정리

tags: AI, llm, tokenization, SentencePiece, Unigram LM

updated: 2026-03-07 00:00:00Z

TK-4. [토크나이징] Token Length Tradeoff

context window, O(n^2) attention 비용, 성능 tradeoff와 실전 대응 전략 정리

tags: AI, llm, token length, context window, attention cost

updated: 2026-03-07 00:00:00Z

4-1. [BERT] Encoder + MLM Pretraining

양방향 encoder, MLM/NSP 사전학습 목적, 입력 임베딩 구성까지 핵심 정리

tags: AI, llm, BERT, MLM, transformer encoder

updated: 2026-03-07 00:00:00Z

4-2. [사전학습] RoBERTa / T5 Objective

RoBERTa 레시피 개선과 T5 span corruption objective 차이를 중급 관점에서 정리

tags: AI, llm, RoBERTa, T5, pretraining objective

updated: 2026-03-07 00:00:00Z

4-3. [GPT-3] In-Context Learning 메커니즘

fine-tuning 없이 prompt 예시로 task를 수행하는 ICL 작동 원리를 중상 난이도로 정리

tags: AI, llm, GPT-3, in-context learning, few-shot

updated: 2026-03-07 00:00:00Z

4-4. [스케일링] Scaling Laws / Chinchilla

같은 compute 예산에서 모델/데이터 균형을 맞추는 compute-optimal scaling 핵심 정리

tags: AI, llm, scaling laws, Chinchilla, compute-optimal

updated: 2026-03-07 00:00:00Z

IO-1. [서빙] LLM Inference Tradeoff

prefill/decode, latency-throughput-memory 상충 관계와 실전 최적화 포인트 정리

tags: AI, llm, inference, latency, throughput, KV cache

updated: 2026-03-07 00:00:00Z

IO-2. [서빙] KV Cache 디코딩 최적화

naive 디코딩 대비 KV 재사용으로 계산량을 줄이는 핵심 원리와 메모리 tradeoff 정리

tags: AI, llm, KV cache, decoding, inference optimization

updated: 2026-03-07 00:00:00Z

IO-3. [서빙] Speculative Decoding

draft/verify 이중 모델로 디코딩을 가속하면서 target 분포를 유지하는 핵심 구조 정리

tags: AI, llm, speculative decoding, draft model, verify

updated: 2026-03-07 00:00:00Z

IO-4. [서빙] FlashAttention

attention의 memory IO 병목을 tile/online softmax로 줄여 가속하는 핵심 원리 정리

tags: AI, llm, FlashAttention, memory IO, attention optimization

updated: 2026-03-07 00:00:00Z

IO-5. [서빙] vLLM Paged Attention

KV cache paging과 continuous batching으로 메모리 단편화를 줄이고 throughput을 높이는 구조 정리

tags: AI, llm, vLLM, paged attention, KV cache, batching

updated: 2026-03-07 00:00:00Z

5-3. [효율화] MoE: Switch / Mixtral

dense 대비 sparse expert routing으로 compute를 줄이는 MoE 구조와 서빙 tradeoff 정리

tags: AI, llm, MoE, Switch Transformer, Mixtral, routing

updated: 2026-03-07 00:00:00Z

6-1. [RAG] Retrieval → Rerank → Generation

외부 지식 결합을 위한 RAG 3단계 파이프라인과 검색/재정렬 역할을 중급 관점에서 정리

tags: AI, rag_agent, RAG, retrieval, rerank, generation

updated: 2026-03-07 00:00:00Z

6-2. [RAG] Embedding Models (SBERT/e5/BGE)

contrastive learning 기반 임베딩 학습과 bi-encoder/cross-encoder 차이를 중급 관점에서 정리

tags: AI, rag_agent, embeddings, SBERT, e5, BGE

updated: 2026-03-07 00:00:00Z

6-3. [Agent] ReAct / Toolformer / Self-RAG

thought-action-observation 루프와 tool/retrieval 의사결정 구조를 중상 난이도로 정리

tags: AI, rag_agent, agent, ReAct, Toolformer, Self-RAG

updated: 2026-03-07 00:00:00Z

6-4. [실험] Baseline 대비 결과 해석

정량/정성 평가, 오류 분석, ablation, 유의성 검정으로 RAG 실험을 해석하는 절차 정리

tags: AI, rag_agent, experiment, baseline, ablation, evaluation

updated: 2026-03-07 00:00:00Z

6.5-3. [MLOps] Model Registry (Champion/Challenger)

모델 버전 관리, lifecycle(stage), champion/challenger 비교와 rollback 전략을 중급 관점에서 정리

tags: AI, rag_agent, MLOps, model registry, champion challenger, rollback

updated: 2026-03-07 00:00:00Z

6.5-4. [MLOps] Model Serving (Online vs Batch)

online serving과 batch inference의 차이, latency 구성, Triton/TorchServe/FastAPI 서빙 구조를 중급 관점에서 정리

tags: AI, rag_agent, MLOps, model serving, Triton, TorchServe

updated: 2026-03-07 00:00:00Z

6.5-5. [MLOps] Monitoring (Data/Concept Drift)

배포 후 data drift, concept drift, prediction distribution 변화를 감지하고 대응하는 모니터링 체계를 중급 관점에서 정리

tags: AI, rag_agent, MLOps, monitoring, data drift, concept drift

updated: 2026-03-07 00:00:00Z

6.5-6. [MLOps] Feature Store (Training-Serving Skew)

training-serving skew 원인과 offline/online feature store, point-in-time correctness 해결 전략을 중급 관점에서 정리

tags: AI, rag_agent, MLOps, feature store, training-serving skew, Feast

updated: 2026-03-07 00:00:00Z

6.5-7. [LLMOps] Prompt Versioning / RAG Eval / Guardrails

LLM 운영에서 prompt 버전 관리, RAG 평가, guardrails 설계를 통합하는 LLMOps 핵심 흐름을 중상 난이도로 정리

tags: AI, rag_agent, LLMOps, prompt versioning, RAG evaluation, guardrails

updated: 2026-03-07 00:00:00Z

7-1. [Vision] ViT (Patch Embedding)

이미지를 patch token으로 변환해 Transformer encoder로 처리하는 ViT 구조와 CNN 대비 차이를 중급 관점에서 정리

tags: AI, vision, ViT, patch embedding, transformer, self-attention

updated: 2026-03-07 00:00:00Z

7-2. [Vision] YOLO (One-Stage Tradeoff)

grid 기반 one-stage detection, confidence/IoU/NMS와 속도-정확도 tradeoff를 중급 관점에서 정리

tags: AI, vision, YOLO, object detection, one-stage, IoU

updated: 2026-03-07 00:00:00Z

7-3. [Vision] DETR (Set Prediction)

object query와 Hungarian matching 기반 set prediction으로 detection을 end-to-end 학습하는 DETR을 중급 관점에서 정리

tags: AI, vision, DETR, set prediction, bipartite matching, transformer

updated: 2026-03-07 00:00:00Z

7-4. [Vision] CLIP (Contrastive Zero-Shot)

이미지-텍스트 dual encoder와 contrastive learning으로 zero-shot 전이를 가능하게 하는 CLIP 구조를 중급 관점에서 정리

tags: AI, vision, CLIP, contrastive learning, zero-shot, multimodal

updated: 2026-03-07 00:00:00Z

8-1. [Generative] GAN (Min-Max Learning)

generator-discriminator의 adversarial min-max 학습 구조와 GAN 핵심 손실, 학습 불안정 이슈를 중급 관점에서 정리

tags: AI, generative, GAN, adversarial learning, min-max, discriminator

updated: 2026-03-07 00:00:00Z

8-2. [Generative] StyleGAN (Style Control)

Z/W latent 분리, mapping network, AdaIN 기반 레이어별 스타일 주입으로 이미지 속성을 제어하는 StyleGAN을 중급 관점에서 정리

tags: AI, generative, StyleGAN, latent space, AdaIN, style mixing

updated: 2026-03-07 00:00:00Z

8-3. [Generative] DDPM (Diffusion Denoising)

forward noise와 reverse denoising으로 이미지를 생성하는 DDPM의 확률적 구조와 학습 목표를 중급 관점에서 정리

tags: AI, generative, DDPM, diffusion, denoising, U-Net

updated: 2026-03-07 00:00:00Z

8-4. [Generative] Score-Based Models

score function ∇log p(x) 학습, annealed score matching, Langevin dynamics 기반 생성 과정을 중상 난이도로 정리

tags: AI, generative, score-based, diffusion, Langevin, score matching

updated: 2026-03-07 00:00:00Z

8-5. [Generative] Diffusion Sampling (DDIM)

DDPM의 느린 샘플링을 DDIM의 deterministic 경로로 가속하는 원리와 차이를 중상 난이도로 정리

tags: AI, generative, DDIM, DDPM, diffusion sampling, acceleration

updated: 2026-03-07 00:00:00Z

00-2. [Word2Vec] 개념 설명

BERT 이전 정적 임베딩의 핵심과 한계

tags: AI, 논문리뷰, LLM, word2vec, embedding

updated: 2026-03-04 00:20:00Z

01. [BERT] 개념 설명

양방향 인코더 사전학습의 핵심 (심화판)

tags: AI, 논문리뷰, LLM, bert, mlm, encoder

updated: 2026-03-04 01:42:08Z

02. [RoBERTa] 개념 설명

BERT 훈련 레시피 최적화 (심화판)

tags: AI, 논문리뷰, LLM, roberta, pretraining, optimization

updated: 2026-03-04 01:42:08Z

03. [T5] 개념 설명

모든 NLP를 text-to-text로 통합 (심화판)

tags: AI, 논문리뷰, LLM, t5, text-to-text, transfer learning

updated: 2026-03-04 01:42:08Z

04. [GPT-3] 개념 설명

대규모 in-context learning 패러다임 (심화판)

tags: AI, 논문리뷰, LLM, gpt-3, few-shot, in-context learning

updated: 2026-03-04 01:42:08Z

05. [Scaling Laws] 개념 설명

모델/데이터/컴퓨트 스케일 관계 (심화판)

tags: AI, 논문리뷰, LLM, scaling laws, compute-optimal

updated: 2026-03-04 01:42:08Z

06. [Chinchilla] 개념 설명

모델 크기보다 데이터 토큰 최적화 (심화판)

tags: AI, 논문리뷰, LLM, chinchilla, data scaling, compute

updated: 2026-03-04 01:42:08Z

07. [InstructGPT] 개념 설명

RLHF 기반 instruction following (심화판)

tags: AI, 논문리뷰, LLM, instructgpt, rlhf, alignment

updated: 2026-03-04 01:42:08Z

09. [DPO] 개념 설명

보상모델 없이 선호학습 단순화 (심화판)

tags: AI, 논문리뷰, LLM, dpo, preference optimization

updated: 2026-03-04 01:42:08Z

11. [Mixtral] 개념 설명

오픈 MoE 실전 아키텍처 (심화판)

tags: AI, 논문리뷰, LLM, mixtral, sparse moe

updated: 2026-03-04 01:42:08Z

12. [RAG] 개념 설명

검색+생성 결합 파이프라인 (심화판)

tags: AI, 논문리뷰, LLM, rag, retrieval, grounding

updated: 2026-03-04 01:42:08Z

13. [ReAct] 개념 설명

추론과 행동(tool use) 결합 (심화판)

tags: AI, 논문리뷰, LLM, react, reasoning, acting

updated: 2026-03-04 01:42:08Z

14. [Toolformer] 개념 설명

모델이 도구 호출 타이밍 학습 (심화판)

tags: AI, 논문리뷰, LLM, toolformer, api calling

updated: 2026-03-04 01:42:08Z

15. [Self-RAG] 개념 설명

생성 중 자기-검색/자기-검증 (심화판)

tags: AI, 논문리뷰, LLM, self-rag, self-reflection

updated: 2026-03-04 01:42:08Z

17. [Self-Consistency] 개념 설명

다중 추론 경로 투표로 정확도 향상 (심화판)

tags: AI, 논문리뷰, LLM, self-consistency, majority vote

updated: 2026-03-04 01:42:08Z

18. [DeepSeek-R1] 개념 설명

강화학습 기반 추론 강화 최신 흐름 (심화판)

tags: AI, 논문리뷰, LLM, deepseek-r1, reasoning, rl

updated: 2026-03-04 01:42:08Z

TR-1. [Transformer] FFN 구조

Transformer 블록의 FFN 역할, 차원 확장-축소, 활성함수 선택 포인트 정리

tags: AI, llm, transformer, FFN, MLP block

updated: 2026-03-08 00:00:00Z

TR-2. [Transformer] Pretraining Objective

MLM/CLM/Span corruption 목적함수 차이와 모델별 트레이드오프 비교 정리

tags: AI, llm, pretraining, MLM, CLM, span corruption

updated: 2026-03-08 00:00:00Z

RAG-1. [Retrieval] Vector Search

벡터 검색의 ANN 원리, FAISS/HNSW 인덱스 전략, 속도-정확도 tradeoff 정리

tags: AI, rag, retrieval, vector search, FAISS, HNSW

updated: 2026-03-08 00:00:00Z

EVAL-1. [평가] LLM Evaluation Metrics

정확성/근거성/유용성 중심의 LLM 평가 지표와 RAG 평가 프레임워크 정리

tags: AI, llm, evaluation, faithfulness, helpfulness, groundedness

updated: 2026-03-08 00:00:00Z

Vision

19. [YOLO] 개념 설명

실시간 객체탐지의 대표 모델 흐름 정리

tags: AI, 논문리뷰, Vision, Detection, YOLO

updated: 2026-03-04 04:22:21Z

20. [DETR] 개념 설명

Transformer 기반 객체탐지 재정의

tags: AI, 논문리뷰, Vision, Detection, DETR

updated: 2026-03-04 04:22:21Z

21. [CLIP] 개념 설명

이미지-텍스트 대조학습의 핵심 아이디어

tags: AI, 논문리뷰, Vision, Multimodal, CLIP

updated: 2026-03-04 04:22:21Z

General

25. [NTK] Neural Tangent Kernel 개념 설명

큰 신경망 학습을 kernel 관점에서 해석하는 NTK 핵심 정리

tags: AI, 논문리뷰, Foundations, NTK, Overparameterization, Double Descent

updated: 2026-03-04 12:00:00Z

00-2. [기본기] 확률/통계 기초

조건부확률, 기댓값, 분산, 로그우도, Cross-Entropy를 딥러닝 관점으로 연결

tags: AI, 기본기, 확률통계, 조건부확률, Cross-Entropy

updated: 2026-03-07 00:00:00Z

00-5. [기본기] 수치 안정성 기초

overflow/underflow, 안정한 softmax, log-sum-exp를 실전 계산 관점으로 정리

tags: AI, 기본기, 수치안정성, softmax, log-sum-exp

updated: 2026-03-07 00:00:00Z

M-1. [수학] Entropy

정보량과 엔트로피, Cross-Entropy/KL 연결을 딥러닝 관점으로 정리

tags: AI, foundations, math, entropy, information theory

updated: 2026-03-08 00:00:00Z

M-2. [수학] Expectation / Variance

기댓값/분산의 정의와 학습 안정성, 추정 오차 해석까지 핵심 정리

tags: AI, foundations, math, expectation, variance, statistics

updated: 2026-03-08 00:00:00Z

DL-1. [기초] CNN Basics

합성곱/풀링/채널 개념과 CNN의 표현 학습 원리를 입문-중급 관점으로 정리

tags: AI, foundations, CNN, convolution, pooling

updated: 2026-03-08 00:00:00Z

DL-2. [기초] BatchNorm

BatchNorm 동작식, 학습/추론 모드 차이와 안정화 효과를 핵심만 정리

tags: AI, foundations, batchnorm, normalization, optimization

updated: 2026-03-08 00:00:00Z

OPT-1. [최적화] Hessian / Curvature

곡률(Hessian) 관점에서 수렴 속도, 학습률 안정성, sharp/flat minima를 정리

tags: AI, foundations, optimization, Hessian, curvature

updated: 2026-03-08 00:00:00Z

Generative

22. [GAN] 개념 설명

생성자-판별자 경쟁학습의 기본 프레임

tags: AI, 논문리뷰, Generative, GAN

updated: 2026-03-04 04:22:21Z

23. [StyleGAN] 개념 설명

고품질 이미지 생성과 스타일 제어

tags: AI, 논문리뷰, Generative, GAN, StyleGAN

updated: 2026-03-04 04:22:21Z

24. [DDPM] 개념 설명

확산모델의 기본 생성 메커니즘

tags: AI, 논문리뷰, Generative, Diffusion, DDPM

updated: 2026-03-04 04:22:21Z

REP-1. [표현학습] Autoencoder

인코더-디코더 기반 압축 표현 학습과 reconstruction objective 핵심 정리

tags: AI, generative, representation learning, autoencoder, latent

updated: 2026-03-08 00:00:00Z

REP-2. [표현학습] VAE

ELBO 분해, KL 정규화, reparameterization trick까지 VAE 핵심 원리 정리

tags: AI, generative, VAE, ELBO, reparameterization

updated: 2026-03-08 00:00:00Z

Drug Discovery AI Track

9단계. 바이오 기초

분자/단백질/ADMET 기초를 통해 약물 타깃과 생체 상호작용의 기본을 이해

tags: AI, DrugDiscovery, Biology, ADMET, Protein

updated: 2026-03-08 00:00:00Z

10단계. 분자 표현과 GNN

SMILES/Graph/3D 표현과 GCN/GAT 기반 분자 property prediction 핵심 정리

tags: AI, DrugDiscovery, Molecular Representation, GNN

updated: 2026-03-08 00:00:00Z

11단계. 단백질 모델링

AlphaFold2/ESM 계열로 단백질 구조/시퀀스 기반 예측 흐름을 이해

tags: AI, DrugDiscovery, Protein Modeling, AlphaFold, ESM

updated: 2026-03-08 00:00:00Z

12단계. 단백질-리간드 상호작용

Docking/Virtual Screening으로 binding score 기반 후보 탐색 구조를 정리

tags: AI, DrugDiscovery, Docking, Virtual Screening

updated: 2026-03-08 00:00:00Z

13단계. 분자 생성 모델

VAE/Diffusion/Flow 기반 de novo 분자 생성 전략과 차이를 비교

tags: AI, DrugDiscovery, Molecular Generation, Diffusion, VAE

updated: 2026-03-08 00:00:00Z

14~15단계. 파이프라인/실험환경

target→hit→lead→임상 흐름과 ChEMBL/PDB/RDKit 기반 실험 환경을 연결

tags: AI, DrugDiscovery, Pipeline, ChEMBL, RDKit

updated: 2026-03-08 00:00:00Z