x_i ∈ R^d, P(x|y), softmax 등 BERT 전 필수 베이스
tags: AI, 기본기, 선형대수, 확률, softmax, conditional probability
updated: 2026-03-04 00:10:00Z
a = sigma(Wx + b) 관점에서 선형 변환과 비선형 변환의 역할 정리
tags: AI, 기본기, 퍼셉트론, 활성함수, ReLU, GELU, Sigmoid
updated: 2026-03-07 00:00:00Z
MSE와 Cross-Entropy의 차이, 로그우도 연결, 회귀/분류별 선택 기준 정리
tags: AI, 기본기, 손실함수, MSE, Cross-Entropy, softmax
updated: 2026-03-07 00:00:00Z
Cross-Entropy와 KL Divergence의 관계, one-hot에서의 단순화와 로그우도 연결
tags: AI, 기본기, 손실함수, KL, Cross-Entropy, 로그우도
updated: 2026-03-07 00:00:00Z
표준화, LayerNorm, gradient vanishing/explosion, clipping으로 학습 안정화 핵심 정리
tags: AI, 기본기, 정규화, LayerNorm, gradient clipping, 안정화
updated: 2026-03-07 00:00:00Z
Batch/Sequence/Hidden 차원 추적, broadcasting 규칙, Transformer 텐서 흐름 정리
tags: AI, 기본기, 텐서, shape, broadcasting, transformer
updated: 2026-03-07 00:00:00Z
신호 분산 안정화 관점에서 Xavier/He 초기화 원리와 선택 기준 정리
tags: AI, 기본기, 초기화, Xavier, He, Kaiming
updated: 2026-03-07 00:00:00Z
ReLU, GELU, SwiGLU의 구조/장단점과 Transformer-LLM 맥락에서의 선택 기준 정리
tags: AI, 기본기, 활성함수, ReLU, GELU, SwiGLU
updated: 2026-03-07 00:00:00Z
모델 replica 동기화, gradient all-reduce, 통신 비용까지 DDP 핵심 흐름 정리
tags: AI, foundations, distributed training, DDP, all-reduce, data parallel
updated: 2026-03-07 00:00:00Z
모델/텐서 분할, column-row parallel, 통신 병목까지 핵심 구조 정리
tags: AI, foundations, model parallel, tensor parallel, all-gather, reduce-scatter
updated: 2026-03-07 00:00:00Z
레이어 분할, micro-batch 스케줄, bubble overhead와 효율 식까지 핵심 정리
tags: AI, foundations, pipeline parallel, micro-batch, bubble overhead, distributed training
updated: 2026-03-07 00:00:00Z
state sharding 단계와 FSDP의 all-gather/reduce-scatter 흐름까지 핵심 정리
tags: AI, foundations, ZeRO, FSDP, sharding, distributed training
updated: 2026-03-07 00:00:00Z
gradient 누적, effective batch size, 평균/합 업데이트 차이까지 핵심 정리
tags: AI, foundations, gradient accumulation, effective batch, DDP
updated: 2026-03-07 00:00:00Z
subword 토큰화의 merge 규칙과 OOV 완화 원리를 입문 관점에서 정리
tags: AI, llm, tokenization, BPE, subword
updated: 2026-03-07 00:00:00Z
likelihood 기반 merge score와 BPE 대비 차이를 입문 관점에서 정리
tags: AI, llm, tokenization, WordPiece, BERT
updated: 2026-03-07 00:00:00Z
공백 포함 문자열 학습과 Unigram LM 기반 분해 전략을 입문 관점에서 정리
tags: AI, llm, tokenization, SentencePiece, Unigram LM
updated: 2026-03-07 00:00:00Z
context window, O(n^2) attention 비용, 성능 tradeoff와 실전 대응 전략 정리
tags: AI, llm, token length, context window, attention cost
updated: 2026-03-07 00:00:00Z
one-hot 한계를 넘는 분산 표현, skip-gram, negative sampling 핵심 정리
tags: AI, llm, Word2Vec, embedding, skip-gram, negative sampling
updated: 2026-03-07 00:00:00Z
Q/K/V 생성부터 scaled dot-product, O(n^2) 복잡도까지 핵심 연산 정리
tags: AI, llm, self-attention, transformer, QKV
updated: 2026-03-07 00:00:00Z
순서 정보 주입(PE)과 Transformer 병렬화 장점/주의점을 중급 관점에서 정리
tags: AI, llm, positional encoding, transformer, parallelism
updated: 2026-03-07 00:00:00Z
양방향 encoder, MLM/NSP 사전학습 목적, 입력 임베딩 구성까지 핵심 정리
tags: AI, llm, BERT, MLM, transformer encoder
updated: 2026-03-07 00:00:00Z
RoBERTa 레시피 개선과 T5 span corruption objective 차이를 중급 관점에서 정리
tags: AI, llm, RoBERTa, T5, pretraining objective
updated: 2026-03-07 00:00:00Z
fine-tuning 없이 prompt 예시로 task를 수행하는 ICL 작동 원리를 중상 난이도로 정리
tags: AI, llm, GPT-3, in-context learning, few-shot
updated: 2026-03-07 00:00:00Z
같은 compute 예산에서 모델/데이터 균형을 맞추는 compute-optimal scaling 핵심 정리
tags: AI, llm, scaling laws, Chinchilla, compute-optimal
updated: 2026-03-07 00:00:00Z
prefill/decode, latency-throughput-memory 상충 관계와 실전 최적화 포인트 정리
tags: AI, llm, inference, latency, throughput, KV cache
updated: 2026-03-07 00:00:00Z
naive 디코딩 대비 KV 재사용으로 계산량을 줄이는 핵심 원리와 메모리 tradeoff 정리
tags: AI, llm, KV cache, decoding, inference optimization
updated: 2026-03-07 00:00:00Z
draft/verify 이중 모델로 디코딩을 가속하면서 target 분포를 유지하는 핵심 구조 정리
tags: AI, llm, speculative decoding, draft model, verify
updated: 2026-03-07 00:00:00Z
attention의 memory IO 병목을 tile/online softmax로 줄여 가속하는 핵심 원리 정리
tags: AI, llm, FlashAttention, memory IO, attention optimization
updated: 2026-03-07 00:00:00Z
KV cache paging과 continuous batching으로 메모리 단편화를 줄이고 throughput을 높이는 구조 정리
tags: AI, llm, vLLM, paged attention, KV cache, batching
updated: 2026-03-07 00:00:00Z
RLHF, self-critique, DPO의 차이와 alignment 목표를 중상 난이도로 정리
tags: AI, llm, alignment, RLHF, DPO, constitutional AI
updated: 2026-03-07 00:00:00Z
prompting, sampling, RL 기반 reasoning 강화 흐름을 상 난이도로 정리
tags: AI, llm, CoT, self-consistency, DeepSeek-R1, reasoning
updated: 2026-03-07 00:00:00Z
dense 대비 sparse expert routing으로 compute를 줄이는 MoE 구조와 서빙 tradeoff 정리
tags: AI, llm, MoE, Switch Transformer, Mixtral, routing
updated: 2026-03-07 00:00:00Z
외부 지식 결합을 위한 RAG 3단계 파이프라인과 검색/재정렬 역할을 중급 관점에서 정리
tags: AI, rag_agent, RAG, retrieval, rerank, generation
updated: 2026-03-07 00:00:00Z
contrastive learning 기반 임베딩 학습과 bi-encoder/cross-encoder 차이를 중급 관점에서 정리
tags: AI, rag_agent, embeddings, SBERT, e5, BGE
updated: 2026-03-07 00:00:00Z
thought-action-observation 루프와 tool/retrieval 의사결정 구조를 중상 난이도로 정리
tags: AI, rag_agent, agent, ReAct, Toolformer, Self-RAG
updated: 2026-03-07 00:00:00Z
정량/정성 평가, 오류 분석, ablation, 유의성 검정으로 RAG 실험을 해석하는 절차 정리
tags: AI, rag_agent, experiment, baseline, ablation, evaluation
updated: 2026-03-07 00:00:00Z
데이터 검증부터 학습/평가/배포까지 ML 파이프라인의 단계와 운영 자동화 포인트를 중급 관점에서 정리
tags: AI, rag_agent, MLOps, pipeline, training, deployment
updated: 2026-03-07 00:00:00Z
실험 재현성과 비교를 위해 파라미터/메트릭/아티팩트를 추적하는 워크플로우를 중급 관점에서 정리
tags: AI, rag_agent, MLOps, experiment tracking, MLflow, W&B
updated: 2026-03-07 00:00:00Z
모델 버전 관리, lifecycle(stage), champion/challenger 비교와 rollback 전략을 중급 관점에서 정리
tags: AI, rag_agent, MLOps, model registry, champion challenger, rollback
updated: 2026-03-07 00:00:00Z
online serving과 batch inference의 차이, latency 구성, Triton/TorchServe/FastAPI 서빙 구조를 중급 관점에서 정리
tags: AI, rag_agent, MLOps, model serving, Triton, TorchServe
updated: 2026-03-07 00:00:00Z
배포 후 data drift, concept drift, prediction distribution 변화를 감지하고 대응하는 모니터링 체계를 중급 관점에서 정리
tags: AI, rag_agent, MLOps, monitoring, data drift, concept drift
updated: 2026-03-07 00:00:00Z
training-serving skew 원인과 offline/online feature store, point-in-time correctness 해결 전략을 중급 관점에서 정리
tags: AI, rag_agent, MLOps, feature store, training-serving skew, Feast
updated: 2026-03-07 00:00:00Z
LLM 운영에서 prompt 버전 관리, RAG 평가, guardrails 설계를 통합하는 LLMOps 핵심 흐름을 중상 난이도로 정리
tags: AI, rag_agent, LLMOps, prompt versioning, RAG evaluation, guardrails
updated: 2026-03-07 00:00:00Z
이미지를 patch token으로 변환해 Transformer encoder로 처리하는 ViT 구조와 CNN 대비 차이를 중급 관점에서 정리
tags: AI, vision, ViT, patch embedding, transformer, self-attention
updated: 2026-03-07 00:00:00Z
grid 기반 one-stage detection, confidence/IoU/NMS와 속도-정확도 tradeoff를 중급 관점에서 정리
tags: AI, vision, YOLO, object detection, one-stage, IoU
updated: 2026-03-07 00:00:00Z
object query와 Hungarian matching 기반 set prediction으로 detection을 end-to-end 학습하는 DETR을 중급 관점에서 정리
tags: AI, vision, DETR, set prediction, bipartite matching, transformer
updated: 2026-03-07 00:00:00Z
이미지-텍스트 dual encoder와 contrastive learning으로 zero-shot 전이를 가능하게 하는 CLIP 구조를 중급 관점에서 정리
tags: AI, vision, CLIP, contrastive learning, zero-shot, multimodal
updated: 2026-03-07 00:00:00Z
generator-discriminator의 adversarial min-max 학습 구조와 GAN 핵심 손실, 학습 불안정 이슈를 중급 관점에서 정리
tags: AI, generative, GAN, adversarial learning, min-max, discriminator
updated: 2026-03-07 00:00:00Z
Z/W latent 분리, mapping network, AdaIN 기반 레이어별 스타일 주입으로 이미지 속성을 제어하는 StyleGAN을 중급 관점에서 정리
tags: AI, generative, StyleGAN, latent space, AdaIN, style mixing
updated: 2026-03-07 00:00:00Z
forward noise와 reverse denoising으로 이미지를 생성하는 DDPM의 확률적 구조와 학습 목표를 중급 관점에서 정리
tags: AI, generative, DDPM, diffusion, denoising, U-Net
updated: 2026-03-07 00:00:00Z
score function ∇log p(x) 학습, annealed score matching, Langevin dynamics 기반 생성 과정을 중상 난이도로 정리
tags: AI, generative, score-based, diffusion, Langevin, score matching
updated: 2026-03-07 00:00:00Z
DDPM의 느린 샘플링을 DDIM의 deterministic 경로로 가속하는 원리와 차이를 중상 난이도로 정리
tags: AI, generative, DDIM, DDPM, diffusion sampling, acceleration
updated: 2026-03-07 00:00:00Z
SGD, Momentum, AdamW의 업데이트 차이와 사용 맥락, 일반화 특성 비교
tags: AI, foundations, optimizer, SGD, Momentum, AdamW
updated: 2026-03-07 00:00:00Z
Weight decay와 dropout의 원리, 적용 위치, 일반화 효과와 실전 주의점 정리
tags: AI, foundations, regularization, weight decay, dropout
updated: 2026-03-07 00:00:00Z
x_i ∈ R^d부터 Attention 수식까지, 논문 읽기 전 필수 기반
tags: AI, 기본기, 수식, 기호, 임베딩, LLM
updated: 2026-03-04 00:00:00Z
BERT 이전 정적 임베딩의 핵심과 한계
tags: AI, 논문리뷰, LLM, word2vec, embedding
updated: 2026-03-04 00:20:00Z
Transformer 아키텍처의 출발점 (심화판)
tags: AI, 논문리뷰, LLM, attention, transformer, encoder-decoder
updated: 2026-03-04 01:42:08Z
양방향 인코더 사전학습의 핵심 (심화판)
tags: AI, 논문리뷰, LLM, bert, mlm, encoder
updated: 2026-03-04 01:42:08Z
BERT 훈련 레시피 최적화 (심화판)
tags: AI, 논문리뷰, LLM, roberta, pretraining, optimization
updated: 2026-03-04 01:42:08Z
모든 NLP를 text-to-text로 통합 (심화판)
tags: AI, 논문리뷰, LLM, t5, text-to-text, transfer learning
updated: 2026-03-04 01:42:08Z
대규모 in-context learning 패러다임 (심화판)
tags: AI, 논문리뷰, LLM, gpt-3, few-shot, in-context learning
updated: 2026-03-04 01:42:08Z
모델/데이터/컴퓨트 스케일 관계 (심화판)
tags: AI, 논문리뷰, LLM, scaling laws, compute-optimal
updated: 2026-03-04 01:42:08Z
모델 크기보다 데이터 토큰 최적화 (심화판)
tags: AI, 논문리뷰, LLM, chinchilla, data scaling, compute
updated: 2026-03-04 01:42:08Z
RLHF 기반 instruction following (심화판)
tags: AI, 논문리뷰, LLM, instructgpt, rlhf, alignment
updated: 2026-03-04 01:42:08Z
AI 피드백 기반 정렬 절차 (심화판)
tags: AI, 논문리뷰, LLM, constitutional ai, harmlessness, rlaif
updated: 2026-03-04 01:42:08Z
보상모델 없이 선호학습 단순화 (심화판)
tags: AI, 논문리뷰, LLM, dpo, preference optimization
updated: 2026-03-04 01:42:08Z
MoE로 파라미터 확장 효율화 (심화판)
tags: AI, 논문리뷰, LLM, switch transformer, moe
updated: 2026-03-04 01:42:08Z
오픈 MoE 실전 아키텍처 (심화판)
tags: AI, 논문리뷰, LLM, mixtral, sparse moe
updated: 2026-03-04 01:42:08Z
검색+생성 결합 파이프라인 (심화판)
tags: AI, 논문리뷰, LLM, rag, retrieval, grounding
updated: 2026-03-04 01:42:08Z
추론과 행동(tool use) 결합 (심화판)
tags: AI, 논문리뷰, LLM, react, reasoning, acting
updated: 2026-03-04 01:42:08Z
모델이 도구 호출 타이밍 학습 (심화판)
tags: AI, 논문리뷰, LLM, toolformer, api calling
updated: 2026-03-04 01:42:08Z
생성 중 자기-검색/자기-검증 (심화판)
tags: AI, 논문리뷰, LLM, self-rag, self-reflection
updated: 2026-03-04 01:42:08Z
중간 추론 단계 명시 기법 (심화판)
tags: AI, 논문리뷰, LLM, cot, reasoning prompts
updated: 2026-03-04 01:42:08Z
다중 추론 경로 투표로 정확도 향상 (심화판)
tags: AI, 논문리뷰, LLM, self-consistency, majority vote
updated: 2026-03-04 01:42:08Z
강화학습 기반 추론 강화 최신 흐름 (심화판)
tags: AI, 논문리뷰, LLM, deepseek-r1, reasoning, rl
updated: 2026-03-04 01:42:08Z
Transformer 블록의 FFN 역할, 차원 확장-축소, 활성함수 선택 포인트 정리
tags: AI, llm, transformer, FFN, MLP block
updated: 2026-03-08 00:00:00Z
MLM/CLM/Span corruption 목적함수 차이와 모델별 트레이드오프 비교 정리
tags: AI, llm, pretraining, MLM, CLM, span corruption
updated: 2026-03-08 00:00:00Z
벡터 검색의 ANN 원리, FAISS/HNSW 인덱스 전략, 속도-정확도 tradeoff 정리
tags: AI, rag, retrieval, vector search, FAISS, HNSW
updated: 2026-03-08 00:00:00Z
정확성/근거성/유용성 중심의 LLM 평가 지표와 RAG 평가 프레임워크 정리
tags: AI, llm, evaluation, faithfulness, helpfulness, groundedness
updated: 2026-03-08 00:00:00Z
BERT 아이디어 기반 toy MLM 실험과 한계 분석
tags: AI, 실험자동화, LLM, BERT, MLM
updated: 2026-03-04 01:33:17Z
SQuAD 기반 TF-IDF vs 임베딩+FAISS 검색 실험
tags: AI, 실험자동화, LLM, RAG, FAISS
updated: 2026-03-04 01:33:17Z