분자 그래프 표현과 GNN 이해
분자를 그래프로 보면 원자는 노드, 결합은 엣지다. GNN은 이 그래프를 따라 이웃 원자 정보를 모아 분자 성질을 예측한다.
1. 그래프 기초
- Node: 원자
- Edge: 결합
- Adjacency matrix: 연결 관계를 나타내는 행렬
2. 대표 모델
- GCN: 이웃 평균을 비교적 단순하게 모은다
- GraphSAGE: 샘플링과 aggregation 관점이 강하다
- GAT: 이웃마다 attention 가중치를 다르게 둔다
3. 분자 특성 예측
그래프 표현을 학습한 뒤 전체 그래프 pooling을 해서 toxicity, solubility, binding affinity 같은 property를 예측할 수 있다.