AI
인공지능, 머신러닝, LLM 활용 실험과 인사이트
레오파드게코 브리딩에 데이터 분석과 AI 기술을 접목합니다. Python, NumPy를 활용한 체중 관리, 성장 추이 분석, 환경 데이터 시각화 등 실무에서 직접 사용하는 기술을 일반인도 이해하기 쉽게 설명합니다.
브리딩에서 시작된 기록, 기술로 이어지는 실험.
데이터와 직관 사이의 균형을 탐구합니다.
브리딩과 기술의 융합에서 탄생한 이야기들
뉴스 제목 하나로 카테고리를 맞히는 분류기를 만들어봤습니다. TF-IDF 베이스라인부터 BERT fine-tuning까지, Tokenizer가 텍스트를 어떻게 쪼개는지, [CLS] 토큰이 왜 분류에 쓰이는지, Fine-tuning과 Feature Extraction의 차이까지 KLUE-YNAT 데이터셋으로 직접 확인해봤습니다.
4편에서 LLM이 이미지를 '인식'하는 방법을 봤습니다. 5편은 반대 방향입니다. 노이즈에서 이미지를 만들어내는 Diffusion의 원리, U-Net을 Transformer로 교체한 DiT, VAE 잠재 공간, adaLN Timestep 주입, 텍스트 Cross-Attention, 그리고 FLUX.1과 Sora까지 정리했습니다.
LLM이 텍스트 밖으로 나가는 이야기입니다. 스마트폰 카메라로 음식을 찍으면 칼로리를 알려주고, PDF 스캔 이미지에서 텍스트를 뽑아내는 게 어떻게 가능한 걸까요? 이미지 패치 토크나이징, ViT 구조, MLP Projector, 통합 시퀀스 처리까지 VLM 아키텍처 전체를 정리했습니다.
GPT가 '파리는 프랑스의 수도'라는 사실을 어디에 저장할까요? Transformer 블록의 FFN(Feed-Forward Network)이 그 역할을 담당합니다. 활성화 함수 비교, 512→2048→512 차원 변화, 지식 저장 방식까지 FFN 구조를 정리해봤습니다.
Query는 질문, Key는 색인, Value는 내용. 모델이 어디를 볼지 스스로 결정하는 Attention 메커니즘을 다뤄봤습니다. Q/K/V 행렬 연산부터 소프트맥스 어텐션 가중치, Multi-Head의 각 헤드가 보는 것까지 시각화로 정리했습니다.
RNN은 단어를 하나씩 순서대로 읽었습니다. Transformer는 전체 문장을 한 번에 봅니다. 이 구조적 차이가 GPT, BERT 같은 현대 LLM의 기반이 됐습니다. Transformer가 왜 RNN보다 빠른지, 내부 구조를 정리해봤습니다.
관찰하고 기록합니다. 브리딩에서 배운 가장 중요한 원칙입니다. 데이터는 기록에서 시작됩니다.
급하지 않게 반복합니다. 좋은 결과는 시간과 인내의 산물입니다. 기술도, 생명도.
영역을 연결합니다. 브리딩의 인사이트가 AI 설계에, 개발 경험이 사육 환경 최적화에 적용됩니다.
열린 마음으로 공유합니다. 기록은 나만의 것이 아닌, 누군가에게 도움이 될 수 있도록.