1. 위키피디아 전체를 벡터로 임베딩한 데이터셋
- JVector로 벡터 인덱스 생성 후 Chronicle Map으로 기사 데이터를 저장하여 사용함
- 벡터 압축을 위해 Locally-Adaptive Quantization 사용
- 데이터 병렬 처리
- Linux, Mac에서만 사용가능
2. Llama3-8B + vision encoder > Llava
- LLama3-8B에 vision encoder를 추가해서 멀티모달 모델로 변경하였더니 벤치마크 데이터셋 기준 Llava 모델보다 10~20% 성능향상
'AI Theory > Trends' 카테고리의 다른 글
LLM 사용 전술, Dragonfly VLM (1) | 2024.06.11 |
---|---|
Qwen2, Stable Audio Open 오픈소스 모델 공개 (0) | 2024.06.09 |
LLM 웹데이터 기반 학습 ↓ (1) | 2024.06.03 |
Phi3, LLaMa3 출시 (0) | 2024.05.01 |