Paper Review (8) 썸네일형 리스트형 [Paper Review] Question-Based Retrieval using Atomic Units for Enterprise RAG Question-Based Retrieval using Atomic Units for Enterprise RAG논문 주소Goal of the Paper: Enterprise Retrieval-Augmented Generation (RAG) 시스템의 성능을 개선하는 것특히, 문서의 일부를 보다 효율적으로 검색하는 방법을 연구하여, 사용자 쿼리에 대해 더 정확한 문서 조각을 반환하는 것을 목표로 함.이를 통해 잘못된 정보로 인한 오답을 줄이고, LLM(Large Language Model) 기반의 응답 생성을 향상시키고자 함Contribution:문서를 원자적 정보(atomic statements)로 분해하여, 기존보다 더 높은 검색 성능을 달성이때 atomic statements 란, chunk를 개별적인.. [Architecture] EVCap: Retrieval-Augmented Image Captioning with External Visual-Name Memory EVCap: Retrieval-Augmented Image Captioning with External Visual-Name MemoryKeywords: Lightweight Image-captioning, Multimodality, Retrieval Augmentation학회: CVPR, Filckr30k, NoCaps, WHOOPSDataset: COCO, LVIS관련 연구: smallCAP진행 일시: 2024년 7월 1일논문 주소: https://arxiv.org/pdf/2311.15879year: 2024논문 요약기존 Image captioning task의 모델은 LLM을 활용함에 따라 파라미터가 많아지면서 open world knowledge를 유지하도록 하는데에 어려움이 있었으며, Retri.. Co2PT: Mitigating Bias in Pre-trained Language Models through Counterfactual Contrastive Prompt Tuning Co2PT: Mitigating Bias in Pre-trained Language Models through Counterfactual Contrastive Prompt Tuningkeywords: Contrastive learning, Language Model, bias mitigationconference: ACL논문링크: https://aclanthology.org/2023.findings-emnlp.390.pdf코드 링크: https://github.com/dongxiangjue/Co2PT발행년도: 2023인용수: 5회적용점: prompt tuning + contrastive learning을 활용한 LM에서의 bias mitigation Abstract언어 모델이 real world appl.. [paper review] 심장소리 분류를 위한 inverted residuals 기반 경량화 모델 [paper review] 심장소리 분류를 위한 inverted residuals 기반 경량화 모델 논문 읽는 목적 아이펠 과정에서 심음데이터 S1,S2 detection을 주제로 프로젝트를 진행하게 되면서 소리 데이터와 심음 데이터를 처음으로 접하게 되었다. 소리 데이터도 생소한데 특히 심음 데이터의 경우 이해하는 데 어려움이 있어 과거 연구 논문을 읽고 리뷰하자고 생각하였다. 이 논문의 경우 심음 데이터에 대한 기존 연구를 정리해 두어서 읽어보면 좋겠다고 생각했다. 전체적인 논문 내용보다는 인사이트를 중심으로 정리하려고 한다. 기존 심음 이상 유무 분류 연구들 기존 연구들은 다음과 같은 방식들을 기반으로 수행되었다. 1. 심전도(ECG), 엔벨로프 기반 분석, 통계적 모델을 활용해 심장 소리를 분할 .. 논문 쓰는 법 논문 쓰는 법 논문 제출처 저널 - 정기적으로 출판되는 학술지 - 학술 논문 뿐만 아니라 뉴스, 사설등의 기고문도 가능 - 컨퍼런스 논문보다 분량이 많고 마감 기한이 없어 논문 심사 과정이 철저한 편 - 네이처, 사이언스 등 컨퍼런스 - 정기적으로 개최되는 학술행사 - 연구자들이 본인의 논문을 발표하고 논문 내용이 담긴 큰 포스터를 만들어 전시함 - 행사 일정이 있으므로 논문 제출 기한이 명확하고 그 이전에 심사가 왼료됨 - 논문 분량, 심사 과정에 저널에 비해 가벼운 편 - 인공지능 분야에서 컨퍼런스에 논문을 투고하는 경우가 많음 - AI Conference Deadlines 워크샵 - 메인 컨퍼런스가 진행되는 기간에 특정 주제를 두고 열리는 작은 컨퍼런스 - 진입장벽이 가장 낮고 비슷한 연구하는 사람.. 클린코드(Clean Code) & 리팩토링(Refactoring) 시큐어코딩(Secure Coding) 클린코드(Clean Code) & 리팩토링(Refactoring) 시큐어코딩(Secure Coding) 클린코드 가독성이 높은 코드 코드를 작성하는 의도와 목적이 명확하며, 코드가 잘 읽히고, 정돈된 코드 네이밍 이 잘 되어 있고 오류, 중복 코드가 없음 의존성이 최소화되어있고, 클래스, 메소드가 한가지 일만 처리 코드를 읽으면서 짐작했던 기능을 각 루틴이 그대로 수행해야 함 클린코드를 만드는 규칙 1. 네이밍(Naming) 변수, 클래스, 메소드에 의도가 분명한 이름을 사용 2. 주석(comment) 코드를 읽는 사람이 코드를 잘 이해할 수 있도록 작성 코드 내용을 빠르게 유추할 수 있는 내용에는 주석을 달지 않는다. 3. 꾸미기(aesthetics) 규칙적인 들여쓰기와 줄바꿈 불규칙한 중복 코드를 제.. [Paper Review] Donut : Document Understanding Transformer without OCR [Paper Review] Donut : Document Understanding Transformer without OCR 논문 선택 이유 영수증 사진 OCR 프로젝트를 진행하면서, pyclovaocr 라이브러리의 모델에 대해 공부하였고 관련 논문을 함께 공부하였다. [Paper Review] What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis (2019) What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis (2019) 이 논문을 공부하게 된 계기 AI 커뮤니티인 딥다이브의 object dete.. [Paper Review] What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis (2019) What Is Wrong With Scene Text Recognition Model Comparisons? Dataset and Model Analysis (2019) 이 논문을 공부하게 된 계기 AI 커뮤니티인 딥다이브의 object detection 스터디에 참여했다. 프로젝트도 하기로 했다. ocr을 이용한 영수증 ocr을 주제로 정했다. EasyOCR, CRAFT 등 여러 OCR 모델을 돌려본 결과 성능이 좋지 않았고, 짧은 프로젝트 기간을 고려하여 모델을 직접 손대는 것 대신, 네이버에서 비공식적으로 지원하는 라이브러리인 pyclovaocr을 이용해 프로젝트를 구현하기로 결정했다. 프로젝트를 99% 견인하는 완성된 라이브러리를 사용하는 대신에 해당 모델에 대한 심도깊은 공부를 하기로 했고, c.. 이전 1 다음