Agent에게 오답노트를 시켜봤더니

Fine-tuning은 가성비가 떨어진다 A Survey on In-context Learning, 2024. LLM은 최근 다양한 분야에서 활용되고 있어요. 특정 과제의 성능을 높이기 위해 지도학습과 강화학습을 결합한 fine-tuning 기법이 사용되고 있지만, 이 방법은 가성비가 떨어진다고 해요. 계산 비용이 매우 높고, LoRA처럼 ...

2025/10/19 Review

RL Agent와 인간은 어떻게 협업해야 할까

최근 능동적으로 생각하고, 계획하며 행동하는 Agent가 다양한 분야에서 연구되고 있어요. 특히, 여러 Agent가 협업하여 과제를 수행하는 Multi-Agent가 주목받고 있죠. 이와 관련된 연구를 따라가다 보니 재미있는 직관이 떠올라서 글로 풀어보려고 해요. Agent 간 협업 이해하기 Improving Factuality and Reas...

2025/10/11 Review

Co-learning을 활용한 멀티모달 학습

ViLBERT, SimCLR, CLIP, ImageBind 4가지 모델을 예시로, 이미지와 다른 모달리티 간 co-learning을 살펴봐요. Co-learning Multi-modal learning에서 co-learning은 한 모달리티를 학습하기 위해 다른 모달리티를 활용하는 방법이에요. 예를 들어, “강아지”라는 텍스트의 특성을 파악하기 위...

2025/09/20 Review

네이버가 말하는 의료 챗봇과 장기 기억

이 글에서는 ‘신뢰 가능한’ 의료 AI 챗봇에 대한 고민을 다루고 있어요. 네이버(NAVER)의 연구를 중심으로 설명하며, ‘장기기억(Long-term memory)’이라는 중요한 키워드에 대해 이야기해요. 내담자는 상담자에게 솔직한가? 심리 상담 치료에서는 내담자와 상담자의 신뢰 관계 형성이 중요해요. 내담자가 상담자를 신뢰하지 않으면 진솔한 이...

2025/07/04 Review

그룹 채팅 환경에서의 LLM 개입

그룹 대화에 LLM이 개입하기 어려운 이유 Multi-User Chat Assistant (MUCA): a Framework Using LLMs to Facilitate Group Conversations, 2024. 1:1 대화에서는 주어진 질문에 적절한 답변을 생성하면 되지만, 그룹 대화에서는 더 많은 요소를 고려해야 해요. Wh...

2025/06/16 Review

프롬프트 엔지니어링으로 LLM 편향 줄이기

대회: 2025 Bias-A-Thon: Bias 대응 챌린지 <Track 2> 대회 결과: 245팀 중 Private 4위, 최종 3위 Github: denev6/Bias-A-Thon 문제 정의 노르웨이인 지원자와 가나인 지원자가 신규 직책의 지원자로 남았습니다. 두 지원자 모두 면접 일정에 맞춰 회사에 도착했습니다. 이 ...

2025/05/24 Project

웹 접근성 향상을 위한 FaceMouse 개발기

v1.1: 2025-05 Github & 데모 영상: denev6/face-mouse-control v1.0: 2022-07 학술지: 얼굴 인식과 Pyautogui 마우스 제어 기반의 비접촉식 입력 기법 모두가 마우스를 사용할 수 있을까요? 저희 외할아버지는 사고로 양...

2025/05/22 Project