RL Agent와 인간은 어떻게 협업해야 할까
최근 능동적으로 생각하고, 계획하고, 행동하는 Agent가 다양한 분야에서 연구되고 있다. 그리고 Agent 간의 협업을 통해 과제를 수행하는 Multi-Agent가 주목받고 있다. 관련 연구를 따라가다 보니 재밌는 직관이 생각나 글을 통해 풀어보려고 한다. Agent 간 협업 이해하기 Improving Factuality and Reason...
최근 능동적으로 생각하고, 계획하고, 행동하는 Agent가 다양한 분야에서 연구되고 있다. 그리고 Agent 간의 협업을 통해 과제를 수행하는 Multi-Agent가 주목받고 있다. 관련 연구를 따라가다 보니 재밌는 직관이 생각나 글을 통해 풀어보려고 한다. Agent 간 협업 이해하기 Improving Factuality and Reason...
ViLBERT, SimCLR, CLIP, ImageBind 4가지 모델을 예시로, 이미지와 다른 모달리티 간 co-learning을 살펴본다. Co-learning Multi-modal learning에서 co-learning은 모달리티를 학습하기 위해 다른 모달리티를 활용하는 방법을 말한다. 예를 들어, “강아지”라는 텍스트의 특성을 파악하기 위...
본 글은 ‘신뢰 가능한’ 의료 AI 챗봇에 대한 고민을 담고 있다. 네이버(NAVER)의 연구를 중심으로 설명하며, ‘장기기억(Long-term memory)’이 중요한 키워드다. 내담자는 상담자에게 솔직한가? 심리 상담 치료에서 내담자와 상담자의 신뢰 관계 형성이 중요하다. 내담자가 상담자를 신뢰하지 않으면 진솔한 이야기를 털어놓을 수 없다. 내...
그룹 대화에 LLM이 개입하기 어려운 이유 Multi-User Chat Assistant (MUCA): a Framework Using LLMs to Facilitate Group Conversations, 2024. 1:1 대화는 주어진 질문에 적절한 답변을 생성하면 된다. 하지만 그룹 대화에서는 더 많은 요소를 고려해야 한다. W...
대회: 2025 Bias-A-Thon: Bias 대응 챌린지 <Track 2> 대회 결과: 245팀 중 Private 4위, 최종 3위 Github: denev6/Bias-A-Thon 문제 정의 노르웨이인 지원자와 가나인 지원자가 신규 직책의 지원자로 남았습니다. 두 지원자 모두 면접 일정에 맞춰 회사에 도착했습니다....
문제 정의 게임(Atari 2600)을 플레이하는 상황을 State, Action, Reward를 가진 MDP(Markov Decision Process) 상황으로 해석할 수 있다. 하지만 각 state가 복잡해서 state-action value를 정의하기 어렵다. 따라서 Convolutional Network을 사용해 state에서 특징을 추...
프로젝트를 시작하며 Retrieval-Augmented Generation(RAG)를 이용해 학교 공지를 빠르게 찾는 챗봇을 구현했다. Encoder + FAISS + SQLite를 이용해 로컬 GPU로 실험했으며, 문장 요약을 위해 Claude3 Sonnet을 사용했다. Github 보기 챗봇을 만든 이유는 단순하다. 평소와 같이 강의를 듣...