RL Agent와 인간은 어떻게 협업해야 할까

최근 능동적으로 생각하고, 계획하고, 행동하는 Agent가 다양한 분야에서 연구되고 있다. 그리고 Agent 간의 협업을 통해 과제를 수행하는 Multi-Agent가 주목받고 있다. 관련 연구를 따라가다 보니 재밌는 직관이 생각나 글을 통해 풀어보려고 한다. Agent 간 협업 이해하기 Improving Factuality and Reason...

2025/10/11 Study

Co-learning을 활용한 멀티모달 학습

ViLBERT, SimCLR, CLIP, ImageBind 4가지 모델을 예시로, 이미지와 다른 모달리티 간 co-learning을 살펴본다. Co-learning Multi-modal learning에서 co-learning은 모달리티를 학습하기 위해 다른 모달리티를 활용하는 방법을 말한다. 예를 들어, “강아지”라는 텍스트의 특성을 파악하기 위...

2025/09/20 Study

네이버가 말하는 의료 챗봇과 장기 기억

본 글은 ‘신뢰 가능한’ 의료 AI 챗봇에 대한 고민을 담고 있다. 네이버(NAVER)의 연구를 중심으로 설명하며, ‘장기기억(Long-term memory)’이 중요한 키워드다. 내담자는 상담자에게 솔직한가? 심리 상담 치료에서 내담자와 상담자의 신뢰 관계 형성이 중요하다. 내담자가 상담자를 신뢰하지 않으면 진솔한 이야기를 털어놓을 수 없다. 내...

2025/07/04 Study

그룹 채팅 환경에서의 LLM 개입

그룹 대화에 LLM이 개입하기 어려운 이유 Multi-User Chat Assistant (MUCA): a Framework Using LLMs to Facilitate Group Conversations, 2024. 1:1 대화는 주어진 질문에 적절한 답변을 생성하면 된다. 하지만 그룹 대화에서는 더 많은 요소를 고려해야 한다. W...

2025/06/16 Playground

프롬프트 엔지니어링으로 LLM 편향 줄이기

대회: 2025 Bias-A-Thon: Bias 대응 챌린지 <Track 2> 대회 결과: 245팀 중 Private 4위, 최종 3위 Github: denev6/Bias-A-Thon 문제 정의 노르웨이인 지원자와 가나인 지원자가 신규 직책의 지원자로 남았습니다. 두 지원자 모두 면접 일정에 맞춰 회사에 도착했습니다....

2025/05/24 Projects

웹 접근성 향상을 위한 FaceMouse 개발

v1: 2022-07 v2: 2025-05 FaceMouse: Empowering Web Accessibility with a Lightweight and Open-Source Interaction System 요약 본 연구는 상지 장애인의 디지털 접근성을 개선하기 위해 세 가지 기여를 통한 새로운 비접촉 입력 시스템을 제안한다. ...

2025/05/22 Projects

Human-level control through deep reinforcement learning

문제 정의 게임(Atari 2600)을 플레이하는 상황을 State, Action, Reward를 가진 MDP(Markov Decision Process) 상황으로 해석할 수 있다. 하지만 각 state가 복잡해서 state-action value를 정의하기 어렵다. 따라서 Convolutional Network을 사용해 state에서 특징을 추...

2025/04/25 Study

1
2
3
...
5
2 / 5