2025년 개발자의 연말결산

😎 개발하는 기획자가 되기 위해 군대를 전역하고 25년 3월에 복학했다. 이번 년도의 목표는 명확했다. “기획부터 배포까지 모든 단계를 경험하자.” 필자는 이론적인 연구보다도 실제 서비스를 통해 사회적인 임팩트를 만들고 사용자로부터 피드백 받는 일에 더 큰 흥미를 느낀다. 그렇다보니 리서치-기획-디자인-개발-테스트-배포로 이어지는 전 과정을 모두 경...

2025/12/24 Playground

Generalist Robot Policy 살펴보기

범용 지능인 LLM의 성능이 크게 발전하면서 이 능력을 물리 세계로 옮기고자 하는 시도가 활발히 이루어지고 있다. 본 글에서는 물리 세계를 이해하고 상호작용할 수 있는 Physical AI의 동향을 정리하고 각 논문에서 소개한 주요 아이디어를 알아보려 한다. 논문 선정은 앵지유니버스님의 영상을 참고했다. Generalist VLA의 등장 기존의...

2025/12/27 Study

Multimodal Training with Tiny Reasoning

Github: Hateful-Meme Multi-modal과 Reasoning 학기 중에 수업 기말 프로젝트로 컴퓨터비전 기술을 이용한 무언가를 만들어야 했다. 그런데 거창한 비전 모델을 학습할 GPU가 없었고돈도 없었고, 최근 논문으로만 읽었던 ‘멀티모달’과 ‘reasoning’을 모두 구현해 보면서 동시에 GPU도 적게 드는 과제를 찾다...

2025/12/20 Playground

모바일 제어를 위한 음성 파이프라인 최적화

Github: Jin-A-Park/Speak2UI Demo: speak2ui_demo.mp4 실시간으로 음성 명령을 입력받아 LLM으로 사용자 명령을 분석하고, Android A11y API를 통해 동작을 실행하는 프로젝트다. 안드로이드 단에서 정보를 불러오고 조작하는 코드는 주로 Jin-A-Park님께서 작업해 주셨고, 필자는 주로...

2025/11/20 Playground

멀티모달과 멀티에이전트 조합

Agent의 변화와 정의 ReAct: Synergizing Reasoning and Acting in Language Models, 2023. Counterfactual Multi-Agent Policy Gradients, 2024. Agent는 전통적인 관점에서 policy를 가지며, 자율적으로 판단하고 행동하는 모델을 말한다. 오래...

2025/11/02 Study

Less is more, Reasoning Model의 등장

LLM을 활용한 연구가 쏟아지는 동시에 LLM의 한계도 점점 명확해져 가고 있다. 그로 인해 Microsoft의 BitNet과 같이 작은 모델을 만들기 위한 시도가 계속 이어져왔다. 그러다 최근 몇 달 동안 reasoning 분야에서 새로운 아키텍쳐가 논의되고 있다. 오늘은 Hierarchical Reasoning Model이라고 불리는 아키텍쳐에 대...

2025/10/25 Study

Agent에게 오답노트를 시켜봤더니

Fine-tuning은 가성비가 떨어진다 A Survey on In-context Learning, 2024. LLM은 최근 많은 분야에서 활용되고 있다. 특정 과제에서 LLM의 성능을 높이기 위해 지도학습 + 강화학습 개념의 fine-tuning 기법이 사용되고 있다. 하지만 fine-tuning은 가성비가 떨어진다. 우선, 계산 비용...

2025/10/19 Study

1
2
3
...
5
1 / 5