2025년 개발자의 연말결산
😎 서비스를 이해하고 싶어요 이번 해의 목표는 명확했답니다. “기획부터 배포까지 모든 단계를 경험하자.” 저는 이론적 연구보다는 실제 서비스를 통해 사회적 임팩트를 만들고 사용자로부터 피드백을 받는 일에 더 큰 흥미를 느껴요. 그래서 리서치-기획-디자인-개발-테스트-배포로 이어지는 전 과정을 모두 경험해 보고 싶었어요. 기획 단계를 배우기 위해...
😎 서비스를 이해하고 싶어요 이번 해의 목표는 명확했답니다. “기획부터 배포까지 모든 단계를 경험하자.” 저는 이론적 연구보다는 실제 서비스를 통해 사회적 임팩트를 만들고 사용자로부터 피드백을 받는 일에 더 큰 흥미를 느껴요. 그래서 리서치-기획-디자인-개발-테스트-배포로 이어지는 전 과정을 모두 경험해 보고 싶었어요. 기획 단계를 배우기 위해...
Github: denev6/tistory-skin Tistory: dev-roo.tistory.com 티스토리 스킨 dev-roo를 만들고 배포한 지 거의 2년이 되었어요. 지금까지 총 4번의 업데이트를 했고 4,450명 이상이 블로그를 방문했어요. 누적 조회수도 15,720회를 넘었어요. 오늘은 블로그 스킨을 왜 개발했고, 개발과 관리하...
SMC(삼성서울병원) 의료진과 챗봇 개발을 진행하며, 이번에 일부 내용을 논문으로 공개하게 되었어요. 이 글에서는 논문에서 다루지 못했던 고민을 함께 나누고자 해요. 현재 공개된 eirene-v1을 기준으로 작성했어요. 삼성서울병원과 문제를 공유해요 연구실 인턴으로 SMC와 함께 의료 챗봇 개발에 참여하게 되었어요. 의료진과의 미팅을 통해 임종을 ...
범용 지능인 LLM의 성능이 크게 발전하면서 이 능력을 물리 세계로 옮기려는 시도가 활발해지고 있어요. 본 글에서는 물리 세계를 이해하고 상호작용할 수 있는 Physical AI의 동향을 정리하고 각 논문에서 소개한 주요 아이디어를 알아보려고 해요. 논문 선정은 앵지유니버스님의 영상을 참고했어요. Generalist VLA의 등장 기존의 로봇은...
Github: Hateful-Meme Multi-modal과 Reasoning 학기 중에 수업 기말 프로젝트로 컴퓨터비전 기술을 이용한 무언가를 만들어야 했어요. 하지만 거창한 비전 모델을 학습할 GPU가 없었고, 최근 논문으로만 접했던 ‘멀티모달’과 ‘reasoning’을 모두 구현하면서 GPU 자원을 적게 사용하는 과제를 찾다가 Faceboo...
Github: Jin-A-Park/Speak2UI Demo: speak2ui_demo.mp4 이 프로젝트는 실시간으로 음성 명령을 입력받아 LLM으로 사용자 명령을 분석하고, Android A11y API를 통해 동작을 실행해요. 안드로이드 단에서 정보를 불러오고 조작하는 코드는 주로 Jin-A-Park님께서 작업했으며, 저는 주로 LLM...
Agent의 변화와 정의 ReAct: Synergizing Reasoning and Acting in Language Models, 2023. Counterfactual Multi-Agent Policy Gradients, 2024. Agent는 전통적으로 policy를 가지고 자율적으로 판단하고 행동하는 모델을 말해요. 이는 강화학습...