바로 써먹는 LLM-as-a-judge 가이드
LLM-as-a-judge를 주제로 주요 개념과 방법론을 정리해요. 2023–26년 ACL, EMNLP, ICLR 등에 게재된 주요 논문을 근거로 해요. LLM 평가가 왜 필요할까 시스템을 평가할 때는 다양한 평가 지표를 활용해요. 대부분의 경우 데이터에 기록된 정답을 바탕으로 명확한 평가가 가능해요. 하지만 개방형 질문에 대한 LLM 답변은 하나...
LLM-as-a-judge를 주제로 주요 개념과 방법론을 정리해요. 2023–26년 ACL, EMNLP, ICLR 등에 게재된 주요 논문을 근거로 해요. LLM 평가가 왜 필요할까 시스템을 평가할 때는 다양한 평가 지표를 활용해요. 대부분의 경우 데이터에 기록된 정답을 바탕으로 명확한 평가가 가능해요. 하지만 개방형 질문에 대한 LLM 답변은 하나...
3D 공간에서 물체를 회전시키는 방법을 다뤄요. 오일러 각(Euler Angle)의 개념부터 시작해 짐벌락(Gimbal Lock) 문제를 살펴보고, 이를 해결하는 쿼터니언(Quaternion)과 로드리게스 공식(Rodrigues formula)까지 정리해요. 3D 회전은 2D 회전과 뭐가 다를까 2D 회전부터 생각해 봐요. 종이 위에 점 하나를 찍...
이 글에서는 DINO v1의 self-distillation 프레임워크를 중심으로 핵심 기법과 수식을 살펴보고, v2와 v3에서 무엇이 바뀌었는지 정리해요. DINO v1: Self-distillation Emerging Properties in Self-Supervised Vision Transformers, ICCV 2021. ...
* 첨부한 이미지를 클릭하면 선명하게 볼 수 있어요. 우리의 타겟은 유저가 아닌 링글 ‘제5회 링글 서비스 기획 공모전‘에 참가했어요. 공모전을 준비하며 어떤 과정으로 기획물을 만들었는지 이야기해 보려 해요. 저희 기획의 타겟 오디언스는 유저가 아닌 링글이에요. 아무리 매력적인 아이디어라도 기업에서 실행할 수 없다면 의미가 없어요. 저희는 이 점...
해요(Haeyo) - 26.04.01까지 운영: haeyo.vercel.app 해요체로 블로그 갈아엎기 블로그에 작성된 모든 글을 ‘해요’체로 수정하기 위해 작업을 시작했어요. 2022년부터 지식 공유를 목적으로 티스토리를 운영했는데, 솔직한 경험과 생각을 중심으로 공유하고 싶어서 현재 보시는 jekyll 블로그로 분리했어요. Jekyll은 ...
Github: denev6/stream-yolo Frontend: Flutter Backend: FastAPI, net/http, OpenCV, ONNX DevOps: Docker, Prometheus, Grafana, AWS EC2, Nginx, Github Actions Tools: Claude Code, Gemini Pro, ...
Github: denev6/tistory-skin Tistory: dev-roo.tistory.com 티스토리 스킨 dev-roo를 만들고 배포한 지 거의 2년이 되었어요. 지금까지 총 4번의 업데이트를 했고 4,450명 이상이 블로그를 방문했어요. 누적 조회수도 15,720회를 넘었어요. 오늘은 블로그 스킨을 왜 개발했고, 개발과 관리하...