웹 접근성 향상을 위한 FaceMouse 개발
v1: 2022-07 v2: 2025-05 FaceMouse: Empowering Web Accessibility with a Lightweight and Open-Source Interaction System 요약 본 연구는 상지 장애인의 디지털 접근성을 개선하기 위해 세 가지 기여를 통한 새로운 비접촉 입력 시스템을 제안해요. 첫...
v1: 2022-07 v2: 2025-05 FaceMouse: Empowering Web Accessibility with a Lightweight and Open-Source Interaction System 요약 본 연구는 상지 장애인의 디지털 접근성을 개선하기 위해 세 가지 기여를 통한 새로운 비접촉 입력 시스템을 제안해요. 첫...
프로젝트를 시작하며 Retrieval-Augmented Generation(RAG)를 활용해 학교 공지를 신속하게 찾는 챗봇을 구현했어요. 이 프로젝트는 Encoder + FAISS + SQLite를 이용해 로컬 GPU로 실험했으며, 문장 요약을 위해 Claude3 Sonnet을 사용했어요. 챗봇을 만든 이유는 간단해요. 강의를 듣기 위해 강의실에...
요약 Github: ADHD-EEG-ViT 주의력결핍 과잉행동장애(Attention deficit / hyperactivity disorder, ADHD)는 아동 및 청소년기에 흔히 발생하는 신경발달장애예요. 조기에 적절히 진단하고 개입하지 않으면 학업 성취, 사회적 관계, 정서 발달에 장기적으로 부정적 영향을 줄 수 있죠. 여러 뇌파 신호 중 E...
논문: arXiv 공식 구현: Pytorch-vision 분석 코드: Github 본문에 L000으로 적힌 링크는 줄번호로, 클릭하면 Pytorch에서 어떻게 구현되어 있는지 확인할 수 있어요. Abstract Transformer는 자연어 처리 분야에서 활발히 사용되고 있지만, 비전(vision) 문제에 적용된 경우는 제한적이에요. 우...
Auto Encoder Variational Auto-Encoding을 이해하려면 기본적인 Auto-Encoding을 먼저 알아야 해요. Auto Encoder(AE)는 데이터를 압축하고 복원하는 단순한 모델이에요. Linear layer를 통해 데이터 크기를 줄이고 복원해요. Auto Encoder의 구성은 다음과 같아요. Encode...
Histograms of Oriented Gradients for Human Detection(vision.stanford) 논문을 바탕으로 HOG descriptor의 작동 원리를 분석해요. 이 글은 논문을 완전히 번역한 것이 아니라 내용을 분석하고 정리한 글이에요. 따라서 실제 논문 목차와 다르며, 필자의 설명이 추가되었어요. 여기서 gradie...
SVD, 즉 Singular Vector Decomposition에 대해 다뤄볼게요. 각 수식이 어떤 의미를 가지고 있으며, 이미지 압축에 어떻게 사용되는지 설명해요. 이 글을 이해하려면 아래 개념을 숙지해야 해요. Vector: 크기와 방향을 가지는 양으로, 2차원 공간의 벡터는 $\vec{v}=\begin{bmatrix}u_1 & u_2\...