본문 바로가기

AI78

[논문 리뷰] Agentic Retrieval-Augmented Generation: A Survey on Agentic RAG 랩 세미나를 준비하다가 RAG 관련 서베이 논문을 읽게 됐다. 단순히 RAG의 최신 트렌드를 정리한 수준이 아니라, Agentic RAG 시스템 전체에 대한 분류 체계(Taxonomy) 를 새로 제안한 논문이라 꽤 인상적이었다.1. 왜 Agentic RAG인가?문제의식 : 3단계 논리① LLM의 근본적 한계GPT, LLaMA 같은 LLM은 정적인 사전 학습 데이터에만 의존하기 때문에:오래된 정보를 사실처럼 답함없는 내용을 지어냄 (Hallucination)현실이 바뀌어도 적응하지 못함② RAG가 해결사로 나왔지만 그것도 한계RAG는 추론 시점에 외부 데이터를 실시간으로 끌어와 LLM에 붙이는 방식이다. 그런데 전통적인 RAG 파이프라인은 정적이고 선형이라서:복잡한 멀티스텝 추론 불가깊은 맥락적 이해 부족.. 2026. 4. 24.
[논문 리뷰] Large Language Models Are Natural Video Popularity Predictors [논문 리뷰] LLM은 자연스러운 비디오 인기 예측기다 — VLM+LLM 기반 멀티모달 접근법1. 문제 정의 — 기존 연구의 한계비디오 인기 예측은 콘텐츠 제작자, 소셜 미디어 플랫폼, 광고주들에게 매우 중요한 과제다. 그러나 기존 연구는 두 가지 근본적인 문제를 안고 있었다. 첫째, post-hoc user engagement data에 대한 과의존이다. 업로더 평판, 조회수·댓글·좋아요 수, 외부 소셜 네트워크 규모 같은 사후적 집계 지표는 초기 사용자 반응을 반영할 뿐, 비디오 콘텐츠 자체의 품질을 포착하지 못한다.둘째, 멀티모달 데이터 처리 능력의 부재다. 텍스트, 음성, 시각적 콘텐츠가 복합적으로 얽혀 있는 비디오 데이터를 기존의 전통적 방법들은 통합적으로 처리하기 어렵다.셋째, 인기도의 1차원.. 2026. 4. 13.
[세미나 발표] Edge Computing Ch.9 Technology, Management and Integration [Edge Computing] Ch.9 엣지 컴퓨팅을 위한 연합학습 하이퍼파라미터 튜닝 — FedTuneEdge Computing: Technology, Management and Integration Chapter 9 발표 내용을 정리한 글이다. 이번 챕터는 Federated Learning(FL, 연합학습)을 엣지 환경에서 운용할 때 직면하는 이질성 문제와, 이를 하이퍼파라미터 자동 튜닝으로 해결하는 FedTune 기법을 다룬다.1. Federated Learning이란?연합학습(FL)은 원시 데이터를 중앙 서버로 보내지 않고, 각 기기(Edge Device)에서 로컬로 모델을 학습한 뒤 그 파라미터(가중치)만 서버로 전송하여 글로벌 모델을 만드는 분산 학습 방식이다.[Edge Device 1] → .. 2026. 3. 24.
[세미나 발표] Edge Computing Ch.8 Technology, Management and Integration [Edge Computing] Ch.8 5G 핵심 기술 — 교통·의료·환경을 혁신하다Edge Computing: Technology, Management and Integration Chapter 8 발표 내용을 정리한 글이다. 이번 챕터는 5G 기술의 개요와 핵심 기술, 그리고 VR/AR·자율주행·의료·엣지 컴퓨팅 등 다양한 산업에서의 활용을 다룬다.1. 5G란 무엇인가?5G는 디지털 셀룰러 네트워크를 위한 5세대 무선 통신 기술이다.5G 아키텍처 3요소구성 요소역할RAN (Radio Access Network, 무선 접속망)단말과 코어 네트워크를 무선으로 연결UE (User Equipment, 유저 단말)스마트폰, IoT 기기 등 최종 사용자 장치CN (Core Network, 코어 네트워크)인증, .. 2026. 3. 22.
[세미나 발표] Edge Computing Ch.6 Technology, Management and Integration [Edge Computing] Ch.6 UAV 최적 제어와 부하 분산 — 강화학습으로 무선 통신을 최적화하다Edge Computing: Technology, Management and Integration Chapter 6 발표 내용을 정리한 글이다. 이번 챕터는 지상 셀룰러 네트워크의 한계를 UAV(무인 항공기)로 보완하고, 강화학습(RL)으로 UAV의 배치·궤적·자원 할당을 최적화하는 연구를 다룬다.1. 왜 UAV인가? — 문제 제기모바일 기기와 IoT가 폭발적으로 증가하면서 신뢰 가능한 무선 연결 유지가 필수 조건이 됐다. 그러나 기존 지상 셀룰러 네트워크는 세 가지 한계를 갖는다.문제설명제한된 스펙트럼 용량QoS(서비스 품질)를 만족하기 어려움기지국(BS) 추가 구축 비용물리적 설치 비용이 높고 .. 2026. 3. 22.
[세미나 발표] Edge Computing Ch.4 Cloud Lock-in Parameters [Edge Computing] Ch.4 Cloud Lock-in Parameters — 벤더 종속의 이해와 탈출 전략Edge Computing: Technology, Management and Integration Chapter 4 발표 내용을 정리한 글이다. 이번 챕터는 클라우드 도입의 양면성, 특히 벤더 락인(Vendor Lock-in) 문제를 중심으로 다룬다.1. 왜 벤더 락인이 문제인가?ICT 산업은 클라우드 컴퓨팅을 통해 혁신을 맞이했다. 기업은 자본 투자 없이 네트워크를 통해 자원을 이용하고, 기술적 문제가 아닌 비즈니스 문제 해결에 집중할 수 있게 됐다.그러나 클라우드 도입이 전 세계적으로 활발해질수록 클라우드 락인 파라미터에 대한 이해가 필수적이다. 클라우드 간 협력과 데이터 교환을 저해하.. 2026. 3. 22.
[세미나 발표] Edge Computing Ch.2 A View – Cloud-Edge Computing Technology [엣지 컴퓨팅] 클라우드-엣지 기술 개념, 특징, 사례 정리Edge Computing - Technology, Management and Integration Chapter 2. A View – Cloud-Edge Computing Technology 내용을 정리한 글이다.새 책을 시작하며PMPP로 GPU와 병렬 프로그래밍을 깊이 다뤘다면, 이제는 그 연산이 어디서, 어떻게 실행되는지로 시야를 넓힐 차례다. 딥러닝 모델이 아무리 가벼워도 결국 어떤 하드웨어가, 어떤 위치에서 실행하느냐가 실서비스의 품질을 결정한다. Edge Computing - Technology, Management and Integration은 데이터 처리를 클라우드에서 엣지로 옮기는 흐름을 다루는 책이다.클라우드-엣지 기술이란?클라.. 2026. 3. 22.
[세미나 발표] Programming Massively Parallel Processors Ch.19 Parallel Computing Patterns and Computational Thinking [CUDA] 병렬 컴퓨팅의 목표, 알고리즘 선택, 문제 분해 정리Programming Massively Parallel Processors (저자: Kirk & Hwu) Chapter 19. Parallel Computing Patterns and Computational Thinking 내용을 정리한 글이다.19.1 병렬 컴퓨팅의 목표 (Goals of Parallel Computing)왜 병렬 컴퓨팅을 하는가?병렬 컴퓨팅을 추구하는 이유는 결국 속도 향상이다. 세 가지 관점으로 나눌 수 있다.같은 문제를 더 짧은 시간 안에 해결한다.같은 시간 안에 더 큰 문제를 해결한다.같은 문제와 같은 시간 내에 더 나은 해를 얻는다. (시뮬레이션 정밀도 향상 등)실제 애플리케이션의 구조현실의 애플리케이션은 서로 .. 2026. 3. 22.
[세미나 발표] Programming Massively Parallel Processors Ch.16 Deep Learning [CUDA] 딥러닝 — CNN 추론 커널, GEMM 변환, cuDNN 정리Programming Massively Parallel Processors (저자: Kirk & Hwu) Chapter 16. Deep Learning 내용을 정리한 글이다.16.1 Background — CNN과 GPU딥러닝, 특히 CNN(Convolutional Neural Network)은 이미지 분류, 객체 탐지 등에서 뛰어난 성능을 보인다. CNN 연산의 핵심은 합성곱(Convolution) 연산으로, 입력 피처 맵에 필터(커널)를 슬라이딩하며 출력 피처 맵을 생성한다.이 연산은 데이터 병렬성이 매우 높다. 출력 피처 맵의 각 픽셀은 독립적으로 계산될 수 있기 때문에 GPU의 대규모 병렬 처리에 이상적이다.16.2 CNN .. 2026. 3. 22.
[세미나 발표] Programming Massively Parallel Processors Ch.15 Graph Traversal [CUDA] 그래프 탐색 — BFS 병렬화, 프론티어, 사유화 정리Programming Massively Parallel Processors (저자: Kirk & Hwu) Chapter 15. Graph Traversal 내용을 정리한 글이다.15.1 그래프 (Graph) 기초그래프는 개체(정점, Vertex)와 그들 간의 관계(간선, Edge)를 나타내는 데이터 구조다.표현 방식인접 행렬(Adjacency Matrix): 직관적이지만 간선이 적은 희소 그래프에서는 공간 낭비가 심하다. V개의 정점이 있으면 V²개의 셀이 필요하다.희소 행렬(Sparse Matrix): 저장 공간과 연산 효율을 높이기 위해 사용한다. 주요 형식은 세 가지다.형식이름특징CSR압축 희소 행 (Compressed Sparse .. 2026. 3. 22.