본문 바로가기

VLM2

[논문 리뷰] Large Language Models Are Natural Video Popularity Predictors [논문 리뷰] LLM은 자연스러운 비디오 인기 예측기다 — VLM+LLM 기반 멀티모달 접근법1. 문제 정의 — 기존 연구의 한계비디오 인기 예측은 콘텐츠 제작자, 소셜 미디어 플랫폼, 광고주들에게 매우 중요한 과제다. 그러나 기존 연구는 두 가지 근본적인 문제를 안고 있었다. 첫째, post-hoc user engagement data에 대한 과의존이다. 업로더 평판, 조회수·댓글·좋아요 수, 외부 소셜 네트워크 규모 같은 사후적 집계 지표는 초기 사용자 반응을 반영할 뿐, 비디오 콘텐츠 자체의 품질을 포착하지 못한다.둘째, 멀티모달 데이터 처리 능력의 부재다. 텍스트, 음성, 시각적 콘텐츠가 복합적으로 얽혀 있는 비디오 데이터를 기존의 전통적 방법들은 통합적으로 처리하기 어렵다.셋째, 인기도의 1차원.. 2026. 4. 13.
[논문 리뷰] Large Language Models Are Natural Video Popularity Predictors LLM이 YouTube 영상의 인기도를 예측할 수 있다는 아이디어를 다룬 논문 리뷰를 시작하겠다.이 논문은 기존 연구들이 조회수, 좋아요 수 같은 사후적(post-hoc) 메타데이터에 의존하던 영상 인기 예측을 영상 콘텐츠 자체의 내재적 품질에 집중하는 방식으로 전환한다는 아이디어를 제안한다.Motivation : 왜 기존 방법이 부족한가?영상 인기 예측은 콘텐츠 제작자, 소셜 미디어 플랫폼, 광고주들에게 매우 중요한 과제다.기존 연구들은 주로 다음과 같은 특성에 의존했다.uploader reputation, view/comment/like counts, external social network size...이런 지표들은 영상이 올라간 이후 발생하는 초기 사용자 반응을 반영하기 때문에, 영상 콘텐츠 자.. 2026. 3. 25.