MapReduce1 [세미나 발표] Data Science from Scratch Ch.24 [데이터 엔지니어링 기초] MapReduce 정리Data Science from Scratch (Joel Grus) Chapter 24 : MapReduce 내용을 정리한 글이다.MapReduce란?대규모 데이터 집합에 대한 병렬 처리를 수행하는 모델이다. 데이터가 너무 많아한 대의 컴퓨터에 저장조차 할 수 없는 상황에서 활용한다.알고리즘 구조는 세 단계로 나뉜다.Map : 각 데이터를 0개 이상의 (키, 값) 쌍으로 변환한다.Group : 같은 키를 가진 쌍끼리 모두 모은다.Reduce : 같은 키로 묶인 값들에 reducer 함수를 적용해 최종 결과를 산출한다.예시: 단어 개수 세기 (Word Count)수백만 명의 사용자 상태 업데이트에서 가장 자주 쓰이는 단어를 찾고 싶다고 하자.사용자가 수백 명.. 2026. 3. 20. 이전 1 다음