본문 바로가기

SFT2

GDG : AI 개발코스 Week10 10주 차에는 팀원이 파인튜닝한 모델을 테스트해 보고 RAG Pipeline 관련 토의를 진행했습니다.학습방식Unsloth 및 필수 라이브러리 설치unsloth 라이브러리를 설치하여 LLM 파인튜닝 속도를 최적화 & colab-new 옵션은 Colab 환경에 맞춰 설정.xformers, trl, peft, accelerate, bitsandbytes 등 파인튜닝에 필요한 주요 라이브러리들을 추가 설치.Unsloth 로드 확인unsloth에서 FastLanguageModel을 임포트 하고, "Unsloth & Xformers 설치 완료! 🚀" 메시지를 출력하여 라이브러리 로드 및 패치가 성공적으로 이루어졌는지 확인.모델 및 토크나이저 불러오기Unsloth의 FastLanguageModel을 사용하여 un.. 2026. 2. 2.

GDG : AI 개발코스 Week6 지난 포스팅에서 Team DIET는 보안이 중요한 공공/행정 도메인, 특히 '선생님'이라는 페르소나를 위해 온프레미스(On-Premise) 환경에서 구동 가능한 경량화 AI를 만들기로 했다.이번 주차의 핵심 과제는 모델이 학습할 데이터를 준비하는 것이다. 나는 이번 단계에서 원천 데이터 확보 및 협업 환경 구축을 담당했고, 이후 팀원들이 진행한 데이터 전처리(SFT Formatting) 과정을 코드를 통해 깊이 있게 분석해 보았다.1. 데이터 확보 및 협업 환경 구축 (My Role)우리가 목표로 하는 모델은 행정 및 법률에 특화된 모델이다. 이를 위해 양질의 한국어 법률 데이터가 필수적이었고, AI Hub의 행정법 데이터를 활용하기로 결정했다.데이터 출처: AI Hub 행정 문서 대상 기계독해 데이터문.. 2026. 1. 7.

이전 1 다음

티스토리툴바