본문 바로가기

DBSCAN2

[세미나 발표] Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow Ch.9 Unsupervised Learning Techniques [머신러닝] 비지도 학습 — DBSCAN, 클러스터링 알고리즘, GMM 정리Hands-On Machine Learning with Scikit-Learn, Keras & TensorFlow (Aurélien Géron) Chapter 9. Unsupervised Learning Techniques (p.436~448) 내용을 정리한 글이다.DBSCAN개념DBSCAN(Density-Based Spatial Clustering of Applications with Noise)은 클러스터를 높은 밀도 영역으로 정의하는 알고리즘이다. 클러스터 개수를 미리 지정하지 않아도 되고, 클러스터 사이가 적당히 떨어져 있을 때 잘 작동한다.동작 방식각 데이터 포인트 근처(반경 ε) 안에 있는 주변 데이터의 수를 센다. 이.. 2026. 3. 21.
[Machine Learning & Deep Learning 공부] Feature Engineering& Clustering & 차원 축소 이제 머신러닝은 거의 끝나고, 피쳐 엔지니어링과 클러스터링, 차원축소를 잘하는 법을 배우고 딥러닝을 배울 것이다.Feature Engineering에서 중요한 점은 좋은 Feature을 구별하는 것이다.좋은 feature 의 조건은 5가지가 있다.Target 과의 높은 관련성prediction 시점에 알 수 있다. ex) 매출 앱 데이터는 다음 달에 전월 매출이 집계되는데, 그런 거를 월별 매출로 판단하고 사용하면 안 된다.Numeric : 반드시 숫자로 되어있어야 한다.충분한 example(data)의 수인간 전문가의 domain 지식(업무 지식)이 활용되어야 한다. ex) 동일 데이터가 주어졌을 때, column을 나누는 것은 인간이므로 feature가 좋고 나쁨을 정한다.이 다섯 가지의 조건을 만족.. 2025. 3. 24.