728x90 반응형 데이터 분할1 [ADsP] 3.9 데이터마이닝의 개요 데이터마이닝의 개요 ■ 데이터마이닝 : 대용량 데이터에서 의미있는 패턴을 파악하거나 예측하여 의사결정에 활용하는 방법. ■ 데이터마이닝 5단계 - 목적 설정 -> 데이터 준비 -> 데이터 가공 -> 데이터마이닝 기법 적용 -> 검증 ■ 데이터마이닝 분석 방법 지도학습 비지도학습 의사결정나무 인공신경망 일반화 선형 모형 회귀분석 로지스틱 회귀분석 사례기반 추론 최근접 이웃법(KNN) SVM OLAP 연관성 규칙발견 군집분석(K-Means Clustering) SOM ■ 데이터 분할 : 주어진 데이터에서만 높은 성과를 보이는 모형의 과적합 문제 해결 방법 중 하나 1) 구축(학습)용 : 훈련용 데이터 50% 2) 검정용 : 구축된 모형의 과대추정 또는 과소추정을 미세 조정하는 데 활용 30% 3) 시험용 :.. 2023. 2. 25. 이전 1 다음 728x90 반응형