728x90
반응형
주성분분석
■ 주성분분석(PCA) : 여러 변수를 서로 상관성이 높은 변수들의 선형 결합인 ‘주성분’으로 만들어 차원을 축소하는 것
■ 공분산 행렬 vs. 상관계수 행렬
- 공분산 행렬 : 변수의 측정 단위를 그대로 반영 -> 변수의 측정 단위에 민감.
- 상관계수 행렬 : 모든 변수의 측정 단위를 표준화. 변수들의 scale이 많이 다른 경우 사용.
- 주성분분석은 거리를 사용하기 때문에 척도에 영향을 받음(정규화 전후의 결과가 다름)
- 주성분분석 결과에서 누적기여율이 85%이상이면 주성분의 수로 결정할 수 있음.
■ R 함수
- 상관계수 행렬 : prcomp(data, scale=TRUE), princomp(data, cor=TRUE)
다차원척도법
■ 다차원척도법(MDS) : 객체간 근접성을 시각화하는 통계기법
- 데이터 속에 잠재해있는 패턴, 구조를 찾아냄.
- 개체들 사이의 유사성/비유사성을 측정하여 2차원 또는 3차원 공간상에 점으로 표현
- 유클리드 거리행렬 사용
■ 종류
- 계량적 MDS : 구간척도, 비율척도 데이터에 활용
- 비계량적 MDS : 순서척도 데이터에 활용
728x90
반응형
'Certificate > ADsP' 카테고리의 다른 글
[ADsP] 3.10 분류분석 (0) | 2023.02.25 |
---|---|
[ADsP] 3.9 데이터마이닝의 개요 (0) | 2023.02.25 |
[ADsP] 3.7 시계열분석 (0) | 2023.02.24 |
[ADsP] 3.6 회귀분석 (1) | 2023.02.24 |
[ADsP] 3.5 상관분석 (0) | 2023.02.23 |
댓글