본문 바로가기
자격증/ADsP

[ADsP] 3.8 주성분분석과 다차원척도법

by 리미와감자 2023. 2. 24.

주성분분석

주성분분석(PCA) : 여러 변수를 서로 상관성이 높은 변수들의 선형 결합인 주성분으로 만들어 차원을 축소하는 것

 

공분산 행렬 vs. 상관계수 행렬

- 공분산 행렬 : 변수의 측정 단위를 그대로 반영 -> 변수의 측정 단위에 민감.

- 상관계수 행렬 : 모든 변수의 측정 단위를 표준화. 변수들의 scale이 많이 다른 경우 사용.

- 주성분분석은 거리를 사용하기 때문에 척도에 영향을 받음(정규화 전후의 결과가 다름)

- 주성분분석 결과에서 누적기여율이 85%이상이면 주성분의 수로 결정할 수 있음.

 

 

R 함수

- 상관계수 행렬 : prcomp(data, scale=TRUE), princomp(data, cor=TRUE)

 

다차원척도법

다차원척도법(MDS) : 객체간 근접성을 시각화하는 통계기법

- 데이터 속에 잠재해있는 패턴, 구조를 찾아냄.

- 개체들 사이의 유사성/비유사성을 측정하여 2차원 또는 3차원 공간상에 점으로 표현

- 유클리드 거리행렬 사용

 

종류

- 계량적 MDS : 구간척도, 비율척도 데이터에 활용

- 비계량적 MDS : 순서척도 데이터에 활용

 

 

'자격증 > ADsP' 카테고리의 다른 글

[ADsP] 3.10 분류분석  (0) 2023.02.25
[ADsP] 3.9 데이터마이닝의 개요  (0) 2023.02.25
[ADsP] 3.7 시계열분석  (0) 2023.02.24
[ADsP] 3.6 회귀분석  (1) 2023.02.24
[ADsP] 3.5 상관분석  (0) 2023.02.23

댓글