본문 바로가기
통계학

수리통계학 다변량 분석 요약

by 네잎클로버편집자 2023. 2. 21.
반응형

V. 다변량 분석

A. 다변량 정규 분포 속성 및 특성 매개변수 추정

B. 주성분 분석 정의 및 동기 부여 데이터 변환 및 고유 벡터 해석 및 응용

C. 공적 상관관계 분석 정의 및 동기 기하학적 해석 추론 및 응용을 요약하면 다음과 같다.

 

다변량 분석 요약

 

A. 다변량 정규 분포

  • 속성 및 특성: 다변량 정규 분포는 2개 이상의 연속적인 확률 변수에 대한 결합 확률 분포로, 평균 벡터와 공분산 행렬로 특징화됩니다. 또한, 다변량 정규 분포는 종 모양의 대칭 분포를 가지며, 마할라노비스 거리를 이용하여 등고선 모양을 나타낼 수 있습니다.
  • 매개변수 추정: 다변량 정규 분포에서는 최대 가능도 추정법을 이용하여 평균 벡터와 공분산 행렬을 추정할 수 있습니다.

 

B. 주성분 분석

  • 정의 및 동기 부여: 주성분 분석은 다변량 데이터를 저 차원 공간으로 축소하는 방법으로, 데이터의 분산을 최대한 보존하는 축을 찾아내는 것입니다. 이를 통해 데이터를 시각화하거나 차원의 저주 문제를 해결할 수 있습니다.
  • 데이터 변환 및 고유 벡터: 주성분 분석에서는 먼저 입력 데이터를 표준화하여 각 변수의 스케일 차이를 제거합니다. 그리고 공분산 행렬을 계산하고, 이 행렬의 고유 벡터와 고윳값을 구합니다. 고유 벡터는 주성분의 방향을 나타내며, 고윳값은 해당 주성분이 전체 분산 중 얼마나 설명하는지를 나타냅니다.
  • 해석 및 응용: 주성분 분석 결과는 각 주성분이 전체 분산 중 얼마나 설명하는지를 나타내는 고유값과, 각 주성분의 방향을 나타내는 고유 벡터로 나타내어집니다. 이를 통해 주성분의 중요도를 평가하거나, 주성분들의 조합으로 데이터를 재구성할 수 있습니다.

 

C. 공적 상관 관계 분석

  • 정의 및 동기: 공적 상관관계 분석은 두 개 이상의 변수 간의 상관관계를 분석하는 방법 중 하나로, 변수들의 선형 결합에 대한 계수를 추정합니다. 이를 통해 변수들 간의 상관관계를 파악하고, 다중공선성 문제를 해결할 수 있습니다.
  • 기하학적 해석: 공적 상관 관계수 분석에서는 주성분 분석과 마찬가지로 고윳값 분해를 수행합니다. 이때 고윳값은 공적 상관 계수 행렬의 고윳값으로 계산됩니다. 이후, 고윳값과 고유 벡터를 이용하여 변수들 간의 선형 결합을 추정합니다. 이를 통해 변수 간의 상관관계를 파악할 수 있습니다.
  • 추론 및 응용: 공적 상관 관계 분석은 변수들 간의 다중공선성 문제를 해결하고, 변수 선택이나 변수 변환 등의 전처리를 수행하는 데에도 유용하게 사용됩니다. 또한, 이를 통해 변수들 간의 상관관계를 파악하고 이를 이용하여 예측 모델의 정확도를 높일 수 있습니다.
반응형

댓글