'통계분석기법'에 해당되는 글 2건

  1. 2010/01/11 통계분석의 실제
2010/01/11 16:06



10. 자료 통계분석의 실제  
1. 예제분석의 개요

1.1 제목

1.1.1 연구제목

  • 예제주제 - 대중매체 수용자의 인구학적 속성(demographic) characteristics)이 미디어의 이용(media use)과 어떠한 관계를 갖는 가 ?
  • 인구학적 속성은 수용자의 성별, 년령 및 교육수준의 변인, 미디어의 이용은 신문독서시간과 TV시청시간 등으로 구별하며, 향후의  통계분석을 위해서 의존매체와 인물의 인지도에 대한 변일을 추가함.

1.1.2. 연구문제의 사전 구체사항

  • 수요자들의 하루 평균 TV 시청량과 신문 독서량은 얼마나 되는가 ?
  • 성별에 따라 의존 매체는 어떤 차이를 보이는가 ?
  • 신문 독서량을 남자와 여자의 것으로 구분하여 각 집단내에서 많이 읽는 순으로 서열을 정한다면 이러한 두 서열들 간에는 어떤 차이가 있는가 ?
  • 성별간에는 신문 독서량은 차이가 있을까 ?
  • 교육 수준간에 TV 시청량은 차이가 있을까 ?
  • 성별과 교육 수준간에 신문 독서량은 차이가 있을까 ?
  • 연령과 교육 수준은 각기 독서량과 어떤 관계를 나타내는가 ?
  • 응답자의 신문 독서량을 많이 읽는 사람의 순으로 서열을 정하고 응답자의 연령도 높은 순으로 서열을 정했을 때 두 서열 순위들은 어떤 관계를 나타내는가 ?
  • 연령의 높고 낮음에 따라 신문 독서량은 얼마만큼 변화하는 가 ?
  • 연령과 교육 수준은 TV 시청량에 어느 정도의 영향을 미치는 가 ?
  • 연령과 교육 수준을 제 1변인군으로 하고 신문 독서량과 TV 시청량을 제 2변인군으로  묶어 보았을 때 두 변인군들은 어떤 관계를 나타내는가 ?
  • 신문 독서량과 TV 시청량을 가지고 응답자의 교육 수준을 어느 정도 구별할 수 있는 가 ?
  • 10개 분야의 인물에 대한 응답자의 인지도를 각기 하나의 변인으로 보았을 때 이들 변인간의 관계는 어떤 유형을 나타내는 가 ?
  • 신문 독서량과 TV 시청량을 가지고 응답자들을 몇 개의 집단으로 분류할 수 있을까 ?

1.2 연구방법

  • 표본의 설정 - 설문조사의 방식을 통한 25명의 무작위 추출

<설문조사서의 작성>

칼럼번호

문 항

1

2

 1. 귀하의 연령은 ?                    세

4

 2. 귀하의 최종학력은 ?                      중졸                     고졸                   대졸

6

 3. 귀하의 성별은 ?                            남                      여

8

9

 4. 귀하의 하루 평균 TV 시청시간은 ?                          시간                      분

11

12

 5. 귀하의 하루 평균 신문 읽는 시간은 ?                          시간                          분

14

 6. 귀하는 주로 어느 매체를 통해 세상소식을 알게 됩니까 ?                        신문                     TV

 

 7. 아래 10개 분야에서 활약하고 있는 인물의 이름을 기억나는 대로 정어 주십시오.

16

17

(1) TV 탈렌트

19

20

(2) 미국 정치가:

22

23

(3) 대중가수:

25

26

(4) 한국정치가 :

28

29

(5) 코미디언 :

31

32

(6) 광고모델:

34

35

(7) 영화배우:

37

38

(8) 소련정치가:

40

41

(9) 일본 정치가:

43

44

(10) 성우 :

1.3 통계방법의 선정

<자료분석에 사용되는 통계분석방법>

번호

연 구 문 제

통 계 방 법

1

  평균 TV 시청량

 산술평균(M), 중위수(Mdn), 최빈수(Mo)

2

  성별에 따른 의존 매체의 차이

 카이자승 검증

3

  남녀 두집단의 신문 독서량의 순위 차이

 중앙치 검증, Mann-Whitney 검증

4

  남녀 두집단간의 신문 독서량의 차이

 T-검증

5

  교육수준간의 TV 시청량 차이

 1원변량분석

6

  성별 및 교육수준에서 본 신문 독서량의 차이

 2원변량분석

7

  년령과 신문독서량, 교육수준과 신문 독서량의 상관관계

 피어슨의 상관계수

8

  년령과 신문독서량의 서열순위의 관계

 스페어만의 Rho

9

  년령의 증가에 따른 TV 시청량의 변화

 회귀분석

10

  년령과 교육이 TV 시청량에 미치는 영향

 다변회귀분석

11

  두 변인군간의 상관관계

 정준상관분석

12

  신문 독서량과 TV 시청량이 교육수준을 구분하는 기능

 판별분석

13

  인물에 대한 인지도의 영향분석

 인자분석

1.4. 조사자료

    18 1 1 45 10 2 10 1 10 1 9 9 10 9 7 3

    19 2 2 40 20 17 3  8 3 8 8 7 10 6 7

    20 2 1 50 25 1 6 4 6 4 6 6 6 2 10 8

    21 2 2 51 15 2 7 8 7 8 7 7 8 7 8 9

    22 1 2 58 10 2 9 7 10 7 10 9 7 6 9 2

    23 1 1 48 30 1 8 2 8 2 7 8 9 10 7 7

    24 3 2 25 35 2 5 4 6 5 7 6 5 8 6 6

    24 3 1 25 40 1 5 4 5 5 5 5 2 8 6 6

    25 3 2 48 45 1 5 5 5 5 5 5 7 6 5 5

    26 3 1 30 35 2 5 7 5 6 7 6 8 7 4 4

    27 3 2 46 30 2 5 5 5 7 5 5 8 5 10 8

    27 3 1 20 70 1 3 4 2 4 2 2 2 6 5 5

    28 3 1 50 50 1 6 4 6 4 6 6 9 4 9 9

    29 1 2 59 5 2 10 0 10 0 9 9 3 3 9 10

    30 3 2 25 60 2 6 7 7 7 7 8 10 7 6 3

    30 2 1 25 40 1 2 8 3 7 3 3 0 9 7 2

    32 2 2 51 10 2 5 9 5 9 5 5 6 5 3 7

    32 2 1 60 40 1 7 10 7 10 7 8 10 3 2 9

    34 1 2 70 20 2 9 6 9 7 9 9 9 10 3 10

    34 1 2 58 20 2 10 7 10 7 9 9 7 6 10 7

    36 3 1 50 65 1 7 2 8 3 8 10 6 6 7 8

    38 2 2 70 40 2 6 4 5 5 3 6 10 9 0 9

    39 2 1 50 50 1 7 5 7 5 5 7 4 10 2 10

    40 2 1 58 55 1 7 6 9 5 6 9 10 3 10 10

    41 2 2 68 40 2 8 6 8 6 6 9 2 2 9 7

     

1.5. 실제분석의 사례

1.5.1.  집중경향의 지수

1) 연구문제

  • 평균 NP, TV의 시청량 - 산술평균, 중앙치, 최빈수

2) 개념

  • 평균(mean) - 모든 수치들을 다 합한 값을 전체사례수로 나눈 값으로 집중경향의 지수
  • 중앙치(median) - 집중경향의 지수로 한 분포안에 포함된 전체사례(N)를 양등분하는 점에 해당되는 수치
  • 최빈치(mode) - 분포안에서 가장 빈도가 높은 수치

3) 명령어

  • 통계분석(Statistics) -> 기초통계(summarize) -> 빈도분석(frequencies)

4) 결과해석

  • 신문구독시간(NP)은 평균 34.4분, TV 평균시청시간은 47.2분, 25명의 전체 신문구독시간 860분, 표준오차는 3.609, 표준편차 18.046, 변량은 325.6
  • NP와 TV의 첨도(kurtosis)는 각각 -0.731, -0.705로서 정상분포보다 더 평평한 모양 보임
  • NP의 편포(skewness)치는 0.175로서 우향편포 또는 정적편포(positive skewness)를 보임.

1.5.2. 카이자승 검증

1) 연구문제

  • 성별에 따른 의존매체의 차이 - 남성과 여성의 성별변인과 TV와 신문의 두매체의 의존 성향의 차이 ?

2) 개념

  • 기대치와 관찰치의 차이를 검증하는 방법으로 적합도검증(goodness of fit). 한 집단내의 유목간 빈도의 차이가 있는 지를 검증하는 것이 단일표본의 X2 검증.
  • 분할표(contingency table)의 X2 검증 - 유목에 대한 2개 혹은 그 이상의 집단간의 독립성을 검증함.

3) 명령어

  • Statistics -> Non-parametric tests -> Chi-square

4) 결과해석

  • 영가설의 부정 : 유의수준 P =0.05, 자유도 고려의 Chi-square 통계치(영가설의 부정한계영역)≤Chi-square 실제 검증통계치
  • 연구가설의 부정 : 유의수준 P=0.05, 자유도 고려의 Chi-square 통계치 ≥ Chi-square 실제 검증통계치
  • X2의 값은 8.98, 자유도 1로 영가설의 부정확율(significance)은 0.027로, 설정한 유의수준(p<0.05)로 영가설의 기각과 연구가설의 수용
  • 결론 : "남성과 여성의 의존매체는 서로 다르다"


2. 측정척도와 통계분석기법의 선택

2.1. 측정척도와 자료분석

2.1.2 측정척도의 종류

 척 도

내   용

명목

  • 기호가 개념 자체를 표시
  • 척도치는 단지 기호로서의 의미만을 갖고 있어 가감승제 등 일체의 산수적 연산은 불가능
  • 수와 수의 차이는 양보다는 질면의 차이를 나타낼 뿐임.

서열

  • 크기나 중요성에 따라 측정 결과들의 순위를 설정
  • 측정 결과를 서열 순서대로 나열
  • 각 수치 사이에 양적인 대소 서열은 유지되나, 계속 두 수치 사이의 간격은 반드시 동일 않음.
  • 척도상의 수치간의 거리와 그 수치들이 대표하는 실제상의 거리가 같지 않음.

등간

  • 수치 사이의 간격이 크기의 차이를 반영

비율

  • 비율의 수치는 크기의 비율을 나타냄.
  • 의미 있는 절대 영점을 가진다

 2.1.2 척도별 자료분석방법과 사례

  • 명목척도, 서열척도, 등간척도, 비율척도 순으로 각 척도로부터 얻어진 자료가 담고 있는 정보의 수준이 높아지며, 보다 정밀한 분석방법이 적용됨.
  • 비율척도로부터 얻어지는 자료는 거의 모든 분석방법이 적용가능하여, 분석의 속성상 비율척도를 측정하는 것이 양호하지만 속성에 따라 적용가능한 척도가 제한된 경우도 존재함.
  • 서열척도보다는 등간척도가, 등간척도보다는 비율척도가 보다 정교한 분석방법을 사용하므로 등간척도 이상의 자료를 얻는 것이 보다 자세한 분석을 할 수 있음.

   구   분

 측정

척도점에 내포된 가정

비교 방법

평균측정

적용 가능 분석 방법

분석사례

분류

순위

등간격

절대0점

  정성적   자   료

 명 목

×

×

×

확인 분류

최빈값

빈도 분석, 비모수 통계, 교차 분석

성별 분류, 상품 유형별 분류, 시장세분 구역 분류, 존재유무

 서 열

×

×

순위 분류

중앙값

서열상관 관계, 비모수 통계

상표 선호 순위, 상품 품질 등위, 사회 계층

  정량적   자   료

 등 간

×

간격 비교

산술 평균

모수 통계

온도, 광고 인지도, 상표 선호도, 주가 지수

 비 율

절대 크기 비교

기하 평균
조화 평균

모수 통계

매출액, 구매 확률, 무게, 소득, 나이

2.2 비모수 통계 분석법(non-parametric statistical analysis)

2.2.1 개념

  • 모집단의 분포가 명확하지 않거나 모평균과 같은 모수가 존재하지 않은 경우에 이용되는 분석 방법
  • 모수통계를 위한 모집단의 분포에 대한 가정이 충족되지 않는 경우와 순위자료나 명목자료를 분석할 경우에 이용.

2.2.2 하나의 변수 (단일 변수)에 대한 분석 방법 

자료의 형태

 분    석    방    법

명목   자료

  x2-test,  run test,  binomial test

순위   자료

  Kolmogoror-Smirnov,  one sample test

 

2.2.3  2변수 또는 복수 표본에 대한 분석 방법

자료의 형태

분   석   방   법

명 목  자 료

 x2-test,  Mcnemar test,  Cochran Q test

순 위  자 료

 Kolmogotov-Smirnov two test ,  Mann-Whitney U test,  Median test,  Kruscal-Wallis one-way ANOVA,  Friedman two-way ANOVA,  kenall,  Wald-Worfowitz test,  Wilcoxon test,  Sign test

2.3 모수 통계 분석 방법

2.3.1 독립 변수와 종속 변수간의 관계를 분석하는 방법

  • 독립변수가 종속변수를 어느 정도 설명 또는 예측해 주는 가에 중점을 둔 분석방법
  • 종속변수와 독립변수의 자료형태가 어느 정도 일치되어야 하며, 자료형태가 일치되지 못하면 분석상 오류가 발생함.

 통계기법

독립변수

종속변수

참고

상관관계(correlation)

등간(비율)

등간(비율)

독립변수가 명목자료인 경우는 Regression with Dummy Variable을 이용

회귀분석(regression)

등간(비율)

등간(비율)

분산분석(analysis of variance)

명목

등간(비율)

판별분석(discriminant analysis)

등간(비율)

명목

정준상관(canonical correlation)

등간(비율)

등간(비율)

2.3.2 변수들간의 상호 관계를 이용한 분석 방법

  • 독립변수와 종속변수가 없고 변수들간의 상호관계를 분석하는 방법들로서 변수와 대상(subjects)의 집단화(grouping)에 초점을 두게 됨.

 통계기법

자료의 형태

참고

요인분석(factor analysis)

등간(비율)

순위 자료를 이용하는 방법도 있음

군집분석(cluster analysis)

등간(비율)


3. 통계분석기법의 적용과 해석

3.1. 빈도분석

항 목

주 요 내 용

개 요

  • 각 변수 값에 속한 분포의 특성을 찾아내는 분석기법
  • 도수분포표, 집중경향치, 분산도, 히스토그램의 구성

기본원리

  • 도수분포표 - 빈도, 퍼센트, 유효비율, 누적백분율 등의 도표
  • 집중경향치(central tendency) - 최빈값(mode), 중위수(median), 평균(mean)
  • 분산도(dispersion) - 범위(range), 변량(variance), 표준편차(standard deviation), 평균의 표준오차(S.E. mean)

사용방법

  • 통계분석(S)-> 기초통계(U)-> 빈도분석(U)-> 변수선택-> 통계량(S) -> 계속-> 챠트도표(C)-> 계속-> 형식(F)-> 계속-> 완료

해석요점

  • 도수분포표 - 빈도, 퍼센트, 유효비율, 누적백분율 등의 도표
  • 집중경향치 - 최빈값, 중위수, 평균
  • 분산도 - 범위, 변량, 표준편차, 평균의 표준오차(S.E. mean)

3.2. 기술통계분석

항 목

주 요 내 용

개 요

  • 자료의 필요통계량을 간단히 산출하는 분석법. 요약통계량과 Z-점수 계산

기본원리

  • 기술통계량 - 평균, 표준편차, 최소값, 최대값, 빈도수, 분산, 범위, 평균 표준오차, 왜도, 첨도

사용방법

  • 통계분석(S)-> 기초통계(U)-> 기술통계-> 변수선택-> Z Score 고려-> 옵션(o)-> 계속-> 확인

해석요점

  • 평균, 표준편차, 최소값, 최대값, 빈도수, 분산, 범위, 평균 표준오차, 왜도, 첨도

3.3. 교차분석

항 목

주 요 내 용

개 요

  • 범주형 변수인 명목/서열자료의 변수간 상관관계인 독립성과 연관성의 분석

기본원리

  • 상관관계의 가설검증 - 카이제곱 검증, phi계수, Cramer V 및 분할계수 사용
  • X2의 값 크면 -변수간 상관관계 높고 관찰과 기대빈도간 차이 큼

사용방법

  • 통계분석(S)-> 기초통계(U)-> 교차분석(C)-> 변수선택(행,열)-> 통계량(S)-> 계속-> 셀선택(C)-> 계속-> 형식(F)-> 계속-> 확인

해석요점

  • 귀무가설 선택, 연구가설 기각 : x2계산치 유의도 ≥ α값(0.05) - 변수간 독립적
  • phi계수, Cramer V, 분할계수 - 0.20 이하(경미한 상관), 0.20-0.40(낮은 상관), 0.40-0.70(상당한 상관), 0.70-0.90(높은 상관), 0.90이상(매우 높은 상관)

3.4.신뢰도분석

항 목

주 요 내 용

개 요

  • 동일개념을 독립 측정방법에 의한 측정결과가 비슷한지의 일관성의 측정
  • 설문지의 신뢰성 측정과 요인분석시 추출인자의 신뢰성 측정

기본원리

  • 반복측정법 - 동일대상의 반복측정시에 유사/동일한 결과가 있도록 하는 측정
  • 측정오차분석법 - 측정상에 측정오차의 정도 파악. 측정오차 적음- 자료신뢰도 증가
  • 측정도구검증법 - 신뢰성의 근본 분석

사용방법

  • 통계분석(S)-> 척화도분석(A)-> 신뢰도분석(R)-> 변수선택-> 모형(M)선택-> 통계분석(S)-> 계속-> 실행

해석요점

  • 알파값 ; 신뢰도계수Cronbach's x값) > 0.6 - 신뢰도 존재
  • 해당변수(A) 제거 문자값 > α값 - A변수 제거시 신뢰도 증대
  • F값과 확율(P) ; F값 < 유의도(α=0.01, 0.05) - 귀무가설 기각, 연구가설 채택

3.5.상관관계분석

항 목

주 요 내 용

개 요

  • 분석대상 변수들간의 관련정도, 관계의 방향(정(+)의 방향, 부(-)의 방향), 상관계수에 대한 가설의 검증

기본원리

  • Pearson, Spearman의 상관계수(r) ; -1≤r≤1, r=1(완벽상관), r=0(무상관)
  • 단순상관관계 - 두 변수간 상관관계, 다중상관관계 - 하나의 변수와 둘 또는 두 개 이상 변수간 상관, 편상관관계 - 제3의 변수 통제하에 순수하게 두 변수간의 상관관계의 표현

사용방법

  • 단순/다중상관관계 : 통계분석(S)-> 상관분석(C)-> 이변량 상관계수(B)-> 상관계수,유의성검정 표시-> 옵션(O)-> 계속-> 확인
  • 편상관관계 : 통계분석(S)-> 상관분석(C)-> 편상관계수(R)-> 변수선택(V)-> 통제변수(C)-> 옵션(O)-> 통계량선택-> 계속-> 확인

해석요점

  • 가설검증 : 귀무가설 상관계수 = 0 - 귀무가설 기각, 변수간 상관관계 존재
  • 상관계수 : r=1 완전상관, r=0 무상관, 약한 상관 0.0-0.3, 보통상관 0.3-0.7, r.>0.7 강한 상관

3.6.회귀분석

항 목

주 요 내 용

개 요

  • o 종속변수와 독립변수의 관련성의 강도 파악
  • o 독립변수 값의 변화에 따른 종속변수 값의 변화를 예측하는 데 사용

기본원리

  • 선형의 회귀방정식을 도출하여 종속변수를 예측
  • 회귀방정식 ; 단순회귀 - Y(종속변수) = a + b1x(독립변수) + e(오차)
  • 다중회귀식 - Y = a + b1x1 + btxt + e

사용방법

  • 단순회귀분석 : 통계분석(S)-> 회귀분석(R)-> 선형(L)-> 종속변수(D)-> 독립변수(I)-> 방법(M)-> 케이스 설명(C)-> 분석 선택사항(S)-> 계속-> 확인

해석요점

  • 회귀식의 성립여부 판정 : 자유도와 신뢰수준(95%) 계산된 F값> 기준 F값 - 통계적 의의존재(회귀식 성립). 변량분석 F값 < 유의수준 F값 0.05 - 회귀식 성립
  • 상관성 : r=1 완전상관, r=0 무상관, 약한 상관 0.0-0.3, 보통상관 0.3-0.7, r.>0.7 강한 상관
  • 적합도 : 상관성(multiple)의 제곱값인 적합도(R square) 값 판단
  • 통계적 의미변수 : sig t 값 < 0.05 - 독립변수와 종속변수는 통계적 의미존재
  • 표준화된 회귀계수(beta)의 절대값이 큰 변수일수록 설명력이 높은 변수

3.7. T-검정

항 목

주 요 내 용

개 요

  • 독립된 두 집단간의 평균의 차이가 통계적으로 유의한 지를 검증

기본원리

  • T값 (제1평균-제2평균/표준오차)과 자유도를 구한후 가설검증
  • 신뢰수준 결정(95%), 신뢰수준의 T값의 T분포표에서 구함. 계산된 T값 > 기준 T값 - 통계적인 유의미한 차이 존재

사용방법

  • 통계분석(S)-> 평균비교(M)-> 독립표본 T검정(T)-> 검정변수(T)선택-> 집단변수(G) 선택-> 집단정의(D)-> 계속-> 옵션(O)-> 계속-> 확인

해석요점

  • 집단의 동질성 여부판단 : F값> P값(95% 신뢰수준) - 집단이 동질적
  • T 검정 : T 검정도 값 <0.05 - 95%의 신뢰수준 귀무가설 기각, 연구가설 채택

3.8. 분산분석

항 목

주 요 내 용

개 요

  • 두 집단 이상의 평균 차이를 검증하는 데 사용, 일원분산분석과 다원분산분석

기본원리

  • 종속변수 전체분산 가운데 독립변수와 함께하는 분산이 어느 정도인지를 측정함.
  • 요인분산 분석(두 변수의 분산효과 분석)과 공분산 분석(외생변수 효과 통제와 나머지 집단간 평균차이의 검증)

사용방법

  • 일원분산분석 : 통계분석(S)-> 평균비교(M)-> 일원배치 분산분석(O)-> 종속변수(D)-> 요인선택(F)-> 대비(C)클릭-> 계속-> 사후분석(post hoc..)
  • 단일요인 분산분석 : 통계분석(S)-> 일반선형모형(G)-> 단순요인 분산분석(S)-> 종속변수(D)-> 요인선택(F)-> 범위지정(E)-> 계속-> 공변량(C)-> 옵션(O)-> 계속

해석요점

  • 가설검증 : 귀무가설(u1=u2= --uk) - F값 < 0.05 신뢰수준 95% 귀무가설 기각, 연구가설 채택
  • 상호작용(독립변수간 관련성 검증) - F값 > 0.05 95% 신뢰수준 독립변수간 상호작용 존재

3.9. 다변량 분석

항 목

주 요 내 용

개 요

  • 종속변수가 2개 이상시 종속변수간 평균값의 차이 검증, 독립변수가 어떤 종속변수에 더 많은 영향을 미치는 지 파악

기본원리

  • 독립변수의 종속변수에 대한 공헌도와 종속변수들간의 상관관계를 고려하여 분석하는 기법

사용방법

  • 통계분석(S)-> 일반선형모형(G)-> GLM-다변량(M)-> 종속변수(D)-> 모수요인(F)-> 공변량(C)-> 대비(N)-> 모형선택(F)-> 계속옵션(O)-> 계속-> 확인

해석요점

  • 메노바 모델 성립에 관한 규정 : Pillai 값 이용 - 통계적 의미 존재 - 분석가능
  • 분산의 공분산 동질성검증 : Box M값을 F값과 카에제곱값 환찬 > 유의수준(P>0.05) - 산포도 행렬 동질성 구비
  • 종속변수에 대한 독립변수의 영향력 검증 : sig. F값 < 유의수준 0.05 - 종속변수는 독립변수에 영향 받음(통계적 의미 존재)
  • 종속변수간 상관관계 검증

3.10. 판별분석

항 목

주 요 내 용

개 요

  • 독립변수의 역학관계를 바탕으로 종속변수(집단구분)를 추정하는 통계기법
  • 집단 판별의선형판별함수 생성과 집단구분에 영향 미치는 변수 발견

기본원리

  • 정량자료의 독립변수를 이용하여 명목자료의 독립변수집단의 구분시에 오류를 최소화하는 함수 즉 판별식의 발견

사용방법

  • 통계분석(S)-> 분류분석(Y)-> 판별분석(D)-> 집단변수(G)-> 범위지정(D)-> 독립변수(I)-> 통계분석(S)-> 분류(C)-> 변수저장-> 확인

해석요점

  • Wilks lamda(그룹간 평균차 분석도구) : 평균차가 없음 1, 차이가 큼 0.
  • 고유값(Elgen value) : 클수록 좋은 판별함수
  • cannonical correlation(eta 값) : 높을수록 판별함수 설명력 증대
  • tolerance level(독립변수의 선형적 관계표현) : 크면 독립변수의 추가와 설명력 의미- 신변수 추가
  • standardize canonical determinant function coeefient : 평균 0, 표준편차1의 표준판별함수. 종속변수와 가장밀접한 변수의 파악

3.11. 요인분석

항 목

주 요 내 용

개 요

  • 변수들 상호간의 상호의존도를 분석하여 서로 유사한 변수들 끼리 묶어주는 방법

기본원리

  • 변수를 몇 개의 공통요인으로 묶어 자료요약, 변수구조 파악, 불필요한 변수제거, 측정도구의 타당성 검증, 추가분석에 요인점수 인용, 대상을 묶는 데 유용성 등의 기능 제공

사용방법

  • 통계분석(S)-> 데이터 축소(D)-> 요인분석(F)-> 변수선택(V)-> 기술통계(D)-> 요인추출(E)-> 요인회전(T)-> 요인점수(S)-> 옵션(O)-> 계속-> 확인

해석요점

  • 상관행렬 파악, 공통성(communality)의 추출, 변수들의 공분산 및 고유치
  • 고유치 스크리 도표, 회전전의 성분행렬, 회전된 성분행렬, 성분변환행렬, 회전공간의 성분도표 검토, 성분점수 계수행렬

3.12. 군집분석

항 목

주 요 내 용

개 요

  • 대상 속성들의 유사한 성향을 바탕으로 동질적인 집단으로 묶어 동일집단내에 속하는 공통특성을 찾음.

기본원리

  • 변수들의 유사성 평가시 오류를 피하기 위한 변수선정이 중요한 문제
  • 군집화의 공통원칙은 군집내 대상들간 유사성의 극대화, 군집간 유사성은 극소화
  • 계층적 군집화 방법이 보편적이며,

사용방법

  • 통계분석(S)-> 분류분석(Y)-> 계층적 군집분석(H)-> 변수선택(V)-> 통계량(T)-> 도표(O)-> 방법(M)-> 계속-> 저장-> 확인

해석요점

  • 상관계수(coefficient)가 클수록 대상 속성들이 들어 있는 군집간의 이질성이 큼.

         
Posted by mklee.artist

댓글을 달아 주세요

이전버튼 1 2 이전버튼