| 10. 자료 통계분석의 실제
1. 예제분석의 개요
1.1 제목
1.1.1 연구제목
- 예제주제 - 대중매체 수용자의 인구학적 속성(demographic) characteristics)이 미디어의 이용(media use)과 어떠한 관계를 갖는 가 ?
- 인구학적 속성은 수용자의 성별, 년령 및 교육수준의 변인, 미디어의 이용은 신문독서시간과 TV시청시간 등으로 구별하며, 향후의 통계분석을 위해서 의존매체와 인물의 인지도에 대한 변일을 추가함.
1.1.2. 연구문제의 사전 구체사항
- 수요자들의 하루 평균 TV 시청량과 신문 독서량은 얼마나 되는가 ?
- 성별에 따라 의존 매체는 어떤 차이를 보이는가 ?
- 신문 독서량을 남자와 여자의 것으로 구분하여 각 집단내에서 많이 읽는 순으로 서열을 정한다면 이러한 두 서열들 간에는 어떤 차이가 있는가 ?
- 성별간에는 신문 독서량은 차이가 있을까 ?
- 교육 수준간에 TV 시청량은 차이가 있을까 ?
- 성별과 교육 수준간에 신문 독서량은 차이가 있을까 ?
- 연령과 교육 수준은 각기 독서량과 어떤 관계를 나타내는가 ?
- 응답자의 신문 독서량을 많이 읽는 사람의 순으로 서열을 정하고 응답자의 연령도 높은 순으로 서열을 정했을 때 두 서열 순위들은 어떤 관계를 나타내는가 ?
- 연령의 높고 낮음에 따라 신문 독서량은 얼마만큼 변화하는 가 ?
- 연령과 교육 수준은 TV 시청량에 어느 정도의 영향을 미치는 가 ?
- 연령과 교육 수준을 제 1변인군으로 하고 신문 독서량과 TV 시청량을 제 2변인군으로 묶어 보았을 때 두 변인군들은 어떤 관계를 나타내는가 ?
- 신문 독서량과 TV 시청량을 가지고 응답자의 교육 수준을 어느 정도 구별할 수 있는 가 ?
- 10개 분야의 인물에 대한 응답자의 인지도를 각기 하나의 변인으로 보았을 때 이들 변인간의 관계는 어떤 유형을 나타내는 가 ?
- 신문 독서량과 TV 시청량을 가지고 응답자들을 몇 개의 집단으로 분류할 수 있을까 ?
1.2 연구방법
- 표본의 설정 - 설문조사의 방식을 통한 25명의 무작위 추출
<설문조사서의 작성>
|
칼럼번호 |
문 항 |
|
1 |
2 |
1. 귀하의 연령은 ? 세 |
|
4 |
2. 귀하의 최종학력은 ? 중졸 고졸 대졸 |
|
6 |
3. 귀하의 성별은 ? 남 여 |
|
8 |
9 |
4. 귀하의 하루 평균 TV 시청시간은 ? 시간 분 |
|
11 |
12 |
5. 귀하의 하루 평균 신문 읽는 시간은 ? 시간 분 |
|
14 |
6. 귀하는 주로 어느 매체를 통해 세상소식을 알게 됩니까 ? 신문 TV |
|
|
7. 아래 10개 분야에서 활약하고 있는 인물의 이름을 기억나는 대로 정어 주십시오. |
|
16 |
17 |
(1) TV 탈렌트 |
|
19 |
20 |
(2) 미국 정치가: |
|
22 |
23 |
(3) 대중가수: |
|
25 |
26 |
(4) 한국정치가 : |
|
28 |
29 |
(5) 코미디언 : |
|
31 |
32 |
(6) 광고모델: |
|
34 |
35 |
(7) 영화배우: |
|
37 |
38 |
(8) 소련정치가: |
|
40 |
41 |
(9) 일본 정치가: |
|
43 |
44 |
(10) 성우 : |
1.3 통계방법의 선정
<자료분석에 사용되는 통계분석방법>
|
번호 |
연 구 문 제 |
통 계 방 법 |
|
1 |
평균 TV 시청량 |
산술평균(M), 중위수(Mdn), 최빈수(Mo) |
|
2 |
성별에 따른 의존 매체의 차이 |
카이자승 검증 |
|
3 |
남녀 두집단의 신문 독서량의 순위 차이 |
중앙치 검증, Mann-Whitney 검증 |
|
4 |
남녀 두집단간의 신문 독서량의 차이 |
T-검증 |
|
5 |
교육수준간의 TV 시청량 차이 |
1원변량분석 |
|
6 |
성별 및 교육수준에서 본 신문 독서량의 차이 |
2원변량분석 |
|
7 |
년령과 신문독서량, 교육수준과 신문 독서량의 상관관계 |
피어슨의 상관계수 |
|
8 |
년령과 신문독서량의 서열순위의 관계 |
스페어만의 Rho |
|
9 |
년령의 증가에 따른 TV 시청량의 변화 |
회귀분석 |
|
10 |
년령과 교육이 TV 시청량에 미치는 영향 |
다변회귀분석 |
|
11 |
두 변인군간의 상관관계 |
정준상관분석 |
|
12 |
신문 독서량과 TV 시청량이 교육수준을 구분하는 기능 |
판별분석 |
|
13 |
인물에 대한 인지도의 영향분석 |
인자분석 |
1.4. 조사자료
18 1 1 45 10 2 10 1 10 1 9 9 10 9 7 3
19 2 2 40 20 17 3 8 3 8 8 7 10 6 7
20 2 1 50 25 1 6 4 6 4 6 6 6 2 10 8
21 2 2 51 15 2 7 8 7 8 7 7 8 7 8 9
22 1 2 58 10 2 9 7 10 7 10 9 7 6 9 2
23 1 1 48 30 1 8 2 8 2 7 8 9 10 7 7
24 3 2 25 35 2 5 4 6 5 7 6 5 8 6 6
24 3 1 25 40 1 5 4 5 5 5 5 2 8 6 6
25 3 2 48 45 1 5 5 5 5 5 5 7 6 5 5
26 3 1 30 35 2 5 7 5 6 7 6 8 7 4 4
27 3 2 46 30 2 5 5 5 7 5 5 8 5 10 8
27 3 1 20 70 1 3 4 2 4 2 2 2 6 5 5
28 3 1 50 50 1 6 4 6 4 6 6 9 4 9 9
29 1 2 59 5 2 10 0 10 0 9 9 3 3 9 10
30 3 2 25 60 2 6 7 7 7 7 8 10 7 6 3
30 2 1 25 40 1 2 8 3 7 3 3 0 9 7 2
32 2 2 51 10 2 5 9 5 9 5 5 6 5 3 7
32 2 1 60 40 1 7 10 7 10 7 8 10 3 2 9
34 1 2 70 20 2 9 6 9 7 9 9 9 10 3 10
34 1 2 58 20 2 10 7 10 7 9 9 7 6 10 7
36 3 1 50 65 1 7 2 8 3 8 10 6 6 7 8
38 2 2 70 40 2 6 4 5 5 3 6 10 9 0 9
39 2 1 50 50 1 7 5 7 5 5 7 4 10 2 10
40 2 1 58 55 1 7 6 9 5 6 9 10 3 10 10
41 2 2 68 40 2 8 6 8 6 6 9 2 2 9 7
1.5. 실제분석의 사례
1.5.1. 집중경향의 지수
1) 연구문제
- 평균 NP, TV의 시청량 - 산술평균, 중앙치, 최빈수
2) 개념
- 평균(mean) - 모든 수치들을 다 합한 값을 전체사례수로 나눈 값으로 집중경향의 지수
- 중앙치(median) - 집중경향의 지수로 한 분포안에 포함된 전체사례(N)를 양등분하는 점에 해당되는 수치
- 최빈치(mode) - 분포안에서 가장 빈도가 높은 수치
3) 명령어
- 통계분석(Statistics) -> 기초통계(summarize) -> 빈도분석(frequencies)
4) 결과해석
- 신문구독시간(NP)은 평균 34.4분, TV 평균시청시간은 47.2분, 25명의 전체 신문구독시간 860분, 표준오차는 3.609, 표준편차 18.046, 변량은 325.6
- NP와 TV의 첨도(kurtosis)는 각각 -0.731, -0.705로서 정상분포보다 더 평평한 모양 보임
- NP의 편포(skewness)치는 0.175로서 우향편포 또는 정적편포(positive skewness)를 보임.
1.5.2. 카이자승 검증
1) 연구문제
- 성별에 따른 의존매체의 차이 - 남성과 여성의 성별변인과 TV와 신문의 두매체의 의존 성향의 차이 ?
2) 개념
- 기대치와 관찰치의 차이를 검증하는 방법으로 적합도검증(goodness of fit). 한 집단내의 유목간 빈도의 차이가 있는 지를 검증하는 것이 단일표본의 X2 검증.
- 분할표(contingency table)의 X2 검증 - 유목에 대한 2개 혹은 그 이상의 집단간의 독립성을 검증함.
3) 명령어
- Statistics -> Non-parametric tests -> Chi-square
4) 결과해석
- 영가설의 부정 : 유의수준 P =0.05, 자유도 고려의 Chi-square 통계치(영가설의 부정한계영역)≤Chi-square 실제 검증통계치
- 연구가설의 부정 : 유의수준 P=0.05, 자유도 고려의 Chi-square 통계치 ≥ Chi-square 실제 검증통계치
- X2의 값은 8.98, 자유도 1로 영가설의 부정확율(significance)은 0.027로, 설정한 유의수준(p<0.05)로 영가설의 기각과 연구가설의 수용
- 결론 : "남성과 여성의 의존매체는 서로 다르다"
2. 측정척도와 통계분석기법의 선택
2.1. 측정척도와 자료분석
2.1.2 측정척도의 종류
|
척 도 |
내 용 |
|
명목 |
- 기호가 개념 자체를 표시
- 척도치는 단지 기호로서의 의미만을 갖고 있어 가감승제 등 일체의 산수적 연산은 불가능
- 수와 수의 차이는 양보다는 질면의 차이를 나타낼 뿐임.
|
|
서열 |
- 크기나 중요성에 따라 측정 결과들의 순위를 설정
- 측정 결과를 서열 순서대로 나열
- 각 수치 사이에 양적인 대소 서열은 유지되나, 계속 두 수치 사이의 간격은 반드시 동일 않음.
- 척도상의 수치간의 거리와 그 수치들이 대표하는 실제상의 거리가 같지 않음.
|
|
등간 |
|
|
비율 |
- 비율의 수치는 크기의 비율을 나타냄.
- 의미 있는 절대 영점을 가진다
|
2.1.2 척도별 자료분석방법과 사례
- 명목척도, 서열척도, 등간척도, 비율척도 순으로 각 척도로부터 얻어진 자료가 담고 있는 정보의 수준이 높아지며, 보다 정밀한 분석방법이 적용됨.
- 비율척도로부터 얻어지는 자료는 거의 모든 분석방법이 적용가능하여, 분석의 속성상 비율척도를 측정하는 것이 양호하지만 속성에 따라 적용가능한 척도가 제한된 경우도 존재함.
- 서열척도보다는 등간척도가, 등간척도보다는 비율척도가 보다 정교한 분석방법을 사용하므로 등간척도 이상의 자료를 얻는 것이 보다 자세한 분석을 할 수 있음.
|
구 분 |
측정 |
척도점에 내포된 가정 |
비교 방법 |
평균측정 |
적용 가능 분석 방법 |
분석사례 |
|
분류 |
순위 |
등간격 |
절대0점 |
|
정성적 자 료 |
명 목 |
○ |
× |
× |
× |
확인 분류 |
최빈값 |
빈도 분석, 비모수 통계, 교차 분석 |
성별 분류, 상품 유형별 분류, 시장세분 구역 분류, 존재유무 |
|
서 열 |
○ |
○ |
× |
× |
순위 분류 |
중앙값 |
서열상관 관계, 비모수 통계 |
상표 선호 순위, 상품 품질 등위, 사회 계층 |
|
정량적 자 료 |
등 간 |
○ |
○ |
○ |
× |
간격 비교 |
산술 평균 |
모수 통계 |
온도, 광고 인지도, 상표 선호도, 주가 지수 |
|
비 율 |
○ |
○ |
○ |
○ |
절대 크기 비교 |
기하 평균
조화 평균 |
모수 통계 |
매출액, 구매 확률, 무게, 소득, 나이 |
2.2 비모수 통계 분석법(non-parametric statistical analysis)
2.2.1 개념
- 모집단의 분포가 명확하지 않거나 모평균과 같은 모수가 존재하지 않은 경우에 이용되는 분석 방법
- 모수통계를 위한 모집단의 분포에 대한 가정이 충족되지 않는 경우와 순위자료나 명목자료를 분석할 경우에 이용.
2.2.2 하나의 변수 (단일 변수)에 대한 분석 방법
|
자료의 형태 |
분 석 방 법 |
|
명목 자료 |
x2-test, run test, binomial test |
|
순위 자료 |
Kolmogoror-Smirnov, one sample test |
2.2.3 2변수 또는 복수 표본에 대한 분석 방법
|
자료의 형태 |
분 석 방 법 |
|
명 목 자 료 |
x2-test, Mcnemar test, Cochran Q test |
|
순 위 자 료 |
Kolmogotov-Smirnov two test , Mann-Whitney U test, Median test, Kruscal-Wallis one-way ANOVA, Friedman two-way ANOVA, kenall, Wald-Worfowitz test, Wilcoxon test, Sign test |
2.3 모수 통계 분석 방법
2.3.1 독립 변수와 종속 변수간의 관계를 분석하는 방법
- 독립변수가 종속변수를 어느 정도 설명 또는 예측해 주는 가에 중점을 둔 분석방법
- 종속변수와 독립변수의 자료형태가 어느 정도 일치되어야 하며, 자료형태가 일치되지 못하면 분석상 오류가 발생함.
|
통계기법 |
독립변수 |
종속변수 |
참고 |
|
상관관계(correlation) |
등간(비율) |
등간(비율) |
독립변수가 명목자료인 경우는 Regression with Dummy Variable을 이용 |
|
회귀분석(regression) |
등간(비율) |
등간(비율) |
|
분산분석(analysis of variance) |
명목 |
등간(비율) |
|
판별분석(discriminant analysis) |
등간(비율) |
명목 |
|
정준상관(canonical correlation) |
등간(비율) |
등간(비율) |
2.3.2 변수들간의 상호 관계를 이용한 분석 방법
- 독립변수와 종속변수가 없고 변수들간의 상호관계를 분석하는 방법들로서 변수와 대상(subjects)의 집단화(grouping)에 초점을 두게 됨.
|
통계기법 |
자료의 형태 |
참고 |
|
요인분석(factor analysis) |
등간(비율) |
순위 자료를 이용하는 방법도 있음 |
|
군집분석(cluster analysis) |
등간(비율) |
3. 통계분석기법의 적용과 해석
3.1. 빈도분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 각 변수 값에 속한 분포의 특성을 찾아내는 분석기법
- 도수분포표, 집중경향치, 분산도, 히스토그램의 구성
|
|
기본원리 |
- 도수분포표 - 빈도, 퍼센트, 유효비율, 누적백분율 등의 도표
- 집중경향치(central tendency) - 최빈값(mode), 중위수(median), 평균(mean)
- 분산도(dispersion) - 범위(range), 변량(variance), 표준편차(standard deviation), 평균의 표준오차(S.E. mean)
|
|
사용방법 |
- 통계분석(S)-> 기초통계(U)-> 빈도분석(U)-> 변수선택-> 통계량(S) -> 계속-> 챠트도표(C)-> 계속-> 형식(F)-> 계속-> 완료
|
|
해석요점 |
- 도수분포표 - 빈도, 퍼센트, 유효비율, 누적백분율 등의 도표
- 집중경향치 - 최빈값, 중위수, 평균
- 분산도 - 범위, 변량, 표준편차, 평균의 표준오차(S.E. mean)
|
3.2. 기술통계분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 자료의 필요통계량을 간단히 산출하는 분석법. 요약통계량과 Z-점수 계산
|
|
기본원리 |
- 기술통계량 - 평균, 표준편차, 최소값, 최대값, 빈도수, 분산, 범위, 평균 표준오차, 왜도, 첨도
|
|
사용방법 |
- 통계분석(S)-> 기초통계(U)-> 기술통계-> 변수선택-> Z Score 고려-> 옵션(o)-> 계속-> 확인
|
|
해석요점 |
- 평균, 표준편차, 최소값, 최대값, 빈도수, 분산, 범위, 평균 표준오차, 왜도, 첨도
|
3.3. 교차분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 범주형 변수인 명목/서열자료의 변수간 상관관계인 독립성과 연관성의 분석
|
|
기본원리 |
- 상관관계의 가설검증 - 카이제곱 검증, phi계수, Cramer V 및 분할계수 사용
- X2의 값 크면 -변수간 상관관계 높고 관찰과 기대빈도간 차이 큼
|
|
사용방법 |
- 통계분석(S)-> 기초통계(U)-> 교차분석(C)-> 변수선택(행,열)-> 통계량(S)-> 계속-> 셀선택(C)-> 계속-> 형식(F)-> 계속-> 확인
|
|
해석요점 |
- 귀무가설 선택, 연구가설 기각 : x2계산치 유의도 ≥ α값(0.05) - 변수간 독립적
- phi계수, Cramer V, 분할계수 - 0.20 이하(경미한 상관), 0.20-0.40(낮은 상관), 0.40-0.70(상당한 상관), 0.70-0.90(높은 상관), 0.90이상(매우 높은 상관)
|
3.4.신뢰도분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 동일개념을 독립 측정방법에 의한 측정결과가 비슷한지의 일관성의 측정
- 설문지의 신뢰성 측정과 요인분석시 추출인자의 신뢰성 측정
|
|
기본원리 |
- 반복측정법 - 동일대상의 반복측정시에 유사/동일한 결과가 있도록 하는 측정
- 측정오차분석법 - 측정상에 측정오차의 정도 파악. 측정오차 적음- 자료신뢰도 증가
- 측정도구검증법 - 신뢰성의 근본 분석
|
|
사용방법 |
- 통계분석(S)-> 척화도분석(A)-> 신뢰도분석(R)-> 변수선택-> 모형(M)선택-> 통계분석(S)-> 계속-> 실행
|
|
해석요점 |
- 알파값 ; 신뢰도계수Cronbach's x값) > 0.6 - 신뢰도 존재
- 해당변수(A) 제거 문자값 > α값 - A변수 제거시 신뢰도 증대
- F값과 확율(P) ; F값 < 유의도(α=0.01, 0.05) - 귀무가설 기각, 연구가설 채택
|
3.5.상관관계분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 분석대상 변수들간의 관련정도, 관계의 방향(정(+)의 방향, 부(-)의 방향), 상관계수에 대한 가설의 검증
|
|
기본원리 |
- Pearson, Spearman의 상관계수(r) ; -1≤r≤1, r=1(완벽상관), r=0(무상관)
- 단순상관관계 - 두 변수간 상관관계, 다중상관관계 - 하나의 변수와 둘 또는 두 개 이상 변수간 상관, 편상관관계 - 제3의 변수 통제하에 순수하게 두 변수간의 상관관계의 표현
|
|
사용방법 |
- 단순/다중상관관계 : 통계분석(S)-> 상관분석(C)-> 이변량 상관계수(B)-> 상관계수,유의성검정 표시-> 옵션(O)-> 계속-> 확인
- 편상관관계 : 통계분석(S)-> 상관분석(C)-> 편상관계수(R)-> 변수선택(V)-> 통제변수(C)-> 옵션(O)-> 통계량선택-> 계속-> 확인
|
|
해석요점 |
- 가설검증 : 귀무가설 상관계수 = 0 - 귀무가설 기각, 변수간 상관관계 존재
- 상관계수 : r=1 완전상관, r=0 무상관, 약한 상관 0.0-0.3, 보통상관 0.3-0.7, r.>0.7 강한 상관
|
3.6.회귀분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- o 종속변수와 독립변수의 관련성의 강도 파악
- o 독립변수 값의 변화에 따른 종속변수 값의 변화를 예측하는 데 사용
|
|
기본원리 |
- 선형의 회귀방정식을 도출하여 종속변수를 예측
- 회귀방정식 ; 단순회귀 - Y(종속변수) = a + b1x(독립변수) + e(오차)
- 다중회귀식 - Y = a + b1x1 + btxt + e
|
|
사용방법 |
- 단순회귀분석 : 통계분석(S)-> 회귀분석(R)-> 선형(L)-> 종속변수(D)-> 독립변수(I)-> 방법(M)-> 케이스 설명(C)-> 분석 선택사항(S)-> 계속-> 확인
|
|
해석요점 |
- 회귀식의 성립여부 판정 : 자유도와 신뢰수준(95%) 계산된 F값> 기준 F값 - 통계적 의의존재(회귀식 성립). 변량분석 F값 < 유의수준 F값 0.05 - 회귀식 성립
- 상관성 : r=1 완전상관, r=0 무상관, 약한 상관 0.0-0.3, 보통상관 0.3-0.7, r.>0.7 강한 상관
- 적합도 : 상관성(multiple)의 제곱값인 적합도(R square) 값 판단
- 통계적 의미변수 : sig t 값 < 0.05 - 독립변수와 종속변수는 통계적 의미존재
- 표준화된 회귀계수(beta)의 절대값이 큰 변수일수록 설명력이 높은 변수
|
3.7. T-검정
|
항 목 |
주 요 내 용 |
|
개 요 |
- 독립된 두 집단간의 평균의 차이가 통계적으로 유의한 지를 검증
|
|
기본원리 |
- T값 (제1평균-제2평균/표준오차)과 자유도를 구한후 가설검증
- 신뢰수준 결정(95%), 신뢰수준의 T값의 T분포표에서 구함. 계산된 T값 > 기준 T값 - 통계적인 유의미한 차이 존재
|
|
사용방법 |
- 통계분석(S)-> 평균비교(M)-> 독립표본 T검정(T)-> 검정변수(T)선택-> 집단변수(G) 선택-> 집단정의(D)-> 계속-> 옵션(O)-> 계속-> 확인
|
|
해석요점 |
- 집단의 동질성 여부판단 : F값> P값(95% 신뢰수준) - 집단이 동질적
- T 검정 : T 검정도 값 <0.05 - 95%의 신뢰수준 귀무가설 기각, 연구가설 채택
|
3.8. 분산분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 두 집단 이상의 평균 차이를 검증하는 데 사용, 일원분산분석과 다원분산분석
|
|
기본원리 |
- 종속변수 전체분산 가운데 독립변수와 함께하는 분산이 어느 정도인지를 측정함.
- 요인분산 분석(두 변수의 분산효과 분석)과 공분산 분석(외생변수 효과 통제와 나머지 집단간 평균차이의 검증)
|
|
사용방법 |
- 일원분산분석 : 통계분석(S)-> 평균비교(M)-> 일원배치 분산분석(O)-> 종속변수(D)-> 요인선택(F)-> 대비(C)클릭-> 계속-> 사후분석(post hoc..)
- 단일요인 분산분석 : 통계분석(S)-> 일반선형모형(G)-> 단순요인 분산분석(S)-> 종속변수(D)-> 요인선택(F)-> 범위지정(E)-> 계속-> 공변량(C)-> 옵션(O)-> 계속
|
|
해석요점 |
- 가설검증 : 귀무가설(u1=u2= --uk) - F값 < 0.05 신뢰수준 95% 귀무가설 기각, 연구가설 채택
- 상호작용(독립변수간 관련성 검증) - F값 > 0.05 95% 신뢰수준 독립변수간 상호작용 존재
|
3.9. 다변량 분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 종속변수가 2개 이상시 종속변수간 평균값의 차이 검증, 독립변수가 어떤 종속변수에 더 많은 영향을 미치는 지 파악
|
|
기본원리 |
- 독립변수의 종속변수에 대한 공헌도와 종속변수들간의 상관관계를 고려하여 분석하는 기법
|
|
사용방법 |
- 통계분석(S)-> 일반선형모형(G)-> GLM-다변량(M)-> 종속변수(D)-> 모수요인(F)-> 공변량(C)-> 대비(N)-> 모형선택(F)-> 계속옵션(O)-> 계속-> 확인
|
|
해석요점 |
- 메노바 모델 성립에 관한 규정 : Pillai 값 이용 - 통계적 의미 존재 - 분석가능
- 분산의 공분산 동질성검증 : Box M값을 F값과 카에제곱값 환찬 > 유의수준(P>0.05) - 산포도 행렬 동질성 구비
- 종속변수에 대한 독립변수의 영향력 검증 : sig. F값 < 유의수준 0.05 - 종속변수는 독립변수에 영향 받음(통계적 의미 존재)
- 종속변수간 상관관계 검증
|
3.10. 판별분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 독립변수의 역학관계를 바탕으로 종속변수(집단구분)를 추정하는 통계기법
- 집단 판별의선형판별함수 생성과 집단구분에 영향 미치는 변수 발견
|
|
기본원리 |
- 정량자료의 독립변수를 이용하여 명목자료의 독립변수집단의 구분시에 오류를 최소화하는 함수 즉 판별식의 발견
|
|
사용방법 |
- 통계분석(S)-> 분류분석(Y)-> 판별분석(D)-> 집단변수(G)-> 범위지정(D)-> 독립변수(I)-> 통계분석(S)-> 분류(C)-> 변수저장-> 확인
|
|
해석요점 |
- Wilks lamda(그룹간 평균차 분석도구) : 평균차가 없음 1, 차이가 큼 0.
- 고유값(Elgen value) : 클수록 좋은 판별함수
- cannonical correlation(eta 값) : 높을수록 판별함수 설명력 증대
- tolerance level(독립변수의 선형적 관계표현) : 크면 독립변수의 추가와 설명력 의미- 신변수 추가
- standardize canonical determinant function coeefient : 평균 0, 표준편차1의 표준판별함수. 종속변수와 가장밀접한 변수의 파악
|
3.11. 요인분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 변수들 상호간의 상호의존도를 분석하여 서로 유사한 변수들 끼리 묶어주는 방법
|
|
기본원리 |
- 변수를 몇 개의 공통요인으로 묶어 자료요약, 변수구조 파악, 불필요한 변수제거, 측정도구의 타당성 검증, 추가분석에 요인점수 인용, 대상을 묶는 데 유용성 등의 기능 제공
|
|
사용방법 |
- 통계분석(S)-> 데이터 축소(D)-> 요인분석(F)-> 변수선택(V)-> 기술통계(D)-> 요인추출(E)-> 요인회전(T)-> 요인점수(S)-> 옵션(O)-> 계속-> 확인
|
|
해석요점 |
- 상관행렬 파악, 공통성(communality)의 추출, 변수들의 공분산 및 고유치
- 고유치 스크리 도표, 회전전의 성분행렬, 회전된 성분행렬, 성분변환행렬, 회전공간의 성분도표 검토, 성분점수 계수행렬
|
3.12. 군집분석
|
항 목 |
주 요 내 용 |
|
개 요 |
- 대상 속성들의 유사한 성향을 바탕으로 동질적인 집단으로 묶어 동일집단내에 속하는 공통특성을 찾음.
|
|
기본원리 |
- 변수들의 유사성 평가시 오류를 피하기 위한 변수선정이 중요한 문제
- 군집화의 공통원칙은 군집내 대상들간 유사성의 극대화, 군집간 유사성은 극소화
- 계층적 군집화 방법이 보편적이며,
|
|
사용방법 |
- 통계분석(S)-> 분류분석(Y)-> 계층적 군집분석(H)-> 변수선택(V)-> 통계량(T)-> 도표(O)-> 방법(M)-> 계속-> 저장-> 확인
|
|
해석요점 |
- 상관계수(coefficient)가 클수록 대상 속성들이 들어 있는 군집간의 이질성이 큼.
| |
댓글을 달아 주세요