통계분석용어
1종오류(一種誤謬: Type I error)
統計的 假說檢定 시 發生할 수 있는 두 가지(一種, 二種) 가능한 誤謬 중의 하나로, 硏究者가 상정한 영가설이 실제로 참임에도 이를 기각할 확률. 예를 들어 모집단에서 집단 간의 평균을 비교하는 경우에 모평균에는 실제로 차이가 없음에도 표본자료의 분석결과 모집단간 차이가 있다고 판단하는 오류를 말한다. 일종오류는 유의도 수준 α에 따라 크기가 결정되므로 α-오류라고도 한다.
2종오류(二種誤謬: Type II error)
統計的 假說檢定 시 발생하는 두 가지(일종, 이종) 가능한 오류 중의 하나로, 연구자가 상정한 영가설이 실제로는 참이 아님에도 이를 참이라고 수용할 確率. 예를 들어, 모집단에서 集團間의 평균을 비교하는 경우에 모집단에서 모평균은 집단 간에 차이가 있음에도, 표본자료의 분석 결과 집단 간에 차이가 없다고 판단하는 오류를 말한다. 이종오류는 일종오류인 α-오류와 대비시켜 β-오류라고도 부른다.
가변수(假變數: dummy variable)
변수가 범주형일 경우 각 범주들을 지칭하기 위해 만들어진 변수로 각 범주에 속하느냐 아니냐에 따라 0이나 1의 값을 갖는 변수. 한 연구에서 변수의 범주가 몇 개냐에 따라 가변수의 개수가 결정되는데 범주의 수(k)에서 하나를 뺀 개수만큼(k-1)의 가변수가 만들어질 수 있다.
가설(假說: hypothesis)
연구 대상인 현상, 또는 모집단의 특성에 대한 잠정적인 진술문. 가설은 아직은 검정되지 않은 상태로서 경험적 증거에 의해 타당하게 지지되면 원리나 이론이라고 불리우게 된다. 한 연구의 가설은 연구 문제에 대해 제안된 아직은 검정되지 않은 잠정적인 해답이라고 할 수 있다.
가설검정(假說檢定: hypothesis testing)
연구자가 수립한 가설의 진위를 경험적 자료에 기초하여 결정하는 추론과정. 과학적 연구에서 가설검정은 주로 통계적 추론절차를 사용하는데 이론이나 선행연구 결과에 근거하여 형성된 개념적 연구가설은 통계적 가설로 전환되어 수식으로 표현된다. 통계적 가설검정에서는 아무런 효과가 없다 혹은 차이가 없다는 모집단의 특성을 나타내는 영가설을 기준으로 제시하고 그것을 기각하거나 수용하기 위해 표본자료를 수집한다. 표본 통계치를 가지고 모집단 가설의 타당성을 확률적으로 추리하여 평가한다.
결정계수(決定係數: coefficient of determination)
한 변수의 전체 변산 중 다른 변수가 설명하는 변산의 비율. 단순상관의 경우에는 상관계수의 자승으로 계산되고, 중다 상관의 경우에는 회귀식에 의하여 설명된 변산의 비율을 계산하면 얻어진다. 따라서 X와 Y 두변수간의 상관 r = .5라면 결정계수는 .25가 되고 X변수가 Y변수의 전체 분산의 25%를 설명한다고 해석하면 된다.
경로계수(經路計數: path coefficient): 전통적 경로분석이나 이론변수를 포함하는 발전된 형태의 경로분석(즉, 구조방정식모형)에서 이론적 개념을 나타내는 변수들간의 관계를 나타내는 계수. 하나의 변수가 다른 변수에 대해서 가지는 효과를 나타내는 계수이며 수학적으로는 회귀계수이다.
경로분석(經路分析: path analysis): 변수들 간에 직접 또는 간접으로 함수적 관계를 가지는 경로의 모형을 방정식으로 또는 그림으로 표시하여 가설화하고, 그 모형을 수집된 자료에 합치시키므로서 경로들이 나타내는 연구 가설들을 검증하는 통계방법. 전통적인 경로분석에서는 표준화된 변수 및 상관행렬을 분석자료로 사용하고 경로의 방향도 일방향이지만 발전적 형태인 구조방정식모형(공분산구조모형)에서는 원래 변수 및 공분산행렬을 분석자료로서 더 선호하며 경로의 방향에 쌍방향도 허용한다.
경험적 연구방법(經驗的 硏究: empirical research method)
과학적 연구방법의 하나로 직접관찰이나 실험실시를 통하여 연구대상 또는 현상에 대한 경험적 자료를 수집하고 분석한 결과를 토대로 연구문제에 대한 해답을 찾는 방법. 경험적 연구에서는 감각적 경험이 포함된 기술과 절차를 사용하여 구체적인 자료를 수집하여 분석하고 그 결과에 기초하여 가설에 대한 검증과 반증을 한다. 경험적 연구는 반복수행이 가능하며 내적, 외적 타당도에 의해 결과의 유용성이 결정된다
공분산분석(共分散分析: analysis of Covariance: ANCOVA)
일반선형모형에 기초한 통계적 기술로서 회귀분석과 분산분석 방법이 결합된 통계적 방법. 실험연구와 비실험연구 모두에서 유용하다. 실험연구에서 공분산분석은 매개변수에 대한 직접적인 실험적 통제가 불가능하거나 비현실적인 경우 실험실시 후에 매개변수의 효과를 통계적으로 통제하는 방법이다. 관찰연구에서는 가외변수들에서의 차이 때문에 자연적으로 발생하는 종속변수에서의 집단 간 차이를 제거할 수 있다. 두 개 이상의 양적 변수들과 범주변수가 함께 포함된 연구의 경우, 양적 변수들 간의 관계를 알아보기 위해 범주 변수를 통제하는 회귀분석의 일종으로도 수행할 수 있다.
교차타당화(交差妥當化: cross validation)
검사문항의 선정, 채점지침의 작성, 문항점수 또는 검사점수의 해석에서 검사개발시에 사용한 표본집단 이외의 표본집단에 검사를 실시하여 검사의 통계학적, 측정학적 속성을 재검토하는 작업. 교차타당화는 검사의 측정학적 속성이 피험자 집단의 변화에도 불구하고 어느 정도 원래 측정치의 성질을 유지하는가에 관한 정보를 제공한다.
구인타당도(構因妥當度: construct validity)
검사가 본래 의도한 측정대상인 이론적 구인이나 특질을 어느 정도 적절히 측정하는가에 대한 정보를 나타내는 타당도. 구인타당도의 증거를 제시하는 것은 지속적인 과정이며, 구인타당도는 측정대상인 특질에 대한 이론적 배경에서 비롯된 다양한 예측에 따라 검사점수가 어느 정도 검사개발자의 예측을 만족하는가로 제시된다. 구인타당도를 성취하는 과정은 다양한 조건에서 측정대상인 특질의 이론적 배경을 만족하는 경험적 증거들을 축적하는 과정이다. 일반적으로 검사개발자들이 구인타당도를 제시하는 방법은 상이한 피험자 집단 간의 차이, 검사점수의 변화에 대한 증거, 외적 준거와의 상관에 대한 증거, 검사문제 해결과정에 대한 증거 등이 이론적 예측과 일치하는 가로 제시한다.
구조방정식 모형(構造方程式 模型: structural equation model)
복수의 관찰변수와 잠재변수(latent trait)들 간의 구조적 관계를 파악하는 통계모형으로서 사회과학 분야에서 활용되는 일반선형모형. 구조방정식 모형은 관찰변수들간의 공분산과 잠재변수들 간의 공분산을 모형의 명세화 과정에서 허용하며, 관찰변수들의 측정오차도 모형(즉, 측정모형)의 명세화에서 허용하여 측정오차 분산을 관찰분산에서 분해함으로써, 모형 (즉, 구조방정식 모형)에 명세화된 잠재변수들 간의 구조적 관계를 보다 정확히 추정하는 장점이 있다. 또한 구조방정식 모형은 요인분석, 분산분석, 회귀분석, 경로분석 등을 모형의 특수한 형태로 포괄하는 일반선형모형이다. 구조방정식 모형은 공분산구조모형, 공분산구조분석 모형으로도 불리우며, 교육학, 심리학, 사회학 등에서 제시된 복잡한 이론을 경험적으로 검정하는데 활용된다. 구조방정식 모형을 활용하는 통계 프로그램은 LISREL, EQS, AMOS, LISCOMP 등 다양하게 있으며, 현재는 SPSS와 SAS에도 프로그램으로 포함되어 있다.
군집분석(群集分析: cluster analysis)
관찰대상인 개체들을 유사성에 근거하여 보다 유사한 동류집단으로 분류하는 다변량 분석 기법. 군집분석을 통하여 동일집단으로 분류된 개체들은 공유하는 특성이 유사한 것으로 해석되며, 통계학적 방법은 집단내 개체들간의 유사성을 개체내 변수들간의 상관계수, 개체간의 거리, 확률적 유사성 측정치 등을 활용하여 측정하고, 이에 기초하여 개체들을 유사한 동류집단으로 분류하는 것이다. 통상적으로 군집분석은 많은 개체들을 소수의 군집으로 분류하는 Q-분석에 속하며, 개체들의 소속집단이 알려진 다음에 소속집단을 결정하는 변수를 탐색하는 판별분석과는 달리, 개체들의 다양한 특성(즉, 변수)들 사이의 관계를 분석하여 동류의 집단들로 분류하는 기능을 한다. 또한 요인분석이 다양한 변수들을 소수의 변수묶음으로 단순화하는 반면에, 군집분석은 변수가 아니라 개체를 소수의 집단으로 분류한다. 군집분석은 개체들의 분류체계를 수립하는 경우, 개체를 유사집단으로 분류하는 유용한 개념적 틀 또는 기준을 탐색하는 경우, 기존의 분류기준의 적절성에 대한 가설검정을 하는 경우에 유용하게 활용된다.
군집표집(群集標集: cluster sampling)
모집단에서 표본을 무선적으로 추출하는 확률표집방법 중의 하나로서, 모집단이 위계적 구조를 갖거나, 모집단의 개체들이 상위조직에 속하는 경우에 확률표집단위를 각 개체 (또는 개인)로 하지 않고 개체가 속한 집단 또는 조직체로 하며, 표집된 조직체의 구성원은 모두 표본에 포함하는 무선표집방법.
기술통계학(記述統計學: descriptive statistics)
실제 현상을 요약하고 설명하기 위하여, 수집된 자료를 요약하거나 조직화하고 기술하는 통계적 방법을 총괄하는 것으로 수집된 자료의 특성 및 변수들 간의 관계에 대한 정보. 기술통계학에서는 평균, 표준편차, 상관계수 등의 통계량으로 자료분포의 특성을 기술하는 방법과 도수분포, 히스토그램, box-plot, stem-and-leaf, 산포도 등의 그림으로 자료의 특성을 요약하는 방법이 있다.
내용타당도(內容妥當度: content validity)
검사가 측정대상인 심리적 특성의 내용이나, 교과내용 또는 학습내용의 전집을 얼마나 적절히 반영하는가를 나타내는 검사의 양호도 정보. 내용타당도는 특히 성취도 검사에서 강조된다. 성취도 검사가 내용타당도를 확보하는 방법은 교육목표 명세화표를 검사문항의 작성과정과 검사문항편집과정에서 활용하는 것이며, 검사문항이 측정대상인 내용을 측정하는가에 대한 교과내용 전문가들의 논리적 판단이 일치하는 정도로 내용타당도를 표현한다. 심리검사에서 내용타당도는 이론적 배경에 근거를 두고 문항을 작성하여 관련전문가들의 검토결과가 일치하는 정도로 확보할 수 있다.
내적타당도(內的妥當度: internal validity)
연구결과에 대한 해석 또는 의미부여의 적절성을 반영하는 연구의 양호도 정보로서 연구결과의 해석이 연구전체의 절차나 내용전개에서 논리적으로 결함이 없는가를 판단하는 정보. 내적타당도는 실험연구에서 강조되며 독립변수 또는 처치변수의 종속변수에 대한 효과 또는 영향에 따른 잡음변수의 개입가능성을 적절히 통제 하였는 가로 판단한다. 내적타당도는 외적타당도와 대비된다.
논술검사(論述檢査: essay test)
피험자의 인지적 능력을 측정하기 위한 검사로서 특히 분석력, 종합력, 창의력 등의 고등정신능력을 측정하기 위한 검사. 논술검사는 답안의 기대내용에 대한 지침을 제공하는 제한형과 답안의 기대내용에 대한 지침이 없이 피험자가 답안을 작성하는 개방형이 있다. 논술검사를 학업성취도 검사로 사용하는 경우에는 검사문항의 수가 제한되어 내용타당도에 결함이 있으며, 측정대상인 구인의 정의가 모호한 단점이 있다. 논술검사의 채점에는 분석적 방법과 총체적 방법이 있으며, 객관식 검사와는 달리 검사점수에 채점자의 주관이 개입될 가능성이 높다.
다변량분산분석(多變量分散分析: multivariate analysis of variance: MANOVA)
추리통계학에서 종속변수가 두 개 이상인 경우에 종속변수들의 평균벡터의 차이로 집단간의 차이를 검정하는 통계적 기법. 다변량 분산분석은 하나의 종속변수의 평균에 대하여 집단간의 차이를 검정하는 분산분석(Analysis of Variance: ANOVA)을 복수의 종속변수에 대한 집단 간의 차이를 검정하는 것으로 일반화한 방법이라고 할 수 있다. 즉 복수의 집단평균을 동시에 비교하는 통계적 기법이다. 다변량분산분석은 복수의 종속변수를 동시에 비교하는 효과뿐만 아니라, 복수의 종속변수가 상관이 있는 경우에는 종속변수간의 상관을 자료분석에 반영하며, 복수의 종속변수를 보다 적은 수의 요인으로 제시하려는 경우, 복수의 종속변수 중에서 집단간의 차이를 변별하는 종속변수를 선정하려는 경우에도 활용된다. 복수의 종속변수가 상호 독립인 경우에도 MANOVA는 제1종 오류의 수준을 연구자가 설정한 수준에서 통제하는 효과가 있다.
다차원 척도법(多次元 尺度法: multidimensonal scaling)
자료의 구성원인 개체들을 다차원공간상에서의 척도에 위치시키고, 개체들간의 유사성, 근접성등을 측정하여 개체들 간의 숨겨진 구조적 관계를 파악하여 소수의 차원으로 설명하거나, 구조적 관계에 대한 이론적 의미를 부여하는 방법. 개체들 간의 구조적 관계는 곧 다차원척도법에 의하여 밝혀진 소수의 차원으로 설명되며, 동일차원에 속하는 변수들은 척도를 개발하는데 활용된다.
단변량분석(單變量分析: univariate analysis)
통계학에서 자료를 분석하는 경우에 기술통계학에서는 기술대상인 변수가 하나이고, 추리통계학에서는 종속변수가 하나인 경우를 의미한다. 흔히 기술통계학에서 단변량분석은 한 가지 변수의 특성을 요약하고 설명하기 위하여 그 변수의 분포, 집중경향치 등을 구하는 것을 의미하며, 추리통계학에서는 하나의 종속변수를 설명하기 위한 다양한 통계적 방법에 의한 자료분석을 총괄한다. t-검정, 분산분석(ANOVA), 회귀분석(Regression) 등에 의한 자료분석은 단변량분석에 해당한다. 단변량분석의 상대적 개념을 나타내는 용어는 다변량분석이다.
단일집단연구설계(單一集團硏究設計: single-subject research design)
통제집단 없이 단 하나의 실험 집단만을 두는 설계. 이 설계에는 한 피험자 집단에게 처치를 가하고 이에 따른 피험자의 행동을 관찰하여 실험처치의 효과를 평가하는 단일사례연구법(one-shot case study)과, 한 피험자 집단에게 처치를 가하기 전과 후에 피험자의 행동을 관찰하는 단일집단 사전 사후 연구법(The one-group pretest-posttest design)이 있으나, 대체로 인과관계를 밝히는 데 목적을 둔 과학적인 연구설계라고 보기 어렵다.
델파이 방법(델파이 方法: delphi technique)
전문가 집단의 의견과 판단을 추출하고 종합하기 위하여 동일한 전문가 집단에게 설문조사를 단계별로 실시하여 집단의 의견을 종합하고 정리하는 연구기법. 이 방법의 연구기법으로서의 타당성은 계량적 객관의 원리와 민주적 의사결정의 원리를 활용한다는 것에 논리적 근거를 두고 있다. 이 방법은 체계적으로 구성된 일련의 설문지를 동일한 사람에게 3~4회 반복실시하게 되는데 , 각 회의 설문지를 전회의 설문조사 결과에 대한 보고와 함께 제시함으로써, 설문조사 응답자에게 다른 사람들의 정보와 의견이 환류될 수 있도록 고안된 방법이다. 설문의 횟수가 거듭될수록 예측 혹은 응답결과가 서로 접근하게 되므로 참가자들이 시간과 공간의 제약을 받으며 직접 모여 논쟁을 하지 않고서도 집단성원의 합의를 유도해낼 수 있는 조사방법이다.
등간척도(等間尺度: interval scale)
척도의 한 유형으로서, 점수의 단위들이 척도상의 모든 위치에서 동일한 값을 지니는 척도. 예를 들어, 학업성취도에서 90점과 100점 사이의 10점의 크기는 50점과 60점의 10점의 차이와 같다. 동간척도에서는 가감의 연산이 가능하므로 다른 척도로의 변환이 용이한데다, 일반적으로 흔히 사용되는 통계들이 측정의 동간성을 가정하고 있기 때문에 심리학자나 교육학자들은 동간척도를 얻는데 관심이 많다.
리커트척도(리커트尺度: Likert-type scale)
특정대상에 대한 개인의 태도 즉, 생각, 지각, 감정 등을 측정하는 데 사용되는 척도의 한 유형으로서 1930년대 초 Resis Likert에 의해 개발된 척도임. 피험자는 측정대상(예:체벌)에 대한 태도를 측정하는 것으로 간주되는 일련의 문항들에 대해 “강한 찬성, 찬성, 중간, 반대, 강한 반대” 등의 다섯가지 눈금 중 하나에 자신의 견해를 표시하게 되고 이 결과 각 문항의 눈금치의 총점 혹은 그것을 문항수로 나누어 얻은 평균값을 특정 대상에 대한 개인의 태도 점수로 보는 것이다. 대체로 눈금은 4개에서 7개 사이가 많이 쓰이나 응답자의 지적 수준이나 문항에 대한 친숙도 수준이 낮을 경우는 눈금의 수가 적은 것이 더 신뢰로운 결과를 얻을 수 있다.
매개변수(媒介變數: intervening variable)
변수들 간의 함수적 관계를 설명할 때, 두 변수간의 사이에서 앞의 변수와 뒤의 변수를 연계하는 변수. 실험연구에서는 연구 대상이 되는 독립변수와 종속변수 사이에서 작용하여 종속변수에 영향을 미치는 피험자의 심리적 특성과 같은 가설적인 개념이다. 예로서 A→B→C에서 B가 매개변수로서, A의 효과가 B를 거쳐서 C에 전달되고 있다. 물론 A가 C에 직접 연결될 수도 있다. 그러나 전체적으로 또는 부분적으로 A의 움직임은 일단 B에 효과를 미치고, 이어서 B가 C에 미치는 효과가 발생할 때 B는 A와 C사이에 매개변수이다. 만일에 A가 C에 미치는 효과, 즉 A→C가 B의 수준(예: 성차이, 나이차이 등)에 따라 달라지면 B를 조절변수(moderator)라고 하는데, 방법론에 비전문적인 영미문헌에서 이 글에서의 매개변수와 조절변수를 통털어서 "intervening variable"로 기술하는 경우가 있는데 정확한 기술은 아니다.
면접(面接, interview)
연구에서 알아내려는 내용을 연구대상자들에게 직접 질문하여 얻은 자료를 분석하는 연구 방법. 대상자들에게 직접 질문하여 자료를 수집하기 때문에 질문하는 방법에 따라 몇 가지 유형으로 구분된다. 면접시 질문내용을 미리 결정하여 제시하는 구조화된 면접방법과 면접 진행상황에 따라 질문의 내용을 신축적으로 조정하는 비구조화 면접이 있다. 또한 면접 인원과 관련하여 개인 대 개인, 개인 대 집단, 집단 대 개인, 집단 대 집단 면접 방법이 있을 수 있으며, 상황에 따라서는 전화면접도 가능하다. 면접법은 면접자의 주관적 판단이 개입될 여지가 많기 때문에 자료 수집과 결과 해석의 객관성을 유지하기 위한 특별한 노력이 필요하다. 어떤 형태의 면접이라도 그 면접이 가치가 있기 위해서는, ① 면접을 통해서 신뢰할만한 평정이 나올 수 있는가? ② 면접으로부터 알아보려는 내용이 꼭 면접에 의해서만 얻을 수 있는 정보인가? ③ 측정도구로서의 면접의 타당성은 어느 정도인가? 등이 사전에 ‘면접’ 사용에 대한 중요한 평가기준으로 고려되어야 한다.
명목척도(名目尺度: nominal scale)
측정대상의 속성을 질적인 특성으로 구분하는 척도. 명명척도는 질적 척도이기 때문에 척도의 수치가 측정대상의 크기나 순서를 나타내지 않고 단지 속성을 구분하기 위한 목적에서 사용한다. 예를 들어, 사람을 남자, 여자로 나누거나 종교를 기독교, 불교, 유교, 등으로 구분하여 명명하여 척도로 사용하는 경우를 말한다.
모수적 통계검정(母數的 統計檢定: parametric statistical tests)
추리통계에서 모집단의 특성인 모수(parameter)에 대한 추리를 할 때, 모집단의 분포에 대한 가정을 포함하는 통계적 방법. 교육 및 심리연구에서는 대부분의 모집단의 분포는 정규분포를 가정한다. 모수적 통계방법은 모집단의 분포에 대하여 가정을 하지 않는 비모수적 통계검정(non-parametric statistical tests)과 대비되는 검정방법이다. F 검증, t 검증, 정상분포에 의한 Z 검증 등의 통계적 방법이 모수적 통계검정에 해당된다.
모집단(母集團: population)
얻어진 통계치의 의미를 일반화하여 적용하고자 하는 전체 집단. 연구자의 관심이 그 범주를 결정한다. 예를 들어 특정 연도의 모 초등학교 6학년 1반 학생들을 대상으로 하는 특정 현장연구에서의 관심 대상은 그 학급에 제한되며, 이 학급이 유한전집이다. 그러나 국제비교 연구에서 6학년 학업성취도 비교를 하고자 한다면 무한전집을 상정해야 할 것이다. 앞의 두 예는 실재하는 전집의 예이다. 그러나 모 초등학교에서 실시하는 컴퓨터 개별수업을 이수하는 6학년 학생이라면, 과거부터 미래까지 있을 수 있는 가상적 학생들을 포함하는 가상적 무한전집을 상정해야 할 것이다. 전집의 구성 요소를 모두 분석할 경우에는 기술통계로써 연구자의 관심을 충족시킬 수 있지만, 전집의 부분집합을 표집하여 분석한 경우에는 추리통계를 거쳐야 연구자의 관심을 충족할 수 있다.
무작위표집(無作爲標集, random sampling)
모집단의 모든 개체가 표본에 포함될 확률이 동일하고 또한 각 개체의 표집시행간에 상호독립이 보장되는 표본 선정 절차. 모집단을 잘 대표하는 표본을 얻는 데 효과적인 방법이다. 무선표집에 의하여 얻어진 무선표본 자료의 분석결과는 모집단 전체에 일반화가 가능하다. 무선표집에는 단순무선표집(simple random sampling), 층화무선표집(stratified random sampling), 그리고 군집표집(cluster sampling)이 있다.
문항분석(問項分析: item analysis)
검사문항의 제반 기능을 평가하는 작업. 문항분석은 검사문항의 기술적 특성(technical characteristics)을 밝히는 작업으로서 일반적으로 문항의 곤란도, 변별도, 문항의 차별기능, 정답 추측도, 오답에 대한 반응유형의 정보들을 밝히는 작업이다. 문항분석은 전통적 방법과 문항반응이론을 활용한 방법이 있다.
변수(變數: variable)
속성에 따라 여러 수준으로 분류할 수 있거나 다양한 값을 취할 수 있는 사건, 사물, 현상을 나타내는 개념. 변인이라고도 한다. 변수는 지니는 속성을 수량화 할 수 있느냐의 여부에 따라 양적, 질적 변수로 구분하며, 주어진 범위 내에서 어떠한 값이라도 취할 수 있는지 아니면 단지 몇 개의 유목으로만 구분되는지에 따라 연속, 비연속변수로 구분한다. 그리고 한 연구에서 변수 상호간의 관계양상에 따라 독립, 종속변수로 구분한다.
부분상관(部分相關: partial correlation)
세 개이상의 변수들이 상호상관을 갖는 경우에, 그 중에서 두 변수만의 고유한 관계를 측정하기 위한 상관. 예를 들어, 변수 X1, X2, Y가 상호상관을 갖는 경우에, X2와 X1의 상관과 X2와 Y와의 상관을 배제한 후에 X1과 Y가 갖는 고유상관을 부분상관이라 하며 편상관이라고도 한다. 부분상관은 회귀분석에서 회귀계수의 추정에 사용되므로 중다회귀분석에서의 회귀계수는 부분회귀계수(partial regression coefficient) 또는 편회귀계수라고도 한다.
분산분석(分散分析: analysis of variance/ ANOVA)
R. A. Fisher가 1923년에 보고한 분산의 근원을 밝히고 분할하고 통계적 유의도 검정을 하는 방법. 변량분석이라고도 한다. 분산을 분석하지만 실제적으로는 평균치들의 차의 유의도 검정에 사용된다. 분산분석의 검정통계량은, 집단간 분산과 집단내 분산의 비율인 F통계량(F = 집단간 분산/집단내 분산)이다. 집단내 분산보다 집단간 분산이 의미있게 클 때 처치효과가 나타난다. 집단간 분산이란 각 집단의 평균치가 전체 평균으로부터 얼마나 이탈해 있는가를 나타내는 것이고, 집단내 분산이란 각 사례의 점수가 자신이 속한 집단의 평균치로부터 얼마나 이탈해 있는가를 나타내는 것이다. 한 개의 독립변수와 한 개의 종속변수가 있을때는 일원분산분석, 두 개의 독립변수와 한 개의 종속변수가 있을때는 이원분산분석, 그리고 독립변수가 증가함에 따라 다원분산분석을 적용해 자료를 분석한다.
분석단위(分析單位: unit of analysis)
자료수집 시 표본의 크기를 결정하는데 사용되는 기본단위. 분석의 단위는 표본자료의 분석을 어느 수준에서 하느냐와 밀접한 관련이 있다. 예를 들어, 10개 집단에 각각 20명의 학생이 포함된 표본의 경우에, 집단수준에서의 분석의 단위는 집단으로서 이 경우에 표본의 크기는 10이 된다. 그러나 개인수준에서의 분석의 단위는 개인으로서 표본의 크기는 200 이다. 분석의 단위는 흔히 실험단위(experimental unit)와 관찰단위(observational unit)의 개념으로 분리되는데, 자료수집단계에서 표본의 크기를 결정하는데 사용되는 분석단위는 관찰단위이며, 자료분석단계에서 분석단위간의 상호 독립성을 보장하는 기본단위는 실험단위라고 한다.
분포(分布: distribution)
하나의 변수에 대한 전체 관찰치나 자료의 집합. 통계학에서의 분포는 확률변수의 분포를 뜻함. 확률변수는 이산형과 연속형 두가지가 있으며, 확률변수는 분포형에 따라 여러 가지가 있다. 즉 이산확률변수의 분포는 2항분포, 포아송분포, 기하분포 등이 있으며, 연속확률변수의 분포는 정규분포, 지수분포, 감마분포, 그리고 베타분포가 있다.
비모수통계검정(非母數統計檢定: nonparametric statistical test)
비모수통계검정은 모집단의 형태나 모집단 모수치에 관한 가정이 필요없는 방법으로, 모집단의 정상성에 의심이 갈 때 사용되는 통계적 검정 방법. 분포무관방법(distribution-free methods) 혹은 자유분포통계검증이라고도 불린다. 명명척도나 서열척도, 그리고 표본이 작은 경우 등 모수적 방법을 적용하기에 곤란한 자료를 분석하는데 유용하다. 흔히 사용되는 세 가지 비모수통계검정으로는 순위(서열)에 기초한 Mann-Whitney검정과 Kruskal-Wallis검정, 그리고 기호검증법 등이 있다.
비율척도(比率尺度: ratio scale)
가장 고급 수준의 척도로서 명명, 서열, 동간척도의 특성을 모두 포함하고 있으며, 또한 절대 영점을 갖고 있어, 모든 산술적 연산(가감승제)이 가능한 척도. 예를 들어, 길이, 무게, 거리 등을 측정하는 척도들이 그것이다.
사례연구(事例硏究: case study)
특정한 개인이나 집단 또는 기관을 대상으로 어떤 문제나 특성을 심층적으로 조사하고 분석하는 연구. 소수의 연구 대상을 선정해서 필요한 각종 정보나 자료를 여러 가지 방법으로 수집하고, 이러한 자료들을 기초로 하여 연구 대상이 가지고 있는 특성이나 문제점을 종합적으로 진단하고 기술하는 연구이다.
사전검사(事前檢査: pretest)
처치가 가해지기 전에 어떤 변수를 측정해 보는 것. 사후검사에서 나타난 변화가 실험처치의 효과임을 입증하기 위해서는 실험처치 전에 사전검사를 실시하여 연구집단의 특성을 파악해 볼 필요가 있다. 그러나, 사전검사를 받은 경험이 사후검사의 결과에 영향을 미치게 된다면 연구의 내적 타당도가 위협받게 된다.
사전사후검사설계(前後檢査設計: pretest-posttest design)
실험 처치를 전후하여 검사를 실시하여 처치효과를 검정하기 위한 연구 설계. 실험집단만으로 설계된 경우인 단일집단 전후검사 설계, 실험집단과 통제집단이 있되 동질적인 집단이 되도록 통제되지 않은 경우인 이질집단전후검사 설계, 그리고 동질적인 집단이 되도록 통제된 경우는 통제집단전후검사 설계 등이 포함된다. 전자 둘은 준실험설계로서 내적 타당성이 취약하나 후자는 통제된 실험설계로서 내적타당성의 저해요인이 대부분 극복된 연구 설계이다.
사후분석(事後分析: post-hoc analysis/follow-up tests)
전반적 F 검정이 유의할 경우 개별평균들에 대한 추가분석 과정으로서 어느 평균간에 유의한 차이가 있는지 검정하는 과정. 일반적으로 Turkey의 HSD 방법, Scheffé 검정, Duncan 검정 등이 있으며 실험전체의 유의도 수준을 전반적 F 검정에 준하여 설정하여 일종오류를 통제하는 특징을 가지고 있다.
산포도(散布度: scatter plot)
상관연구에서 사용되는 일종의 도표로서, 도표의 가로축과 세로축에 X변수와 Y변수를 설정하고 각각의 X 값에 해당되는 Y 값을 도표 상에 점으로 표시하여 X와 Y의 상관정도를 추정할 수 있는 도표. 흔히 상관도표라고 하며 점들의 집락이나 흩어진 정도를 통하여 두 변수 X, Y간의 관련성을 알 수 있다.
상관계수(相關係數: correlation coefficient)
두 변수 X, Y간의 관계의 정도를 나타내는 지수의 통칭. 흔히 상관계수라고 할 때는 Pearson의 적률상관계수를 가리킨다. Pearson의 적률상관계수는 두 연속변수가 선형관계를 보일 때, 두 변수가 얼마나 직선적으로 관계되어 있는가의 정도를 나타내고, 기호는 표본 상관은 r로, 모집단 상관은 ρ로 표시한다. 상관계수는 두 변수간의 관계의 정도만을 표시할 뿐 인과관계를 나타내지는 않으며, 크기는 -1에서 1까지이다. 부호가 +인 경우는 정적 상관을 나타내고, -인 경우는 부적 상관을 나타낸다.
상관방법(相關方法: correlation method)
변수들 간의 관계적 속성을 알아보기 위해 수행하는 자료 분석 방법. 상관연구에서 변수간 상관의 정도를 조사할 때 변수의 성격(명목척도, 서열척도, 등간척도, 비율척도)에 따라 상관의 추정방법이 달라진다. 상관방법에는 Pearson의 적률상관을 비롯하여 Spearman의 등위상관, 점이연상관(point-biserial correlation), 이연상관(biserial correlation), phi(φ) correlation 등이 있다.
상관연구(相關硏究: correlational study)
어떤 사건이나 현상에 내재되어 있는 여러 변수들간의 관계의 속성을 규명하는데 역점을 두고 실시하는 연구 방법. 수집한 자료들을 가지고 다양한 상관계수를 산출하여 관계의 속성(예를 들어, 정적/부적 관계, 직선적/곡선적 관계, 관계의 정도)을 통계적으로 기술하고 해석하는 데 초점을 두고 있다.
상호작용효과(相互作用効果: interaction effect)
독립변수가 둘 이상인 분산분석에서 주효과의 조합에 의한 효과로서, 두 개 이상의 변수가 특이하게 결합되어 그들이 각각 독립적으로 갖는 영향력 이상의 어떤 효과를 가져 오는 상태를 말한다. 상호작용이 나타나면 주효과의 검정 결과에 대한 해석은 제한되어야 한다.
생태학적 타당도(生態學的 妥當度: ecological validity)
실험결과를 얻은 환경적 조건으로부터 다른 환경적 조건으로 일반화할 수 있는 정도. 실험처치 효과가 제한된 조건하에서만 얻어질 수 있다거나 원래 그 실험을 행했던 연구자에게서만 얻어질 수 있고 연구결과가 현실을 잘 설명하지 못하는 경우 그 연구결과는 생태학적 타당도가 낮다고 볼 수 있다.
서열척도(序列尺度: ordinal scale)
측정 대상인 사물이나 현상을 분류하고 명칭을 부여할 뿐 아니라 나아가서 측정 대상의 속성이 크고 작음, 또는 많고 적음 등의 정도에 따라 서열을 정하거나 순위를 매긴 척도. 예를 들어 성적 순위, 인기가요 순위, 사회경제적 지위, 교육 정도 등이 있다.
선형회귀분석(線型回歸分析: linear regression analysis)
선형성이라는 기본 가정이 충족된 상태에서 독립변수와 종속변수의 관계를 설명하거나 예측하는 통계 방법. 독립변수가 하나인 경우를 단순회귀분석, 여러 개인 경우를 중다회귀분석이라고 한다. 즉 회귀분석에서 독립변수에 따라 종속변수의 값이 일정한 패턴으로 변해 가는데, 이러한 변수간의 관계를 나타내는 회귀선이 직선에 가깝게 나타나는 경우를 선형회귀분석이라고 한다.
설문지(設問紙: questionnaire)
일련의 질문들을 체계적으로 담은 작은 책자 또는 서류 형식. 질문지 또는 앙케이트라고도 한다. 설문지법이란 미리 작성된 설문지를 응답자에게 주고 이에 대한 응답을 통해 자료를 수비하는 조사연구이다.
솔로몬4집단설계(솔로몬4集團設計: Solomon four-group design)
사전검사의 영향과 실험처치에 의한 영향이 상호작용하여 실험의 외적 타당도를 낮추고 실험결과의 일반화를 저해하는 것을 막기 위해서 Solomon에 의하여 고안된 실험계획법. 가능한 모든 매개변수를 통제하기 위한 설계로서 A, B, C, D 4개의 집단을 모두 무선으로 선정하고 A, B 집단은 사전측정을 하며 C, D집단은 사전측정을 하지 않는다. 또한 A, C집단은 실험처치를 하고 B, D 집단은 실험처치를 가하지 않는다. 이 방법은 다른 실험설계법에서는 불가능한 각종 매개변수의 영향을 완벽히 분리해 낼 수 있지만, 설계가 복잡하고 집단의 수가 많기 때문에 집단간의 격리에 어려움이 있고 많은 시간과 비용이 든다.
순서효과(順序效果: order effect)
동일한 피험자에게 둘 이상의 실험처치를 할 때 어떤 처치를 먼저 했느냐에 따라 생길 수 있는 반응에서의 효과. 순서효과는 모든 실험조건들에 순서효과를 동등하게 분배함으로써 통제할 수 있다.
시계열분석(時系列分析: time-series analysis)
동일한 현상을 시간의 경과에 따라 일정한 간격을 두고 반복적으로 측정하여 각 기간에 일어난 변화에 대한 추세를 알아보는 방법. 시간의 경과에 따라 연속적으로 측정된 관측값의 계열을 말하는 것으로써 동일한 시간 간격으로 측정한다. 시계열분석의 특징은 같은 시간 간격에 걸쳐 순서적으로 배열된 관측값으로 반드시 시간 순서에 의해 관측값을 분석해야 한다.
신뢰구간(信賴區間: confidence interval)
전집(population)의 평균은 표본의 평균을 바탕으로 추정되는데, 이때 전집의 평균을 포함하고 있으리라 확신하는 구간. 예를 들어, 연구자가 95%의 신뢰구간을 설정했다면, 전집의 평균이 이 구간 내에 포함될 수 있는 가능성이 95% 정도임을 의미한다. 신뢰구간은 전집의 모수치에 대한 최하위값과 최상위값으로 표현되는데, 이때 신뢰구간의 최하위값과 최상위값을 결정하는 위치를 신뢰한계라고 한다.
신뢰도(信賴度: reliability)
동일한 대상을 반복적으로 측정할 때 같은 결과를 가져올 수 있는 정도로, 측정하고자 하는 특성을 오차없이 정확하게 측정하는 정도. 만약 어떤 척도를 이용하여 동일한 대상을 반복 측정하였을 때 항상 같은 결과가 나온다면 이 척도는 신뢰도가 매우 높다고 할 수 있다. 신뢰도는 측정의 안정성, 일관성, 정확성과 관련이 되는 것으로, 신뢰도를 추정하는 방법으로는 검사-재검사 신뢰도, 동형검사 신뢰도, 반분검사 신뢰도, 문항내적합치도 등이 있다.
실험연구(實驗硏究: experimental research/experimental study)
어떤 사상(事象)이 일어나기를 기다리지 않고 사상을 인위적으로 일어나게 해서 자료를 수집하는 연구 방법. 인위적으로 연구할 사상을 원하는 조건과 시기에 관찰한다는 점과 통제된 상황에서 관찰함으로써 관찰하는 상황에 영향을 주는 요인을 쉽게 확인할 수 있어 인과관계를 밝혀내기 적합한 연구 방법이다. 그러나 실험에서 사용되는 상황이 지나치게 인위적이어서 연구 결과를 실제 장면에 적용하는데 문제가 있을 수 있다.
실험집단(實驗集團: experimental group)
실험연구에서 실험 처치를 받는 집단. 실험 처치를 받지 않고 비교 대상이 되는 통제집단(control group)과 대비되는 집단이다.
실험적 통제(實驗的 統制: experimental control)
실험을 할 때 변수들간의 관계를 명확히 규명하기 위하여 변수들을 체계적으로 조작하는 것. 실험적 통제에는 두 가지 유형이 있는데 독립변수를 통제하는 방법과 외재변수를 통제하는 방법이 있다. 전자는 독립변수를 변화시키는 방법이고, 후자는 제3의 변수의 영향력을 제거하여 실험외적 변수가 아닌 독립변수들의 조작에 의해 실험결과가 나온 것으로 확증할 수 있도록 하는 실험조작기법이다.
알파수준(알파水準: alpha level)
가설검정에서 영가설이 실제로 참임에도 불구하고 실수로 영가설을 기각할 확률인 제1종 오류의 수준. 유의수준(significance level)이라고도 한다. 알파수준은 심각한 오판을 내릴 확률로서 영가설을 수용할 것인지 기각할 것인지를 결정하는 기준이 된다. 알파수준을 결정하는 것은 연구자의 이론적, 경험적 배경에 의존하지만 사회과학에서 많은 경우에 확률 p=.01 또는 .05로 설정한다.
양방검정(兩方檢定: two-tailed test)
가설검정에서 대립가설이 제시하는 효과나 차이에 대한 결과가 일정 방향을 명시하지 않는 검정. 영가설이 ‘모집단의 평균이 어느 수와 같다’ 혹은 ‘두 모집단의 평균이 같다’와 같이 설정된 경우, 대립가설은 ‘같지 않다’로 설정된 것으로 어떻게 같지 않느냐에는 관심을 두지 않고 기각역을 양쪽으로 두고 가설검정을 하는 방법을 말한다.
양적 연구(量的硏究: quantitative research)
실증주의에 입각해 다량의 객관적인 자료와 절차에 의해 증명 가능한 원리를 발견하는 것을 목적으로 하는 연구. 양적연구에서는 연구자가 관심이 있는 연구 문제를 해결하기 위해 필요한 자료들을 객관적인 방법에 의해 수량화될 수 있도록 자료를 수집한 다음 통계적인 방법을 적용하여 자료를 분석․해석한다. 이는 질적연구와 대립되는 개념이다.
연구방법론(硏究方法論: research methodology)
연구대상, 측정도구, 실험처치과정, 연구절차와 같은 연구의 세부절차 방법에 대해 연구하는 학문. 연구 문제나 목적의 적합성 여부, 적절한 표집수와 표집방법, 연구 목적에 적합한 연구설계법을 선정하는 등에 관한 연구를 포함한다.
연속변수(連續變數: continuous variable)
양의 크기를 나타내기 위하여 수량으로 표시되는 변수로 주어진 범위 내에서 어떤 값도 가질 수 있는 변수. 소수점으로 표시될 수 있는 변수로 길이, 무게 등의 예를 들 수 있다.
연역적 추론(演繹的 推論: deductive inference)
일반적인 원리와 법칙을 바탕으로 하여 특수한 원리를 이끌어내는 추론. 즉 보편명제로부터 특수명제를 이끌어내는 것으로 논리적으로 필연적인 결론을 도출해내는 삼단논법이 대표적인 방법이다.
영가설(零假說: null hypothesis)
연구에서 검정을 받고자 하는 두 개의 대립되는 가설 중 직접 검정 대상이 되는 가설. 실험 처치효과가 없다 또는 차이가 없다는 의미에서 영가설이라고 부르며 귀무가설이라고도 하고 H0라고 표시한다. 영가설을 기각할 경우 대안적으로 받아들이려고 상정하는 가설을 대립가설(대안가설, alternative hypothesis)이라 한다. 영가설은 잠정적인 것으로 통계적 검정 절차를 거쳐 수용될 수도 기각될 수도 있다.
예비연구(豫備硏究: pilot study)
본 연구를 하기 이전에 미리 실제 상황에서 일어날 수 있는 문제점에 대비하기 위하여 사전에 행해지는 연구. 본 연구에 앞서 설문지조사나 현지조사방법에 관한 제반 문제를 본 연구대상보다는 적은 수로 계획된 연구절차를 밟아봄으로써 사전 점검을 하는 것이다.
예언타당도(豫言妥當度: predictive validity)
준거관련타당도의 하나로서 측정 결과가 미래에 행해질 측정결과와 일치하는 정도. 즉 제작된 검사에서 얻은 점수가 그 검사와 관련된 미래의 행위를 얼마나 잘 예측하는가를 나타내는 정도를 의미하며, 예측타당도라고도 한다.
오자이브(ogive)
도수분포그림에서 X축에는 측정값을, Y축에는 누가빈도를 백분율로 나타낸 그림. 누가도수백분율 분포곡선과 같다.
외생변수(extraneous variable)
종속변수에 영향을 주는 독립변수 이외의 변수. 가외변수라고도 하며 자료수집 과정이나 실험설계시 통제되지 않아 효과나 영향이 알려지지 않은 변수들로서 자료수집이나 결과 해석에 오류나 불확실성을 초래하기 때문에 연구에서 통제되어야 한다.
외적 타당도(外的 妥當度: external validity)
연구에서 나온 결과를 현실에 얼마만큼 일반화할 수 있는 정도. 실험결과의 대표성 또는 일반화 가능성을 의미하는 것으로 다른 대상, 다른 상황에 어느 정도 일반화시킬 수 있는가를 묻는 것이다. 표본을 추출할 때 그 표본이 대표성이 높을수록, 그리고 실험설계에서 통제가 덜 이루어질수록 외적타당도는 높아진다.
요인분석(要因分析: factor analysis)
관찰된 변수들을 설명할 수 있는 몇 개의 요인으로 요약하는 방법. 요인분석은 기본적으로 모든 관찰변수는 그에 수반되는 잠재적이고 가설적인 구성개념을 가지고 있다고 가정하며, 관찰된 변수들간의 상관관계를 통해 요인들간의 잠재적인 1차식 구조를 추출해내는 과정이다. 요인분석은 그 목적에 따라 탐색적 요인분석법(exploratory factor analysis)과 확인적 요인분석법(confirm!!atory factor analysis)으로 나눌 수 있다. 탐색적 요인분석법은 이제까지 이론상으로 그 구조가 확립되어 있지 않아 그 자료의 기본 구조가 알려져 있지 않을 때 사용하며, 확인적 요인분석은 변수들간의 기존 관계를 가설로 설정하고 요인분석을 통하여 그 관계를 입증하는데 이용하는 방법이다.
參考:
要因分析의 개요
두 개의 변수 간에 상관이 있는 경우, 그들 변수는 무엇인가 공통적인 것을 측정하고 있다고 생각할 수 있다. 예를 들면 대학생에 대해서 컴퓨터를 다루는 것을 좋아하는 정도와 수학을 좋아하는 정도 사이에는 어느 정도 양의 상관관계가 있을 것인데, 그것은 컴퓨터를 좋아하게 되는 것과 수학을 좋아하게 되는 것에 무엇인가 공통점이 있기 때문일 것이다. 그 공통점은 가령 논리적인 문제해결을 좋아하는 것 등을 들 수 있다. 물론 완전한 상관이 아닌 한, 그러한 공통적인 것 이외에 각각의 변수에 고유한 부분도 있을 것이다. 위의 예에서 컴퓨터를 좋아하는 것에 대해서는 일반적으로 기계조작이나 장난감 놀이를 좋아하는지 어떤지 하는 것 등이 수학을 좋아하는 것과는 관계가 없는 독자적인 요인이라고 할 수 있다.
많은 변수가 서로 복잡하게 상관하고 있는 경우에도 그들의 상관관계를 설명할 수 있는 몇 가지의 공통적인 성분을 생각하여, 개개의 변수를 그러한 공통적인 성분을 반영하는 부분과 각각의 변수에 독자적인 부분으로 나누어서 생각할 수 있다. 요인분석(factor analysis)에서는 공통적인 성분을 공통요인(common factor)이라고 부른다.
요인분석의 목적은 변수간의 상관행렬로부터 공통요인을 끄집어내어 그 공통요인을 이용해서 변수간의 상관관계를 설명하고, 공통요인과의 관계에 의해서 각 변수의 성질을 간결한 형태로 기술하는 것이다. 또 요인분석의 결과를 변수나 관측대상의 분류를 위해서 이용하는 경도 많다.
要因分析의 目的
많은 변수들을 적은개수의 주성분변수나 요인변수로 축소한다.SPSS 요인분석에서는 주성분분석(Principal Component Analysis)과 요인 분석(Factor Analysis)을 할 수 있다.
(1) 主成分分析
많은 수의 변수를 정보의 손실을 최소화 하면서 하나 또는 몇 개의 종합적 지표(주성분)로 요약하는 분석이다. 예를 들면, 여러 개의 시험 성적을 통합한 종합적 성적을 만들고자 하거나, 여러 가지 증상들을 통합한 종합적 질병 중증도를 만들고자 할 경우, 각 지역의 사회경제적 현상(인구수, 학력, 총고용수, 주택가격 등)에 관한 데이터를 가지고 적은 개수의 사회경제적 지표를 구성하고자 할 경우에 주성분분석을 할 수 있다. 즉, 주성분분석은 변수의 차원을 축소하여 자료를 요약하는 것을 주목적으로 한다.
(2)要因分析
많은 수의 변수들이 가지고 있는 정보를 소수 몇 개의 잠재적 요인(Factor)에 의하여 설명하고자 하는 분석이다. 예를 들면, 성격검사의 많은 문항들은 몇 가지 성격특성(요인)들로 구분할 수 있는데 이와 같이 여러 개의 관련 있는 문항(변수)들을 하나의 요인으로 묶어서 차후의 분석(선형회귀분석, 판별분석, 군집분석 등)에 사용하기 위한 분석이다. 요인분석은 구체적으로 다음과 같은 목적으로 이용될 수 있다. 첫째, 변수들을 축소한다. 많은 문항(변수)들을 적은 수의 요인 변수로 주려준다. 둘째, 불필요한 문항(변수)을 제거한다. 몇 가지 주요한 요인에 영향을 거의 주지 못하는 문항들을 제거할 수 있다. 셋째, 변수들의 특성을 파악한다. 변수들은 상호 독립적인 몇 가지 요인으로 축소되는데 그 요인들의 특성을 파악함으로서 변수들을 이해할 수 있다. 넷째, 측정도구의 타당성(validity)을 알 수 있다. 하나의 특성을 측정하기 위해 여러 개의 문항(변수)들을 사용했을 경우에 이 문항들이 요인분석에서 한 개의 요인으로 묶여지는 것은 그 측정도구가 타당함을 나타내준다.
使用되는 變數의 尺度
序列尺度, 등간 비율척도
몇 개의 개념을 잠재적으로 대표하는 많은 수의 변수(문항)들이 필요하다. 변수들은 서열척도(가능하면 5점 척도 이상)나 구간 비율척도로 측정되어야 한다.
보조 통계분석이나 그래프
각 변수들의 히스토그램을 그려서 정규성 검토주성분분석에서는 일반적으로 변수를 축소, 요약하는데 목적이 있기 때문에 정규성을 검토할 필요가 없다. 그러나 요인분석에서는 변수들이 정규분포를 따른다는 가정이 필요하다. 특히 요인점수(factor score)를 후속 분석에서 사용하고자 할 때 필요하다. 케이스 수가 많은 경우(변수 개수보다 적어도 50개 이상)에는 반드시 필요하지는 않으나, 케이스 수가 적은 경우에는 각 변수들의 히스토그램을 그려서 정규분포와 너무 동떨어진 변수를 찾고 이 변수에 대해서는 변환을 하여 사용하는 것이 좋다.
요인설계(要因設計: factorial design)
복수의 독립변수들의 모든 수준들이 조합을 이루어 만들어 내는 처치들의 효과를 동시에 검정할 수 있는 실험설계법으로 분산분석의 일반화된 형태. 한 번의 실험으로 여러개의 독립변수의 주 효과를 검정할 수 있고 독립변수들이 복합적으로 만들어 내는 상호작용효과도 검정할 수 있다.
위약효과(僞藥效果: Placebo effect)
실제로 전혀 효과가 없는 실험처치를 피험자에게 마치 효과가 있는 것처럼 허위로 인식시켰을 때 나타나는 효과. 플라시보효과라고도 하며, 아무 효과가 없는 약을 마치 두통에 뛰어난 효과가 있는 것처럼 환자에게 속여 투약했을 때 실제로 환자의 두통이 나은 경우를 예로 들 수 있다. 위약효과는 연구자로 하여금 피험자들이 실험상황에 노출되었을 때 생길 수 있는 심리적 반응, 특히 피험자의 기대나 피암시성 등의 효과를 분리해 낼 수 있게 한다.
유의도검정(有意度檢定: significance testing)
통계적 방법을 사용하여 모집단의 상황을 추론을 하고자 할 때, 그 추론이 어느 정도나 오류의 가능성을 가지고 있을 것인지에 대한 확률적 추론. 유의도 검증이라고도 함. 통계적 가설검정이나 신뢰구간 설정에 의하여 얻어진 통계치들이 어느 정도나 오류의 가능성을 가지는지를 추론하게 된다. 예를 들어, 영가설에 의하여 이론적으로 가정된 상황의 표집분포에 비추어 볼 때, 하나의 통계치가 관찰될 확률이 5%나 1% 이하일 경우 그 통계치는 각각 5%나 1% 수준에서 유의하다는 결론을 내린다. 연구 설계에 따라 유의도검정은 모집단의 평균의 차이, 상관의 정도, 비율의 크기, 분류 결과의 이론 적합성, 분포의 동질성, 이론적 모형의 실제 자료 설명력 등의 검정을 포함한다.
이변량분석(二變量分析: bivariate analysis)
변수가 두 개로 이루어지는 분석. 두 변수간의 상관적 관계를 나타내는 두 변수간의 빈도 분포 분석이나, 단순 상관이나 회귀 분석, 그리고 하나의 독립변수와 하나의 종속변수로 이루어지는 평균의 차이검정 등은 이변량분석의 예들이다.
인지능력검사(認知能力檢査: cognitive abilities test)
인간의 지적 능력을 측정하는 검사. 학업성취 중 지적 영역의 성취도 검사, 적성, 지능, 그리고 창의성 등 다양한 능력의 검사를 총칭한다. 근래 인지능력검사는 인지심리학과 컴퓨터 공학의 발전에 힘입어 다양한 인지구조의 진단을 할 수 있는 방향으로 연구 개발되고 있다.
일반화(一般化: generalization)
① 특정한 대상에 대한 사고나 연구의 결과를 그것과 유사한 대상에 적용하는 것. 이때 본래의 대상과 적용 대상은 본질적으로 같은 특징을 가지고 있다고 전제된다. ② 여러 개체들이 가지고 있는 공통된 특성을 부각시켜 한 개념이나 법칙을 성립시키는 과정 혹은 그 결과로 얻어진 진술. 흔히 과학에서의 법칙은 구체적 사상을 설명하거나 기술할 수 있는 보다 보편적 질서로서 일반화와 동의어로 사용되기도 한다. ③ 특정 조건에 의하여 학습된 행동이 그와 비슷한 조건에서도 나타나는 현상. 자극의 변별(discrimination)과 대조되는 개념으로서 학습(learning)을 설명하는 고전적 조건반사이론의 주요 개념이다.
조절변수(調節變數: moderator variable)
메타분석에서 서로 다른 연구에서 다룬 동일한 통계량에 대한 관측치들 사이의 변이(variation)와 관련 있는 요인으로써 독립변수(들) 외에 기준변수에 영향을 주는 변수. 조절변수의 값은 메타분석에서 다루고자 하는 통계량에 대한 해석에 있어서 중요한 정보를 제공한다. 예를 들어 학습시간량으로써 학업성취도를 예언하고자 할 때, 학습 방법에 따라서 예언력이 달라진다면 학습 방법이 조절변수가 된다. 조절변수는 연구설계에 포함된다는 점에서 외재변수와 구별되며 독립변수의 기능을 하기도 한다.
종단적연구(縱斷的硏究 longitudinal research/longitudinal study)
일정 기간에 걸쳐서 반복적으로 연구대상 집단에 대한 자료를 수집하는 연구 설계. 횡단적연구(cross-sectional research)와 연구자료 및 연구방법에 있어서 대비되는 설계이다. 연구자료는 각 변수에 대해서 2회 이상의 상이한 두 시점에서 수집되고, 상이한 두 시점에서의 수집 및 분석대상(개체)은 동일하거나 적어도 상호 비교 가능해야 되며, 자료분석에는 서로 다른 시점에서의 자료에 대한 비교가 포함된다. 종단적연구의 주목적은 첫째, 시간변화에 따른 변화유형의 파악이고 둘째, 서로 이웃하는 두 시점 사이의 인과관계의 방향과 크기의 설정이다.
종속변수(從屬變數: dependent variable)
변수들간의 관계에 있어서 영향을 받거나 예측되는 변수. 한 연구에서 두 개 이상의 변수들을 취할 때, 변수상호간의 관계 양상에 따라 독립변수와 종속변수로 구분하는데, 종속변수는 독립변수의 조작 또는 통제 여하에 따라 영향을 받게 된다. 실험적 연구가 아닌 기술적 연구에서는 연구자가 변수들을 임의로 조작하거나 통제하지 못하는 상황이므로 종속변수 대신 반응변수라는 용어를 사용하기도 한다.
중다공선성(重多共線性: multicollinearity/collinearity)
중다회귀분석에서 독립변수들간에 존재하는 상관관계, 또는그 상관계수가 매우 높기 때문에 발생하는 문제. 이러한 문제는 부분회귀계수의 크기에 영향을 주고 그 안정도에 역효과를 준다. 즉, 부분회귀계수의 표준오차가 매우 커진다. 또한 주어진 독립변수의 중요성을 결정하기 어렵게 하는데, 이는 그 변수의 효과가 독립변수간의 높은 상관관계에 혼재되어 있기 때문이다.
중다상관계수(重多相關係數: multiple correlation coefficient)
두 개 이상 독립변수의 선형결합과 하나의 종속변수 사이의 상관을 나타내는 계수. 흔히 R로 나타낸다. R의 제곱인 R2은 종속변수의 분산을 예측변수의 선형결합이 공유하는 정도를 나타낸다. 단순상관 r은 -1과 1 사이에 있으나 R은 0과 1 사이에 있다.
중다회귀분석(重多回歸分析: multiple regression)
독립변수(예측변수)가 2개이상인 회귀모형(중다회귀모형)에 의한 자료분석. 중다회귀모형에는 2개 이상의 독립변수가 포함되기 때문에 자료분석과 결과해석에 있어서 독립변수들 사이의 중다공선성(重多共線性)이 많은 영향을 미친다. 중다회귀모형이 독립변수들의 1차선형함수로 되어있으면 중다선형회귀모형이라고 하고, 그렇지 않으면 중다비선형회귀모형이라고 부르는데, 일반적으로 중다선형회귀모형을 중다회귀모형이라고 부른다.
진점수(眞點數: true score)
피험자가 측정오차 없이 검사에서 얻을 수 있는 가상적 능력점수. 고전검사이론에서 진점수(T)는 동일 상황에서 동일한 검사를 반복실시 하였을 때 측정된 관찰점수(X)의 기대값(평균값)으로 추정한다. 문항반응이론에서는 각 문항의 정답확률들의 합이 된다.
질적 방법(質的 方法: qualitative method)
주관적․해석적 인식론에 근거를 두고, 가능한한 인위적으로 조작되지 않은 자연스러운 삶의 세계에서 연구대상 스스로의 말이나 글, 행동, 그들이 남긴 흔적 등을 집중적으로 연구하여 해석하고 의미를 찾아내려는 연구방법. 양적방법과 대비되는 개념. 1960년대부터 사회과학분야에서 조금씩 언급되기 시작한후 1970년대에 활발한 개발이 시도되었으며, 양적 방법에 비해 방법의 체계화와 정교화의 정도가 낮은 편이다. 연구대상의 보편적이고 일반적인 특성을 드러내기보다는 심층적인 연구목적에 더 적절하며, 대표적인 예로 사례연구나 역사적 연구를 들 수 있다.
집단간 설계(集團間 設計: between-group design)
실험에서 처치조건에 따라 상이한 피험자 집단을 사용하는 설계. 이 때 처치조건간에 반응의 차이는 독립된 피험자 집단간의 차이이므로 피험자간 설계라고도 한다. 이 방식에 대비되는 집단내설계에 비해 설계 및 분석이 쉽고 통계적 가정이 엄격하지 않은 장점이 있으나, 피험자 수가 많이 필요하며, 처치효과를 검토할 수 있는 민감도가 상대적으로 부족하다는 단점이 있다.
집단내 설계(集團內 設計: within-group design)
실험에서 각 처치조건에 동일한 피험자 집단을 사용하는 설계. 이 때 처치조건간에 반응의 차이는 동일한 피험자내의 차이이므로 피험자내 설계라고도 하며 또한 반복측정설계라고도 한다. 이 방식에 대비되는 집단간설계에 비해 적은 피험자 수를 가지고 더 민감한 실험을 할 수 있다. 그러나 상대적으로 엄격한 통계적 가정을 충족시켜야 하는 것은 물론 피험자들이 처치조건에 따라 변하는 피험자와 처치간의 상호작용의 문제가 있을 수 있다.
척도(尺度: scale)
측정의 도구 또는 측정의 수준. 측정의 도구는 어떤 논리에 따라 제작되며, 이러한 의미에서 척도는 검사도구라고도 한다. 측정의 수준은 측정을 위한 논리가 허용하는 수리적 연산의 정도이다. 이러한 의미에서 척도는 명명척도, 서열척도, 등간척도, 그리고 비율척도로 구분할 수 있다. 이것은 검사도구는 아니고, 검사도구가 가지고 있는 논리의 수준을 의미한다.
척도화, 척도법(尺度化, 尺度法: scaling)
측정대상으로부터 수량을 산출하기 위해서 대상들에 적용시키는 모형들의 통칭. 단일차원적 척도법과 다차원적 척도법이 있다. 전자에는 Thurstone의 척도법, Stevens의 Magnitude 척도법, 그리고 Likert 방식의 척도법이 있고, 후자에는 다요인분석, 연결척도법(conjoint scaling), 그리고 흔히 MDS(multidimensional scaling)라고 불리는 모형이 있다. "multidimensional scaling"은 다차원적 척도법을 통괄하는 이름이기도 하고 ALSCAL, Correspondence Analysis, 또는 Dual Scaling과 같이 대상들간의 유사성 도는 선호도를 분석하는 모형들의 이름(이 때 흔히 MDS라고 줄여서 부름)이기도 하다.
추리통계학(推理統計學: inferential statistics)
표본의 자료를 사용해서 모집단에 대한 추론을 하는 통계학의 분야. 모수에 대한 추정과 가설검정이 주 내용이 된다. 모수의 추정에는 하나의 값을 추정치로 제시하는 점추정과 신뢰구간을 함께 제시하는 구간추정이 있다. 가설검정을 위해서는 검정통계량의 표집분포를 필요로 한다. 표집분포에는 정규분포, t분포, F분포, 을 위해서는 검정통계량의 표집
측정(測定: measurement)
사물들의 경험체계에 일관성 있게 숫자를 부여하는 작업. 사물에 대해 경험적으로 인식하는 질적인 내용이 바로 사물들의 경험체계이다. 이 경험체계에 숫자를 부여할 때의 일관성을 정의하는 방식에 따라 측정의 이론은 수량산출론, 일관행위론, 그리고 현실표상론과 같이 세줄기로 나뉜다. 이론적으로는 약한 입장이지만, 현실적으로 가장 많이 받아들여지고 있는 이론은 일관행위론인데, 이것은 측정하는 사람 나름대로의 일관성만 있으면 그에 의해 산출된 숫자 자체에 모든 가능한 수리적 연산을 적용할 수 있다는 입장이다.
측정의 표준오차(測定의 標準誤差: standard error of measurement)
측정치가 진점수를 예측하는 정확도를 나타내는 통계치. 측정치의 표준오차가 적을수록 그 측정치가 진점수를 더 정확하게 예측한다고 해석할 수 있다. 측정치와 진점수의 상관관계가 +1.00이면 표준오차는 0이 된다. 표준오차는 정규분포에 근거하여 특정 신뢰수준에서 측정치가 예측하는 진점수의 구간추정치를 추정하는데 이용가능한 통계치이다. 즉 측정치를 X라고 하고 측정오차를 S라고 하면 진점수가 정규분포를 따른다고 할 때 95% 신뢰수준에서 진점수의 구간추정치는 (X±1.96S)가 된다.
카이제곱검정(2 檢定: 2 test)
경험자료에서 구한 2통계치가 영가설(또는 귀무가설)이 참일 때의 2값의 이론적 분포(카이제곱분포라고 함)에서 관찰될 수 있는 확률(P-Value)에 근거하여 실시하는 검정. 그 확률이 아주 작으면(예: .05 이하) 영가설을 기각하고 그렇지 않으면 수용한다. 독립적인 표준화 정규분포변수가 ν개 있을 때 그들 각각의 제곱의 합이 2 통계량으로 정의되며 이 때 자유도는 ν이다.
타당도(妥當度: validity)
한 검사가 그 검사가 측정하려고 목적하는 것을 제대로 측정하는 정도. 검사점수에서 도출된 특정의 추론이 적절한지, 의미있는지, 그리고 유용한지에 대한 개념으로 타당도는 일반적으로 내용타당도, 준거타당도, 구인타당도(구성개념타당도라고도 함)로 나뉜다. 내용타당도는 검사가 재고자 하는 구인의 영역을 문항들이 대표하는 정도이고, 준거타당도는 검사점수가 준거(검사를 통해서 알아보고자 하는 행동)에 관계되어 있는 정도이며, 구인타당도는 검사가 재고자하는 이론적 개념이 재어지는 정도이다. 1986년 미국 교육검사연구소(ETS)에서 있었던 검사타당도회의 이후로 세가지 타당도를 구인타당도라는 큰 우산아래 묶어서 이해하는 경향이 강해지고 있다.
통제변수(統制變數: control variable)
연구를 수행하면서 탐구하기를 원하지 않기 때문에 통제하는 변수. 외재변수 중의 한가지라고 볼 수 있다. 연구자가 실제 연구하고자 하는 변수에 직․간접적인 영향을 미칠 가능성이 있는 변수들이기 때문에 일단 연구과정에 포함시킨 후 이를 통제함으로써 보다 타당한 연구결과를 얻게 된다. 통제변수의 효과를 통계적으로 통제하는 방법으로는 다중회귀분석이나 공분산분석 등의 기법을 들 수 있다.
통계적 유의성(統計的 有意性: statistical significance)
경험자료에서 계산 된 검정통계량의 값이 그 통계량의 표집분포에서 발견될 확률의 높고 낮음에 의해서 판정되는 유의성. 즉 검정통계량의 값이 일정한 임계값(critical value)을 넘어서면 유의한 값으로 보고 그 표집분포에서 발생한 값이 아니라는 결정을 내린다. 검정통계량은 표본크기의 함수이므로 표본크기가 커질수록 검정통계량의 값은 커져서 실질적으로는 유의성이 없어도 통계적으로는 유의한 것으로 판정될 수 있다. 따라서 통계적 유의성은 오류가능성을 동반한다. 이 때의 오류는 1종오류가 된다.
통계적 회귀(統計的 回歸: statistical regression)
두 개의 변수간 상관이 완벽하지 않을 경우, 한 변수에서 극단의 값을 보이는 개체(object)들은 다른 변수에서는 대체로 덜 극단적인 값을 보인다는 수학적 성질. ‘평균을 향한 회귀’라고도 함. 이것을 회귀분석을 사용하는데서 발생하는 허구(artifact)로 돌리는 사람들도 있으나, 사실은 수학적 필연(necessity)이다. 예로서, 사전검사와 사후검사간 상관의 크기가 1이 안될 경우, 사전검사에서 극단적으로 높은 값을 받은 사람들은 사후검사에서는 대체로 그 보다 덜 극단적인 값을 받게 되는데, 이것을 두 검사 중간에 실시한 처치의 효과때문이라고만 볼 수 없는 것은 통계적 회귀가 발생하는 상황이기 때문이다.
통계학(統計學: statistics)
자료를 수집․정리하고 과학적으로 분석하여 의사결정자에게 최적의 정보를 제공하는 제반 방법론을 연구하는 학문. 표본자료의 요약을 기술하는 기술통계학과, 표본자료를 근거로 모집단에 대한 추론, 즉 모수추정과 가설검증을 하는 추리(추론)통계학으로 나뉜다.
통제집단(統制集團: control group)
실험설계에서 처치 받은 집단에서의 효과를 비교하기 위한 대상으로서 설정하는, 처치 받지 않은 집단.
판별분석법(判別分析法: discriminant analysis: discriminant function analysis: DA)
둘 이상의 연속형 독립변수(예측변수)를 이용하여 하나의 범주형 종속변수에 개인이나 사례를 분류하는 통계적 분석방법. 중다회귀분석의 일종으로 연구대상이 둘 이상의 범주에 분류될 경우에는 중다판별분석이라고 부른다. 원래 고고학자가 뼈의 길이, 무게, 반지름 등의 연속형 변수를 이용하여 수집된 뼈가 어느 동물의 범주에 속하는지를 판별해내는 데에서 유래되었다. 예를 들어보면, 학생의 학점, 결석일수, 학력검사점수 등의 연속형 변수를 이용하여 그 학생의 졸업여부(졸업/미졸업의 범주형 종속변수)를 예측하는 경우이다. 이때 판별분석은 특정 학생이 졸업할 것인지의 여부를 예측할 뿐만 아니라 각 독립변수들의 상대적 중요성을 비교할 수 있게 해준다.
편의표집(偏意標集: convenience sampling)
주변에서 접근가능하고 용이한 표본을 선정하는 표집방법. 비확률적 표집방법의 하나이다. 가령, 교사가 표집이 편리하기 때문에 자신의 학급 학생들을 사례집단으로 삼아 연구하는 경우 등이 이에 속한다.
편파(偏跛: bias)=편향
어떤 사건이나 현상을 왜곡된 방식으로 지각하거나 어떤 중요한 사실을 간과함으로써 연구결과에 체계적인 오류를 낳게 하는 경향. 연구자가 종속변수에 영향을 미치기를 원하지 않는 어떤 요인의 효과. 좀 더 수리적인 방식으로 표현한다면, 모집단의 모수치에서 통계량의 기대치를 뺀 값이다.
표본(標本: sample)
모집단에 대한 추론을 위해서 그로부터 추출한 또는 측정된 값들의 집합. 이 집합이 모집단에서 전형적인 값들로 이루어질수록 좋은 추론을 제공하는 표본이 된다.
표준편차(標準偏差: standard deviation)
한 점수집합내에 있는 점수들간의 상이한 정도를 나타내는 값으로서 각 점수가 평균으로부터 이탈하는 편차의 제곱을 평균한 것(분산)에서 구한 평방근. 표본이나 모집단에서 모두 계산이 가능하다. 표본일 경우 편차제곱을 평균할 때 분모를 n으로 나누는 경우와 n-1로 나누는 경우가 있다. 표본을 기술하는데는 전자가, 모집단에 대한 추론을 하는데는 후자가 적합하다. 편차의 절대치를 사용하는 절대편차와 대비된다.
표집(標集: sampling)
모집단의 일부, 즉 표본을 추출하는 작업. 좋은 표집을 위해서는 표본단위, 표본틀, 그리고 표집설계의 개념이 있어야 한다. 표본단위는 표본내의 각 구성요소로서 반응이나 정보를 제공하는 최소의 개체이다. 표본틀은 모집단내에 있는 모든 표본단위들을 나타내는 목록이거나 일련의 명시적 정의이다. 실제로 표본추출시는 이 표본틀에서 뽑게 된다. 표집설계는, 연구결과의 일반화를 위해서 확률표집(예: random sampling, stratified sampling, cluster sampling)이 필요하지만, 때로는 확률표집을 위한 어려움과 비용을 감수하지 않아도 되는 경우가 있고 이때는 비확률표집(예: quota sampling, convenience sampling)도 무방하다.
표집분포(標集分布: sampling distribution)
N개의 사례에 기초한 표본통계량의 값들과 각각의 값에 관련된 확률(밀도)사이의 함수적 관계를 보여주는 이론적인 확률분포. t분포, Z분포, 분포, 그리고 F분포등은 모두가 t통계량, Z통계량, 통계량, 그리고 F통계량에 대한 표집분포이다.
표집설계(標集設計: sampling design)
연구대상자의 범주로 정의내려진 모집단으로부터 현실적으로 연구가 진행될 표본을 추출하는 과정에 대한 계획. 일반적으로 추출된 표본에 입각해서 연구결과를 전체 모집단에 대해 일반화하기 때문에 모집단에 대한 표본의 대표성 문제가 표집설계의 핵심이다. 표집설계의 유형으로는 단순무작위표집, 층화표집, 군집(집락)표집 등의 확률표집법과 편의표집, 의도적 표집 등의 비확률표집법이 있다.
현장실험(現場實驗: field experiment)
연구자의 의도대로 잘 통제되고 조건이 조성되는 공간이 아닌 상황 즉, 오염변수의 통제가 어렵지만 피험자들이 자연스럽게 행동하고 있는 현장에서 실시하는 실험. 실험실에서 하는 통제실험과 달리 연구결과가 좀더 나은 현실적 적용가치를 가지며(높은 외적 타당도), 처치변수의 개념도 실험실에서와 같이 공간적 제약이 있거나 피험자의 의식에 의한 왜곡이 없으므로 의도한 개념의 조성이 용이하고(높은 개념타당도), 피험자의 수효가 비교적 충분하므로 유의한 결과를 ‘유의하다’고 할 수 있게 된다(높은 통계검증력).
현장연구(現場硏究: field research)
통제된 실험실에서 실시되는 실험연구와 달리 현장에서 실시되는 연구. 현장연구에는 독립변수의 조작과 통제를 가능한한 도입하는 현장실험, 표본을 대상으로 많은 변수들에 대한 종단적 또는 횡단적 연구를 하는 표본조사(survey), 현장자체를 최대한으로 조사하고 기술하는 현장조사(field study)가 있다.
확률(確率: probability)
표본공간내의 각 사건(사상)에 부여되는 실수. 주어진 표본공간 S, 그 S내에 여러 사건들(events)이 있을 때 그중 사건 A에 부여되는 0과 1사이의 실수를 A가 발생할 확률, 즉 p(A)라고 한다. 확률은 다음 세 기본공리를 만족한다.
공리1
공리2
공리3 과 같은 사건들의 집합이 있고 이 사건들이 서로 배타적이면
확률적 표집(確率的標集: probabilistic sampling)
전집 구성 요소들이 표집될 확률을 고려하여 표집하는 방법. 전집을 가장 잘 대표할 수 있기 위해서 각 요소가 표집될 확률이 같도록 하는 방법이 무선표집(random sampling)이다. 확률이론에 근거하며 표집오차를 추정할 수 있어서 이론적 표집으로도 불린다. 개인 수준의 각 관찰 단위 요소의 표집 확률이 같도록 하는 단순무선표집(simple random sampling), 전집의 하위 조직의 구성비를 고려한 후에 각 하위 조직에서의 단위 요소의 표집 확률이 같게 하는 유층무선표집(stratified random sampling), 그리고 각 개별적 단위들을 묶은 집단적 단위들이 표집될 확률이 같도록 하는 군집무선표집(clustered ramdom sampling)등이 포함된다. 그리고 목적표집, 판단표집, 또는 임의표집과 등과 같은 비확률적표집과 대비된다.
확인적 요인분석(確認的 要因分析: confirm!!atory factor analysis)
설계되고 가설화된 또는 가정된 요인구조를 자료에 적용시켜서 그 구조의 타당성을 확인하는 요인분석. 요인분석의 모형으로 보면 주성분모형보다는 공통요인모형이다. 탐색적 요인분석과 대조되는 방식이다. 통계패키지도 통상적으로 탐색적 요인분석을 위해 사용되는 것과는 다른 것을 쓰게되는 것이 보통이다. 예컨대, 요인 및 그에 대한 측정변수, 측정잔차(측정오차)등을 명시하고 그 모형을 검정하고자 LISREL, EQS, LISCOMP, 또는 COSAN 프로그램을 사용하는 경우가 많다. 검증적 요인분석이라고도 함.
회귀분석(回歸分析: regression analysis)
예측변수와 종속변수의 관계를 나타내는 회귀식의 추정, 그에 의한 종속변수값의 예측, 이런 과정에 관련된 검증을 포함하는 통계방법. 회귀식은 종속변수가 예측변수들에 회귀(regress)되면서 추정된다. 회귀는 주어진 종속변수의 값을 예측해줄 좋은 예측변수를 찾아가는 작업을 의미한다. 따라서 선형적인 회귀도 있고 비선형적인 회귀도 있다. 표준화된 변수들을 사용하는 표준 회귀분석과 비표준화된 변수들을 사용하는 비표준화 회귀분석이 있다. 회귀식에서의 모수는 회귀상수와 회귀계수가 된다. 전자는 예측변수값이 0일 때의 종속변수의 값, 즉 절편이고, 후자는 예측변수값의 1단위 변화에 대응하여 종속변수의 값이 평균적으로 얼마나 변하는 가를 나타낸다.
횡단적 연구(橫斷的 硏究: cross-sectional research)
현장연구 중 표본조사에서 모든 관련된 변수들에 대한 자료를 하나의 시점에서 동시적으로 수집하여 분석하고 추론하는 방식. 시간에 따른 변화를 추적하는 종단적 연구에 대비된다.
혼재변수(混在變數: confounding variable)
실험설계에서 종속변수에 대한 독립변수의 효과에 반하여 대안적인 해석을 가능하게 하는, 설계시 포함되지 않은 변수. 혼입변수 또는 잡음변수라고도 한다. 독립변수를 X라고 하고 종속변수를 Y라고 할 때 X→Y라는 주장에 내적타당도가 있다고 한다. 그러나 통제에 실패하여 예기치 않은 잡음변수 Z가 개입하여 Y에 영향을 미쳤을 경우 X만이 Y의 변화에 기여한 것이 아니라는 대안적 주장에 대한 방어가 어려워지고 내적타당도가 부족한 연구가 된다.
효과크기(效果크기: effect size)
연구대상인 현상이 모집단에 존재하는 정도 또는 영가설(귀무가설이라고도 함)이 틀리는 정도. 어떤 연구든 영가설은 효과크기가 0임을 의미한다. 영가설이 틀릴 경우 어떤 특정한 정도만큼 틀린다. 이 특정한 정도 즉 효과크기는 모집단에서 영이 아닌 어떤 값을 말한다. 이 값이 클수록 연구대상인 현상이 잘 드러나게 된다. 효과크기를 Cohen은 상관연구에서는 상관계수 r로, 두 집단실험일 경우에는 d로, 분산분석일 경우에는 f로 나타낸다. 여기서 d는 평균차이를 공통의 표준편차로 나눈 값이고, f는 주효과일 경우 표준화된 평균들간의 표준편차이고 상호작용일 경우 표준화된 상호작용효과간의 표준편차이다. 분산분석의 경우 효과크기로서 을 쓸 수도 있으나 f를 사용하는 것이 계산에 편리하다.
히스토그램(histogram)
도수분포표를 자료로 하여, 계급구간을 밑변으로 하고 도수를 높이로 하여 그린 그림. 기둥 간에 간격이 없는 것이 막대그림표(bar diagram)와 다르다.

댓글을 달아 주세요