목차
1. T 검증
2. 아노바(ANOVA, Analysis of Variance)
3. 이원분산분석(two-way ANOVA)
4.공분산분석 (Analysis of Covariance: ANCOVA)
2. 아노바(ANOVA, Analysis of Variance)
3. 이원분산분석(two-way ANOVA)
4.공분산분석 (Analysis of Covariance: ANCOVA)
본문내용
10
10
<유의도 검증>
1단계: 아노바를 위한 전제조건
① 독립적인 확률 샘플링이다
② 종속 변수가 등간-비율변수이다
③ 각 독립변수 범주 별 표본이 대표하고자하는 모집단의 변량은 동일하다(동분산성)
④ 모집단들이 모두 정규분포를 이룬다
2단계:
전체 변량, 집단간 변량, 집단내 변량, 그리고 상호작용 변량 및 평균변량을 구한다.
① 전체 변량)
371.20
② 두 독립변수 개별 별 집단간 변량
거주지별 집단간 변량을 구한다.
28.94, df=2
대도시별 집단간 변량을 구한다.
19.61, df=2
③ 집단내 변량
168.80, df=N-(k1Xk2)=36
④ 상호작용 변량
202.4-(28.94+19.61)=153.85, df=4
3단계: 주효과와 상호작용효과의 F값을 구하기
① 주효과
거주지별 저축에 미치는 효과
F=
{28.94/2} over {168.80/36}
=4.69
기관별 저축에 미치는 효과
F =
{19.61/2} over {168.80/36}
=2.09
② 상호작용효과
F=
{153.85/4} over {168.80/36}
=8.20
3단계: 유의수준을 결정하고, 분자와 분모의 자유도를 고려하여 이에 합당한 기준 F값을 찾는다(양측검증).
① 주효과
거주지별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18
기관별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18
② 상호작용효과
유의수준=.01, 분자 자유도=4, 분모 자유도=36
F=3.83
4단계: 표본에 의해서 구해진 F값과 기준 F값을 서로 비교하여 영가설을 기각 혹은 수용을 결정한다
① 주효과
거주지별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18>4,69
거주지별 저축에 미치는 영향이 없다.
기관별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18>2.09
기관별 저축에 미치는 영향이 없다.
② 상호작용효과
유의수준=.01, 분자 자유도=4, 분모 자유도=36
F=3.83<8.20
거주지역과 기관의 상호작용이 월 저축금액의 차이를 통계적으로 유의미하게 불러일으키는 요인이다.
<요약표>
변수
자승화
자유도
변량의 추정치(평균자승)
F
유의도
거주지역
28.94
2
14.47
3.09
>.01
기관
19.61
2
9.81
2.09
>.01
거주지역X기관
153.85
5
38.46
8.20
<.01
집단간 변량*
202.4
8
25.30
5.39
<.01
집단내 변량
168.8
36
4.69
전체변량
371.2
44
*집단간 변량=25.30/4.69
9개 전체 집단간 차이가 존재하는가?를 살펴보기 위해서.
.01수준에서 통계적으로 유의미.
즉, 9개 집단간 월 저축 금액의 차이는 거주지역과 계층이 동시에 함께 고려한 영향이 통계적으로 유의미하게 작용하였다.
공분산분석 (Analysis of Covariance: ANCOVA)
- 공분산분석은 원하지 않는 변수가 종속변수에 미치는 효과를 제거(또는 통제)하기 위해■ㅓ가 사용
-예: A와 B 두가지 직업훈련의 효과성을 살펴보고자 하여, 각각의 직업훈련을 받은 사람들의 소득을 비교한다. 그 결과 A의 직업훈련을 받은 사람들의 소득이 B의 직업훈련을 받은 사람들의 소득보다 더 높게 나타났다. 뿐만 아니라 A의 훈련을 받은 사람들의 교육수준이 B의 훈련을 받은 사람들 보다 높다. 이 때 A 집단의 소득수준이 B 집단의 소득수준보다 높게 나타난 것이 직업훈련 때문인지 또는 교육수준 때문인지 확실하지 않다. 이러한 경우에 교육수준이 종속변수인 소득에 미치는 영향을 통제한 후에 두 직업훈련이 소득에 미치는 영향을 비교.
- 예: 정신장애 노숙인을 대상으로 사례관리 프로그램이 병원입원횟수에 미치는 영향을 살펴보고자 한다. 사례관리 프로그램에 참여한 집단을 실험집단, 그리고 사례관리 프로그램에 참여하지 않은 집단을 통제집단이라고 한다. 사례관리 프로그램 참여 여부를 무작위 배정을 할 수 없어서 통제할 수 없는 비무작위 과정(nonrandom assign)을 통해 실험집단과 통제집단을 배정하였다. 예를 들어 연구자가 난수표 또는 동전을 던지는 방법 등으로 각 개인을 실험집단과 통제집단에 무작위로 배정한 것이 아니라 각 개인이 치료를 받고자 하는 욕구에서 스스로 실험집단에 속하고자 선택한 것이다.
그렇다면 두 집단을 동일한 집단이 아니며, 실험집단의 사례관리 프로그램의 효과가 개입의 효과인지 아니면 원래 동일하지 않기 때문에 일어난 효과인지 알 수 없다.
따라서 치료 효과를 합리적으로 추정하기 위해 분석에서 두 집단이 치료 이전에 갖고 있는 차이가 미치는 효과를 통제해야 한다. 즉, 사례관리 프로그램에 참여하기 이전에 병원입원회수를 통제하는 것이 필요하다.
<분산분석과 공분산분석>
분산분석
사후 병원입원횟수 변량 = 실헙집단 참여 여부별 변량(집단간변량) + 집단내 변량
공분산분석
사후 병원입원횟수 변량 = 실헙집단 참여 여부별 변량(집단간 변량) + 집단내 변량 + 사전 병원입원횟수
즉, 분산분석에서 사용하지 않던 사전검사를 공변수(covariate)를 사용하여 집단간의 차이를 조정
<공분산분석의 가정>
① 표본은 독립적인 확률 샘플링을 통해 추출되었다
② 종속 변수가 등간-비율변수이다
③ 각 독립변수 범주 별 표본이 대표하고자하는 모집단의 변량은 동일하다(동분산성)
④ 모집단들이 모두 정규분포를 이룬다
예를 들어 독립변수 지위가 종속변수 월급에 미치는 영향을 보기 위해서 근무시간을 통제하여 분석한다고 하자. 동분산성과 정규분포와 관련하여, 지위가 관리자, 일선사회복지사, 사회복지 전문요원으로 나누어졌을 때, 독립변수 각 범주별 모집단에서 월급여는 정규분포를 이루며, 또한 세 집단에서 월급여의 분산이 같다는 것.
⑤ 통계적으로 공분산으로 통제되는 변수는 등간-비율변수이어야 한다. 이 때 종속변수(월급여)와 공변수(근무시간)의 관계는 선형이다. 이 때 종속변수와 공변수의 상관관계계수(pearson\'s R)이 .06이상이면 공변량분석을 하여 공변수를 통제해주는 것이 독립변수의 효과를 살피는 것이 더 좋다.
10
<유의도 검증>
1단계: 아노바를 위한 전제조건
① 독립적인 확률 샘플링이다
② 종속 변수가 등간-비율변수이다
③ 각 독립변수 범주 별 표본이 대표하고자하는 모집단의 변량은 동일하다(동분산성)
④ 모집단들이 모두 정규분포를 이룬다
2단계:
전체 변량, 집단간 변량, 집단내 변량, 그리고 상호작용 변량 및 평균변량을 구한다.
① 전체 변량)
371.20
② 두 독립변수 개별 별 집단간 변량
거주지별 집단간 변량을 구한다.
28.94, df=2
대도시별 집단간 변량을 구한다.
19.61, df=2
③ 집단내 변량
168.80, df=N-(k1Xk2)=36
④ 상호작용 변량
202.4-(28.94+19.61)=153.85, df=4
3단계: 주효과와 상호작용효과의 F값을 구하기
① 주효과
거주지별 저축에 미치는 효과
F=
{28.94/2} over {168.80/36}
=4.69
기관별 저축에 미치는 효과
F =
{19.61/2} over {168.80/36}
=2.09
② 상호작용효과
F=
{153.85/4} over {168.80/36}
=8.20
3단계: 유의수준을 결정하고, 분자와 분모의 자유도를 고려하여 이에 합당한 기준 F값을 찾는다(양측검증).
① 주효과
거주지별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18
기관별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18
② 상호작용효과
유의수준=.01, 분자 자유도=4, 분모 자유도=36
F=3.83
4단계: 표본에 의해서 구해진 F값과 기준 F값을 서로 비교하여 영가설을 기각 혹은 수용을 결정한다
① 주효과
거주지별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18>4,69
거주지별 저축에 미치는 영향이 없다.
기관별 저축에 미치는 효과
유의수준=.01, 분자 자유도=2, 분모 자유도=36
F=5.18>2.09
기관별 저축에 미치는 영향이 없다.
② 상호작용효과
유의수준=.01, 분자 자유도=4, 분모 자유도=36
F=3.83<8.20
거주지역과 기관의 상호작용이 월 저축금액의 차이를 통계적으로 유의미하게 불러일으키는 요인이다.
<요약표>
변수
자승화
자유도
변량의 추정치(평균자승)
F
유의도
거주지역
28.94
2
14.47
3.09
>.01
기관
19.61
2
9.81
2.09
>.01
거주지역X기관
153.85
5
38.46
8.20
<.01
집단간 변량*
202.4
8
25.30
5.39
<.01
집단내 변량
168.8
36
4.69
전체변량
371.2
44
*집단간 변량=25.30/4.69
9개 전체 집단간 차이가 존재하는가?를 살펴보기 위해서.
.01수준에서 통계적으로 유의미.
즉, 9개 집단간 월 저축 금액의 차이는 거주지역과 계층이 동시에 함께 고려한 영향이 통계적으로 유의미하게 작용하였다.
공분산분석 (Analysis of Covariance: ANCOVA)
- 공분산분석은 원하지 않는 변수가 종속변수에 미치는 효과를 제거(또는 통제)하기 위해■ㅓ가 사용
-예: A와 B 두가지 직업훈련의 효과성을 살펴보고자 하여, 각각의 직업훈련을 받은 사람들의 소득을 비교한다. 그 결과 A의 직업훈련을 받은 사람들의 소득이 B의 직업훈련을 받은 사람들의 소득보다 더 높게 나타났다. 뿐만 아니라 A의 훈련을 받은 사람들의 교육수준이 B의 훈련을 받은 사람들 보다 높다. 이 때 A 집단의 소득수준이 B 집단의 소득수준보다 높게 나타난 것이 직업훈련 때문인지 또는 교육수준 때문인지 확실하지 않다. 이러한 경우에 교육수준이 종속변수인 소득에 미치는 영향을 통제한 후에 두 직업훈련이 소득에 미치는 영향을 비교.
- 예: 정신장애 노숙인을 대상으로 사례관리 프로그램이 병원입원횟수에 미치는 영향을 살펴보고자 한다. 사례관리 프로그램에 참여한 집단을 실험집단, 그리고 사례관리 프로그램에 참여하지 않은 집단을 통제집단이라고 한다. 사례관리 프로그램 참여 여부를 무작위 배정을 할 수 없어서 통제할 수 없는 비무작위 과정(nonrandom assign)을 통해 실험집단과 통제집단을 배정하였다. 예를 들어 연구자가 난수표 또는 동전을 던지는 방법 등으로 각 개인을 실험집단과 통제집단에 무작위로 배정한 것이 아니라 각 개인이 치료를 받고자 하는 욕구에서 스스로 실험집단에 속하고자 선택한 것이다.
그렇다면 두 집단을 동일한 집단이 아니며, 실험집단의 사례관리 프로그램의 효과가 개입의 효과인지 아니면 원래 동일하지 않기 때문에 일어난 효과인지 알 수 없다.
따라서 치료 효과를 합리적으로 추정하기 위해 분석에서 두 집단이 치료 이전에 갖고 있는 차이가 미치는 효과를 통제해야 한다. 즉, 사례관리 프로그램에 참여하기 이전에 병원입원회수를 통제하는 것이 필요하다.
<분산분석과 공분산분석>
분산분석
사후 병원입원횟수 변량 = 실헙집단 참여 여부별 변량(집단간변량) + 집단내 변량
공분산분석
사후 병원입원횟수 변량 = 실헙집단 참여 여부별 변량(집단간 변량) + 집단내 변량 + 사전 병원입원횟수
즉, 분산분석에서 사용하지 않던 사전검사를 공변수(covariate)를 사용하여 집단간의 차이를 조정
<공분산분석의 가정>
① 표본은 독립적인 확률 샘플링을 통해 추출되었다
② 종속 변수가 등간-비율변수이다
③ 각 독립변수 범주 별 표본이 대표하고자하는 모집단의 변량은 동일하다(동분산성)
④ 모집단들이 모두 정규분포를 이룬다
예를 들어 독립변수 지위가 종속변수 월급에 미치는 영향을 보기 위해서 근무시간을 통제하여 분석한다고 하자. 동분산성과 정규분포와 관련하여, 지위가 관리자, 일선사회복지사, 사회복지 전문요원으로 나누어졌을 때, 독립변수 각 범주별 모집단에서 월급여는 정규분포를 이루며, 또한 세 집단에서 월급여의 분산이 같다는 것.
⑤ 통계적으로 공분산으로 통제되는 변수는 등간-비율변수이어야 한다. 이 때 종속변수(월급여)와 공변수(근무시간)의 관계는 선형이다. 이 때 종속변수와 공변수의 상관관계계수(pearson\'s R)이 .06이상이면 공변량분석을 하여 공변수를 통제해주는 것이 독립변수의 효과를 살피는 것이 더 좋다.
추천자료
품질관리기사 1차 기출문제 돌발불량 설비 생산자 위험 소비자 위험 기울기
온라인 채팅에서 아바타의 도입이 사용자의 매체에 대한 인지에 미치는 영향
의료보험 지식경영시스템 구축방안에 관한 연구
DB마케팅을 통한 의류브랜드의 데이터 분석
미래 철도 교통 국내외 현황 및 파급효과
여행지 정보 검색싸이트의 서비스 품질 결정요인과 고객 만족에 관한 연구
전자상거래 신뢰성에 관한 연구_설문조사 결과를 각종통계분석
[사회학 A+] 여가기능 인식이 여가활동 선택에 미치는 영향 연구
자료수집 및 처리
[표본설계, 표본설계와 표본조사, 건설업 표본설계, 농업 표본설계, 어업 표본설계, 표본조사...
[측정]측정과 위험관리시스템 VAR측정, 측정과 자본비용측정, 측정과 부담비용측정, 측정과 ...
[브랜드자산][상표자산][브랜드자산 측정][브랜드자산 가치]브랜드자산(상표자산) 확장상표전...
[회계정보][회계정보 체계][회계정보 단체교섭][회계정보 기업도산예측][회계정보 주식평가]...
[기업마케팅][기업마케팅 특징][기업마케팅 배경][사회경제성][유통경로][기업마케팅 과제]기...
소개글