목차
분산분석-이원배치분산분석
분석도구(SPSS 이용)
분석결과
1)분산의 동질성 검정
2)모형의 타당성 검정(수정모형)
3)상호작용의 검정(2원-배치 상호작용)
4)주효과 검정(주효과)
5)결론
회귀분석-다중회귀분석
분석도구(SPSS)
분석결과
1)산점도
2)기술통계량 및 상관계수
3)모형 적합도
4)분산분석
5)추정된 회귀식
6)회귀진단(잔차 분석, 다중공선성진단)
7)결론
분석도구(SPSS 이용)
분석결과
1)분산의 동질성 검정
2)모형의 타당성 검정(수정모형)
3)상호작용의 검정(2원-배치 상호작용)
4)주효과 검정(주효과)
5)결론
회귀분석-다중회귀분석
분석도구(SPSS)
분석결과
1)산점도
2)기술통계량 및 상관계수
3)모형 적합도
4)분산분석
5)추정된 회귀식
6)회귀진단(잔차 분석, 다중공선성진단)
7)결론
본문내용
지막 방법을 이용하여 해석한다. 따라서, 추정된 회귀식은 가격= 4452.498 + 0.685*hou.size + 0.224*bedrooms + 0.14*bathrooms 이 된다. 여기서, 회귀계수를 비표준화 계수로 사용하지 않고, 표준화 계수로 사용한 것은 각 변수의 단위를 없애 독립변수가 종속변수에 미치는 영향정도를 상호비교하기 위해서 이다. 따라서, 각 독립변수 중 house size가 가격에 가장 많은 영향을 미친다고 말할 수 있다.
5)회귀진단
회귀진단은 개별 관측점의 특이성을 진단하는 것으로, 두 가지로 나누어 진다. 하나는 잔차분석이고, 다른 하나는 공선성진단이다.
①잔차분석
잔차가 오차항의 특성을 갖는다고 가정하고 잔차가 등분산성, 독립성, 정규성을 따르는지 조사하여야 한다. 그리고, 잔차의 산포형태를 통해서 회귀직선을 적합시킨 것이 타당한지 살펴보아야 한다.
잔차 통계량(a)
최소값
최대값
평균
표준편차
N
예측값
61366.7852
151248.0156
89725
22398.1009
20
잔차
-4873.6709
6248.4019
-3.27E-12
2923.7137
20
표준화 예측값
-1.266
2.747
0
1
20
표준화 잔차
-1.53
1.961
0
0.918
20
a 종속변수: 가격
위의 그림에서 보는 바와 같이 잔차는 정규성을 만족하고 있다. 히스토그램 중의 실선은 표준정규분포를 나타내고 있으며, 표준화잔차의 정규확률도표인 P-P도표는 도표상의 점들이 45도 직선 상에 놓여 있기 때문에 정규성을 만족한다고 볼 수 있다.
옆의 그림은 표준화잔차(*ZRESID)와 표준화예측값(*ZPRED)과의 관계를 보여준다. 원칙적으로 두 통계량은 무상관관계에 있어야 한다. 그림에서 보면, 어떤 일정한 패턴이 발견되지 않는 것으로 보아 두 통계량은 무상관관계에 있다고 말할 수 있으며, 등분산성이 만족했다고 볼 수 있다.
따라서, 살펴본 바와 같이 P-P도표를 통해 정규성을 확인하고, 산점도를 통해 등분산성을 확신하고, DW통계량을 통해 잔차의 독립성을 확인했다.
②다중공선성진단
다중회귀모형에서 가장 중요한 가정은 독립변수들이 서로 독립이라는 것이다. 그것을 확인하는 것이 다중공선성진단이다. 다중공선성은 두가지 방법으로 진단할 수 있다. 분산팽창계수(VIF)및 공차한계(Tolerence limit)을 보거나, 공선성 진단의 상태지수 값을 보는 것이다.
공선성 통계량
모형
공차한계
VIF
1
(상수)
HOU.SIZE
1
1
2
(상수)
HOU.SIZE
0.354
2.822
BEDROOMS
0.354
2.822
3
(상수)
HOU.SIZE
0.277
3.608
BEDROOMS
0.322
3.103
BATHROOM
0.354
2.822
분산팽창계수(VIF)가 10이상이거나, 공차한계가 0.1이하이면 다중공산성이 있다고 판단된다.
표에서 보면, 다중공선성이 존재하지 않음을 알 수 있다.
공선성 진단(a)
고유값
상태지수
분산비율
모형
차원
(상수)
HOU.SIZE
BEDROOMS
BATHROOM
1
1
1.955
1
0.02
0.02
2
4.46E-02
6.619
0.98
0.98
2
1
2.947
1
0
0
0
2
4.46E-02
8.126
0.34
0.35
0
3
7.88E-03
19.345
0.66
0.65
1
3
1
3.918
1
0
0
0
0
2
5.45E-02
8.478
0.32
0.09
0
0.12
3
1.95E-02
14.175
0.01
0.54
0.01
0.85
4
7.72E-03
22.529
0.67
0.37
0.98
0.03
a 종속변수: 가격
공선선 진단에서 상태지수 값이 30이상이면, 다중공선성이 있다고 판단한다. 표에서 보면, 상태지수값이 모두 30이하이므로 강한 다중공선성은 존재하지 않는다.
두 결과를 보았을 때, 독립변수들간 강한 다중공선성은 없으며, 따라서, 독립변수들이 서로 독립이라는 가정을 만족한다.
결론
가격이라는 종속변수와 4개의 독립변수들을 다중회귀분석으로 살펴본 결과 lot size라는 변수는 통계적으로 유의하지 못해 제거되었고, 추정된 회귀식은 다음과 같다.
가격= 4452.498 + 0.685*hou.size + 0.224*bedrooms + 0.14*bathrooms
여기서, 추정된 회귀식을 보면, 집값은 집의 크기가 가장 큰 영향을 미치고, 나머지 방의 개수나 화장실 개수는 약간의 영향을 미침을 알 수 있다.
회귀분석의 가정은 모두 만족함을 알 수 있었고, 회귀모형이 적합하다고 말할 수 있겠다.
5)회귀진단
회귀진단은 개별 관측점의 특이성을 진단하는 것으로, 두 가지로 나누어 진다. 하나는 잔차분석이고, 다른 하나는 공선성진단이다.
①잔차분석
잔차가 오차항의 특성을 갖는다고 가정하고 잔차가 등분산성, 독립성, 정규성을 따르는지 조사하여야 한다. 그리고, 잔차의 산포형태를 통해서 회귀직선을 적합시킨 것이 타당한지 살펴보아야 한다.
잔차 통계량(a)
최소값
최대값
평균
표준편차
N
예측값
61366.7852
151248.0156
89725
22398.1009
20
잔차
-4873.6709
6248.4019
-3.27E-12
2923.7137
20
표준화 예측값
-1.266
2.747
0
1
20
표준화 잔차
-1.53
1.961
0
0.918
20
a 종속변수: 가격
위의 그림에서 보는 바와 같이 잔차는 정규성을 만족하고 있다. 히스토그램 중의 실선은 표준정규분포를 나타내고 있으며, 표준화잔차의 정규확률도표인 P-P도표는 도표상의 점들이 45도 직선 상에 놓여 있기 때문에 정규성을 만족한다고 볼 수 있다.
옆의 그림은 표준화잔차(*ZRESID)와 표준화예측값(*ZPRED)과의 관계를 보여준다. 원칙적으로 두 통계량은 무상관관계에 있어야 한다. 그림에서 보면, 어떤 일정한 패턴이 발견되지 않는 것으로 보아 두 통계량은 무상관관계에 있다고 말할 수 있으며, 등분산성이 만족했다고 볼 수 있다.
따라서, 살펴본 바와 같이 P-P도표를 통해 정규성을 확인하고, 산점도를 통해 등분산성을 확신하고, DW통계량을 통해 잔차의 독립성을 확인했다.
②다중공선성진단
다중회귀모형에서 가장 중요한 가정은 독립변수들이 서로 독립이라는 것이다. 그것을 확인하는 것이 다중공선성진단이다. 다중공선성은 두가지 방법으로 진단할 수 있다. 분산팽창계수(VIF)및 공차한계(Tolerence limit)을 보거나, 공선성 진단의 상태지수 값을 보는 것이다.
공선성 통계량
모형
공차한계
VIF
1
(상수)
HOU.SIZE
1
1
2
(상수)
HOU.SIZE
0.354
2.822
BEDROOMS
0.354
2.822
3
(상수)
HOU.SIZE
0.277
3.608
BEDROOMS
0.322
3.103
BATHROOM
0.354
2.822
분산팽창계수(VIF)가 10이상이거나, 공차한계가 0.1이하이면 다중공산성이 있다고 판단된다.
표에서 보면, 다중공선성이 존재하지 않음을 알 수 있다.
공선성 진단(a)
고유값
상태지수
분산비율
모형
차원
(상수)
HOU.SIZE
BEDROOMS
BATHROOM
1
1
1.955
1
0.02
0.02
2
4.46E-02
6.619
0.98
0.98
2
1
2.947
1
0
0
0
2
4.46E-02
8.126
0.34
0.35
0
3
7.88E-03
19.345
0.66
0.65
1
3
1
3.918
1
0
0
0
0
2
5.45E-02
8.478
0.32
0.09
0
0.12
3
1.95E-02
14.175
0.01
0.54
0.01
0.85
4
7.72E-03
22.529
0.67
0.37
0.98
0.03
a 종속변수: 가격
공선선 진단에서 상태지수 값이 30이상이면, 다중공선성이 있다고 판단한다. 표에서 보면, 상태지수값이 모두 30이하이므로 강한 다중공선성은 존재하지 않는다.
두 결과를 보았을 때, 독립변수들간 강한 다중공선성은 없으며, 따라서, 독립변수들이 서로 독립이라는 가정을 만족한다.
결론
가격이라는 종속변수와 4개의 독립변수들을 다중회귀분석으로 살펴본 결과 lot size라는 변수는 통계적으로 유의하지 못해 제거되었고, 추정된 회귀식은 다음과 같다.
가격= 4452.498 + 0.685*hou.size + 0.224*bedrooms + 0.14*bathrooms
여기서, 추정된 회귀식을 보면, 집값은 집의 크기가 가장 큰 영향을 미치고, 나머지 방의 개수나 화장실 개수는 약간의 영향을 미침을 알 수 있다.
회귀분석의 가정은 모두 만족함을 알 수 있었고, 회귀모형이 적합하다고 말할 수 있겠다.
추천자료
- 신뢰성분석 및 요인분석
- 군집분석과 컨조인트분석
- 정신분석이론과 사례분석(프로이드 이론으로 유영철바라보기)
- [교육통계][교육통계 이론][교육통계문항분석][교육통계 내용][교육통계 사례][교육통계 제 ...
- SPSS 분석(인자분석, 군집분석)
- 프렌치 카페,네슬레,동서식품,맥심,커피시장분석,커피산업,브랜드마케팅,서비스마케팅,글로벌...
- [상권분석]상권분석(상권조사, 입지분석)의 정의, 유형, 상권분석(상권조사, 입지분석)의 경...
- [직무][직무태도][직무성과][직무특성][직무분석][직무발명][직무수행][직무만족]직무태도, ...
- [사회복지조사론] 통계분석의 이해 - 자료분석의 준비와 통계분석의 분류 및 기술통계와 분석...
- 시계열분석입문 - 담배값에 대한 시계열 분석
- [공공정책][정책][정당성][신공공관리주의]공공정책의 개념, 공공정책의 정당성, 공공정책의 ...
- 교사 효능감에 관한 국내외 연구동향 분석 (국내 문헌 연구 주제별 분석,국내외 문헌 관련 변...
- [★평가우수자료★] 정책 사례 분석 [수질오염총량관리제도] 수질오염총량관리제도 현황, 수질...