분산분석 및 회귀분석 분석사례(SPSS이용)
본 자료는 3페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
해당 자료는 3페이지 까지만 미리보기를 제공합니다.
3페이지 이후부터 다운로드 후 확인할 수 있습니다.

목차

분산분석-이원배치분산분석
분석도구(SPSS 이용)
분석결과
1)분산의 동질성 검정
2)모형의 타당성 검정(수정모형)
3)상호작용의 검정(2원-배치 상호작용)
4)주효과 검정(주효과)
5)결론
회귀분석-다중회귀분석
분석도구(SPSS)
분석결과
1)산점도
2)기술통계량 및 상관계수
3)모형 적합도
4)분산분석
5)추정된 회귀식
6)회귀진단(잔차 분석, 다중공선성진단)
7)결론

본문내용

지막 방법을 이용하여 해석한다. 따라서, 추정된 회귀식은 가격= 4452.498 + 0.685*hou.size + 0.224*bedrooms + 0.14*bathrooms 이 된다. 여기서, 회귀계수를 비표준화 계수로 사용하지 않고, 표준화 계수로 사용한 것은 각 변수의 단위를 없애 독립변수가 종속변수에 미치는 영향정도를 상호비교하기 위해서 이다. 따라서, 각 독립변수 중 house size가 가격에 가장 많은 영향을 미친다고 말할 수 있다.
5)회귀진단
회귀진단은 개별 관측점의 특이성을 진단하는 것으로, 두 가지로 나누어 진다. 하나는 잔차분석이고, 다른 하나는 공선성진단이다.
①잔차분석
잔차가 오차항의 특성을 갖는다고 가정하고 잔차가 등분산성, 독립성, 정규성을 따르는지 조사하여야 한다. 그리고, 잔차의 산포형태를 통해서 회귀직선을 적합시킨 것이 타당한지 살펴보아야 한다.
잔차 통계량(a)
최소값
최대값
평균
표준편차
N
예측값
61366.7852
151248.0156
89725
22398.1009
20
잔차
-4873.6709
6248.4019
-3.27E-12
2923.7137
20
표준화 예측값
-1.266
2.747
0
1
20
표준화 잔차
-1.53
1.961
0
0.918
20
a 종속변수: 가격
위의 그림에서 보는 바와 같이 잔차는 정규성을 만족하고 있다. 히스토그램 중의 실선은 표준정규분포를 나타내고 있으며, 표준화잔차의 정규확률도표인 P-P도표는 도표상의 점들이 45도 직선 상에 놓여 있기 때문에 정규성을 만족한다고 볼 수 있다.
옆의 그림은 표준화잔차(*ZRESID)와 표준화예측값(*ZPRED)과의 관계를 보여준다. 원칙적으로 두 통계량은 무상관관계에 있어야 한다. 그림에서 보면, 어떤 일정한 패턴이 발견되지 않는 것으로 보아 두 통계량은 무상관관계에 있다고 말할 수 있으며, 등분산성이 만족했다고 볼 수 있다.
따라서, 살펴본 바와 같이 P-P도표를 통해 정규성을 확인하고, 산점도를 통해 등분산성을 확신하고, DW통계량을 통해 잔차의 독립성을 확인했다.
②다중공선성진단
다중회귀모형에서 가장 중요한 가정은 독립변수들이 서로 독립이라는 것이다. 그것을 확인하는 것이 다중공선성진단이다. 다중공선성은 두가지 방법으로 진단할 수 있다. 분산팽창계수(VIF)및 공차한계(Tolerence limit)을 보거나, 공선성 진단의 상태지수 값을 보는 것이다.
공선성 통계량
모형
공차한계
VIF
1
(상수)
HOU.SIZE
1
1
2
(상수)
HOU.SIZE
0.354
2.822
BEDROOMS
0.354
2.822
3
(상수)
HOU.SIZE
0.277
3.608
BEDROOMS
0.322
3.103
BATHROOM
0.354
2.822
분산팽창계수(VIF)가 10이상이거나, 공차한계가 0.1이하이면 다중공산성이 있다고 판단된다.
표에서 보면, 다중공선성이 존재하지 않음을 알 수 있다.
공선성 진단(a)
고유값
상태지수
분산비율
모형
차원
(상수)
HOU.SIZE
BEDROOMS
BATHROOM
1
1
1.955
1
0.02
0.02
2
4.46E-02
6.619
0.98
0.98
2
1
2.947
1
0
0
0
2
4.46E-02
8.126
0.34
0.35
0
3
7.88E-03
19.345
0.66
0.65
1
3
1
3.918
1
0
0
0
0
2
5.45E-02
8.478
0.32
0.09
0
0.12
3
1.95E-02
14.175
0.01
0.54
0.01
0.85
4
7.72E-03
22.529
0.67
0.37
0.98
0.03
a 종속변수: 가격
공선선 진단에서 상태지수 값이 30이상이면, 다중공선성이 있다고 판단한다. 표에서 보면, 상태지수값이 모두 30이하이므로 강한 다중공선성은 존재하지 않는다.
두 결과를 보았을 때, 독립변수들간 강한 다중공선성은 없으며, 따라서, 독립변수들이 서로 독립이라는 가정을 만족한다.
결론
가격이라는 종속변수와 4개의 독립변수들을 다중회귀분석으로 살펴본 결과 lot size라는 변수는 통계적으로 유의하지 못해 제거되었고, 추정된 회귀식은 다음과 같다.
가격= 4452.498 + 0.685*hou.size + 0.224*bedrooms + 0.14*bathrooms
여기서, 추정된 회귀식을 보면, 집값은 집의 크기가 가장 큰 영향을 미치고, 나머지 방의 개수나 화장실 개수는 약간의 영향을 미침을 알 수 있다.
회귀분석의 가정은 모두 만족함을 알 수 있었고, 회귀모형이 적합하다고 말할 수 있겠다.

키워드

  • 가격1,500
  • 페이지수9페이지
  • 등록일2004.09.07
  • 저작시기2004.09
  • 파일형식한글(hwp)
  • 자료번호#265636
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니