행정계량분석리포트
본 자료는 5페이지 의 미리보기를 제공합니다. 이미지를 클릭하여 주세요.
닫기
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
해당 자료는 5페이지 까지만 미리보기를 제공합니다.
5페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

행정계량분석리포트에 대한 보고서 자료입니다.

목차

제1장. 통계학과 자료

1. 통계학을 왜 배워야 하나?

2. 자료

3.변수

4. 실험연구

5. 경험적 연구

제2장. 히스토그램

1. 자료의 정리

2. 히스토그램의 예시

3. 히스토그램 그리기

4. 밀도단위

5. 통제의 변수: 따로따로 분석하기

제3장. 평균과 표준편차

1. 자료의 중심과 퍼진 정도

2. 평균, 중앙값, 최빈치

제4장. 정규분포로의 근사

1. 단위변환

2. 정규분포곡선

3. 표준정규분포곡선 아래의 영역 찿기

4. 자료에 대한 정규 근사

5. 백분위수

6. 사분위수와 상자그림

7. 백분위수와 정규분포곡선

제5장 상관관계

1. 산포도

2. 상관계수

3. 상관계수 구하기

5. 상관계수의 특징

6. 상관계수와 관련된 유의사항

6장. 회귀분석

1. 변수간의 관계

2. 평균의 그래프

3. 회귀분석방법

4. 회귀효과

5. y의 x에 대한 회귀직선과 x의y에 대한 회귀직선

7장. 회귀분석의 오차

1. 실제값과 추정치의 차이

2. 두 변수간의 상관계수를 이용한 RMSE의 계산

3. 잔차도

4. 세로띠

5. 세로띠 안의 분포를 정규분사로 근사시키기

제8장. 회귀직선

1. 기울기와 절편

2. 최소승자법

3. 회귀분석은 만병통치약이 아니다

본문내용

가지고 평균몸무게의 정보를 추정할 뿐이다. 회귀분석을 통해서 이 집
단의 평균을 추정하는 것이다. 여기서 추정할 때 주의 할 것은 기존의 자료로부터
구한 회귀직선이 이용된다. 이 방법은 기존의 자료가 새로운 개체를 대표할 수 있
는 경우 타당하다. 새로운 개체가 기존의 자료와 성격이 다르거나 자료의 범위가
다르면 회귀분석의 기계적 적용에 앞서 주의를 기울여야 한다.
4. 회귀효과
IQ검사를 아이들에게 하면 일차검사, 이차검사 자료에서 차이가 나는 경우가 있다.
그것은 검사사이에 차이가 있다는 것이다. 검사-재검사의 경우 첫 검사에서 낮은
집단은 두 번 째 검사에서 평균적으로 점수가 향상되고, 첫 번째 검사에서 점수가
높은 집단은 두 번째 검사에서 평균적으로 점수가 떨어지는 경우가 있다. 이를 두
고 회귀효과(regression effect)라 한다. 회귀효과는 개개의 자료를 나타내는 점들
이 하나의 직선상에 위치하지 않고 퍼져있기 때문에 발생한다. 그럼에도 불구하고
회귀효과가 뭔가 다른 중요한 이유 때문에 발생한다고 오해하는 경우가 있다. 이러
10
한 오해를 회귀효과(regression fallacy)라 부른다.
5. y의 x에 대한 회귀직선과 x의y에 대한 회귀직선
11
산포도상에 나타나는 회귀직선을 그릴 때 위 그림에서 보듯이 몸무게의 키에 대한 회귀직선을 나타내는 경우를 본다. 이때 각각의 부분집단별로 평균몸무게를 구해준다고 본다. 반면 오른쪽 그림은 몸무게 집단별로 평균키를 추정해주는 것이다. 즉 가로띠별로 그 중심을 구하는 것이다.
아래 그림은 남편과 아내들의 평균IQ를 생각하게 하는 그림이다. 여기서는 회귀직선이 두 개라는 사실을 유념해야 한다. 하나는 남편의 IQ 이고, 하나는 아내의 IQ라는 것이다. 즉 각 세로띠별로 그 세로 중심을 구하는 회귀직선이다.
7장. 회귀분석의 오차
1. 실제값과 추정치의 차이
회귀분석은 x로부터 y를 예측하는데 쓰인다. 그런데 실제의 값과 예측치 사이에는 차이가 나기 마련이다. 여기서 회귀직선의 제곱근-평균-제곱오차(RMSE)는 실제값과 예측치의 차이가 어느 정도인지를 알려준다. 회귀직선의 제곱근-평균-제곱오차는 추정의 표준오차 또는 회귀의 표준오차라고도 한다. 회귀분석을 이용하여 y값을 추정할 때 오차의 표준크기를 나타내 주기 때문이다. 추정오차(estimation error) 일반적으로 잔차(residual)라고 부른다. 잔차 또는 추정오차의 전반적인 크기는 제곱근-평균-제곱의 방식으로 측정한다.
2. 두 변수간의 상관계수를 이용한 RMSE의 계산
위의 왼쪽 그림은 회귀직선의 RMSE를, 오른쪽 그림은 y의 표준편차를 보여준다. y의 표준편차(SDy)는 y의 평균값을 지나는 수평선으로부터의 RMSE이다. 여기서 상관계수는 산포도상의 점들이 회귀직선 주위로 밀집해 있는 정도를 나타낸다. 또 이럴때 x값이 1SDx증가함에 따라 y값은 평균적으로 rSDy만큼 증가한다.
3. 잔차도
잔차를 도표상에서 보면 된다. x값은 그대로 둔 채, y값만을 잔차로 바꾸어 죄표축에 표시하면 된다. 잔차도를 보면 전반적으로 양의 값을 갖는 잔차들이 음의 값을 갖는 잔차들과 균형을 이루고 있다. 사실상 잔차들의 합과 평균은 모두 0이다.
잔차도상의 점들은 우상향하거나 우하향하는 등의 체계적인 선형 패턴을 보이지 않는다. 우상향하거나 우하향하는등 직선으로 표현되는 선형 패턴은 이미 회귀직선에 흡수되어 버렸기 때문에 더 이상 잔차도에 남아 있지 않다.
12
4. 세로띠
  
남성의 키가 대략 165㎝인 점들은 왼쪽의 세로띠 안에 들어 있다. 이 세로띠에 해당하는 사람들의 몸무게 히스토그램이 아래 그림에 실선으로 그려져 있다. 키가 대략 170㎝인 점들은 오른쪽 세로띠 안에 들어 있다. 세로띠 내에서 점들이 위 아래로 퍼진 정도가 세로띠마다 같을 때, 우리는 자료가 등분산성을 띤다고 한다. 세로띠별로 보면 몸무게의 범위, 즉 세로띠별로 최대값과 최소값의 차이는 세로띠마다 다르다. 또 산포도가 타원형일 때 세로띠별로 추정오차의 전반적인 크기는 어느 세
13
로띠 에서나 비슷한 것을 알 수 있다.
5. 세로띠 안의 분포를 정규분사로 근사시키기
앞의 그림에서 부듯이 종종 세로띠 안에 있는 점들의 분포를 정규분포로 근사시킬 수 있다. 그러기 위해서는 산포도가 타원형이어서 점들이 중앙에 몰려 잇고 가장자리로 갈수록 점들의 숫자가 줄어들어야 한다는 것이다. 혹 산포도가 이분산성을 띠거나, 잔차도가 비선형성을 보이면 근사시키기는 안좋다.
제8장. 회귀직선
1. 기울기와 절편
하나의 직선은 기울기와 절편으로 표현으로 된다. 교육과 소득의 관계를 볼 때 교육년수는 평균이 12.5년이고 표준편차가 2년이다. 여기에 소득은 163만원이고 표준편차가 77만원이다. 여기서 회귀직선은 우상향 한다. 교육을 많이 받으면 돈을 많이 버는 경향이 있다고 보는 것이다.
회귀직선의 기울기는 x가 1단위 증가할 때 y가 증가하는 정도를 나타낸다.
2. 최소승자법
산포도상의 점들이 어느 직선을 따르는 것처럼 보인다. 여기서 직선을 점들에 가까이 다가가게 하려면 첫째, 각각의 점으로부터 한 직선까지의 거리를 정의한다. 둘째, 전반적인 거리가 가능한 한 작아질 때까지 이 직선을 이동시켜 최적의 직선을 찾아낸다. 최적의 직선이 바로 회귀직선이고 이 직선에 대응하는 절편과 기울기가 바로 회귀직선을 규정하는 최소승자추정량이 된다. 다음으로 모든 직선 중에서 x를 통해 y를 추정할 때 발생하는 추정오차들의 전반적인 크기를 가장 작에 만들어주는 직선이 바로 y의 x에 대한 회귀직선이다.
3. 회귀분석은 만병통치약이 아니다
회귀직선을 그 어떤 산포도상에도 넣을 수 있지만 두 가지 사항을 고려해야 한다. 첫째로 변수간의 관계가 비선형성을 띠면 어떻게 할 것인가? 이때 회귀직선은 잘못된 정보를 준다는 것이다. 둘째로 변수간의 관계가 선형성을 보인다고 해서 회귀직선이 반드시 의미 잇다고 답하기는 곤란하다. 자료를 얻어내는 과정을 이해하지 못하면 회귀직선을 그리는 것은 주식시장의 ‘묻지마 투자’와 같은 것이다. 그러므로
14
모든 산포도상의 회귀분석이 만병통치약은 아니라는 것이다. “끝”

키워드

  • 가격2,500
  • 페이지수16페이지
  • 등록일2011.12.16
  • 저작시기2011.3
  • 파일형식한글(hwp)
  • 자료번호#720919
본 자료는 최근 2주간 다운받은 회원이 없습니다.
다운로드 장바구니