목차
제 1 장 통계학이란 무엇인가?
제 2 장 자료의 구조.
제 3 장 확률과 확률분포
제 4 장 이항분포와 가설검정에서의 응용
제 5 장 정규분포
제 6 장 반복표본에서의 변동: 표본분포
제 2 장 자료의 구조.
제 3 장 확률과 확률분포
제 4 장 이항분포와 가설검정에서의 응용
제 5 장 정규분포
제 6 장 반복표본에서의 변동: 표본분포
본문내용
차 에 의해 뾰족한 정도가 결정되는 분포이다.
5.3 표준 정규분포(Standard normal distribution)
평균이 0이고 표준편차가 1인 정규분포를 표준정규분포라 하고 표준정규변수를 Z라 한다.
표준정규분포를 이용하면 앞에서 다룬 특수한 경우(확률변수 가 안에 드 는 경우)뿐만 아니라 정규분포에 대한 일반적인 확률을 구할 수 있다.
표준정규분포를 이용한 확률계산
=0 보다 적은 면적 = = 0.5
누적해서 50%에 해당하는 점 = = 0
정규분포표. p446
5.4 정규분포의 확률계산
일반적인 정규분포를 평균이 0이고 분산이 1인 표준정규분포로 만들어서 표를 이용하여 구할 수 있다.
정규분포의 표준화
확률변수 X가 를 따를 때, X에서 평균을 빼고 표준편차로 나눈 확률변수
를 표준화된 확률변수라 하고, 이 과정을 표준화라 한다.
5.5 이항분포의 정규근사(6장에서 설명)
5.6 생략
5.7 생략
제 6장. 반복표본에서의 변동: 표본분포
6.1 서론
1. 모수
- 어떤 모집단의 특성을 나타내는 양적인 측도를 말하며, 모평균, 모분산, 모비율 등이 있으며, 일반적으로 알려져 있지 않다.
2. 통계적 추론(statistical inference)
- 대상모집단으로부터 추출한 표본자료를 근거로 확률개념을 활용하여 이 모집단의 모수들에 대해 합리적인 의사결정을 내릴 수 있는 방법들을 모색하게 되는데 이러한 방법들을 연구하는 통계학분야를 말한다.
6.2 확률표본과 통계량
1. 확률표본(random sample)
- 확률변수들 이 독립이고, 이들 각각의 분포가 대상모집단의 분포 와 동일하면, 이 확률변수들 을 분포가 인 모집단으로부터의 크기가 인 확률표본이라고 한다.
2. 통계량
- 값이 알려져 있지 않은 모수들을 포함하지 않으며 관측 가능한 확률변수들 의 실수치함수를 말한다. 그리고 통계량 자체는 확률변수이다.
(예제) 크기가 인 확률표본을 라고 하자. 그러면 들 모두는 확률변수이다. 이때 , , , 등은 모두 통계량들이다. 그러나 값이 알려져 있지 않은 모수들 와 등이 포함되어 있는 , 등은 통계량들이 아니다.
(정의) 표본평균과 표본분산
- 개의 확률변수들을 라고 한다면, 이들의 표본평균 와 표본분산 은 각각 다음과 같이 정의된다.
,
3. 표본분포(sampling distribution)
- 어떠한 모집단으로부터 크기가 동일한 가능한 표본을 무수히 많이 뽑았을 때 그 모든 표본에서 나타난 통계량(평균, 분산, 비율 등)의 확률분포를 말한다.
6.3 표본평균 의 분포와 중심극한정리
1. 표본평균 의 분포
- 어떠한 모집단으로부터 선택 가능한 표본을 모두 추출했을 때 각 표본평균의 확률분포를 의미한다.
(1) 표본평균의 기대값과 분산
- 어떠한 모집단으로부터 크기가 동일한 가능한 표본을 모두 추출할 때 매 표본마다 평균값은 변한다.
① 표본평균의 기대값
② 표본평균의 분산
※ 표준오차(standard error)
- 표본평균의 표준편차 를 표본평균의 표준오차라고도 부른다.
※ 표본평균의 표준화
(예) 관측값들이 1, 2, 3, 4로 구성된 크기가 인 유한모집단을 고려하자. 확률변수 는 이 유한모집단의 관측값을 나타낸다고 할 때, 이 확률변수 의 분포는 다음과 같은 이산형 밀도함수를 갖는 이산형 균등분포를 따른다고 가정하자.
이때 이 모집단의 모평균 와 모분산 은 각각 다음과 같다.
(1) 모분산
(2) 모분산
- 특정표본의 표본평균값 (n=2인 경우)
() () ()
(1,1) 2/2 (2,4) 6/2 (4,3) 7/2
(1,2) 3/2 (3,1) 4/2 (4,4) 8/2
(1,3) 4/2 (3,2) 5/2
(1,4) 5/2 (3,3) 6/2
(2,1) 3/2 (3,4) 7/2
(2,2) 4/2 (4,1) 5/2
(2,3) 5/2 (4,2) 6/2
- 표본평균 의 확률분포표(n=2인 경우)
합계
확률
1.0
()
(정리) 평균이 이고 분산 은 유한인 임의의 모집단으로부터 크기가 인 확률표본에 의한 정의되는 표본평균 의 평균 와 분산 는 각각 다음과 같다.
,
2. 중심극한정리
(정리) 모집단이 정규모집단일때(정규분포를 따르는 경우) 표본평균 는 정규분포를 따른다.
평균이 이고 분산이 인 정규분포를 따르는 모집단에서 확률표본 을 추출하였을 때 이들의 평균인 표본평균 는 평균이 이고 분산이 인 정규분포를 따른다.
의 표준화.
참고) 의 표준화.
[실습 3] 어느 공장에서 생산되는 전구는 평균수명 2000시간, 표준편차 100시간으로 정규분포를 하도록 품질관리를 하고 있다. 이들 전구 가운데 임의로 36개의 제품을 뽑아 수명을 검사할 때 평균수명이 1950시간에서 2050시간 사이에 있을 확률을 다음의 절차를 따라 구하여라.
1) 전구 수명을 확률변수 X라 할 때 X는 를 따른다. 여기서 a,b를 구하라.
a = ( ), b = ( )
2) 36개의 제품의 평균수명 는 를 따른다. 여기서 c,d를 구하라.
c = ( ), d = = ( )
3) 를 표준화한 는 표준정규분포를 따른다는 성질을 이용하면 구하고자 하는 확률은 아래와 같이 구해진다.
= ( )
(정리) 중심극한정리(Central limit theorem)
- 평균이 이고 분산이 인 유한인 임의의 모집단으로부터 추출된 크기가 인 확률표본에 의해 정의되는 표본평균 의 분포는 표본크기 이 커짐에 따라 평균이 이고 분산은 인 정규분포에 접근한다. 따라서 확률변수 의 분포는 표본크기 이 커짐에 따라 표준정규분포 에 접근한다.
(예제) 어떤 공장에서 생산되는 전구들의 수명시간은 평균이 (시간)이고 표준편차는 (시간)임이 알려져 있다. 이 모집단으로부터 크기가 (개)인 확률분포의 표본평균수명시간 가 791시간 미만이 될 확률값을 구하라.
(풀이) 중심극한정리를 이용하여 의 분포를 근사적으로 평균이 이고, 분산은 인 정규분포로 취급할 수 있다. 따라서
(정리) 모비율이 인 이항모집단으로부터 크기가 인 확률표본에 의해 정의되는 표본비율 의 분포는 표본크기 이 커짐에 따라 평균이 p이고 분산은 인 정규분포에 접근한다. 따라서 확률변수 의 분포는 표본크기 이 커짐에 따라 표준정규분포 에 접근한다.
5.3 표준 정규분포(Standard normal distribution)
평균이 0이고 표준편차가 1인 정규분포를 표준정규분포라 하고 표준정규변수를 Z라 한다.
표준정규분포를 이용하면 앞에서 다룬 특수한 경우(확률변수 가 안에 드 는 경우)뿐만 아니라 정규분포에 대한 일반적인 확률을 구할 수 있다.
표준정규분포를 이용한 확률계산
=0 보다 적은 면적 = = 0.5
누적해서 50%에 해당하는 점 = = 0
정규분포표. p446
5.4 정규분포의 확률계산
일반적인 정규분포를 평균이 0이고 분산이 1인 표준정규분포로 만들어서 표를 이용하여 구할 수 있다.
정규분포의 표준화
확률변수 X가 를 따를 때, X에서 평균을 빼고 표준편차로 나눈 확률변수
를 표준화된 확률변수라 하고, 이 과정을 표준화라 한다.
5.5 이항분포의 정규근사(6장에서 설명)
5.6 생략
5.7 생략
제 6장. 반복표본에서의 변동: 표본분포
6.1 서론
1. 모수
- 어떤 모집단의 특성을 나타내는 양적인 측도를 말하며, 모평균, 모분산, 모비율 등이 있으며, 일반적으로 알려져 있지 않다.
2. 통계적 추론(statistical inference)
- 대상모집단으로부터 추출한 표본자료를 근거로 확률개념을 활용하여 이 모집단의 모수들에 대해 합리적인 의사결정을 내릴 수 있는 방법들을 모색하게 되는데 이러한 방법들을 연구하는 통계학분야를 말한다.
6.2 확률표본과 통계량
1. 확률표본(random sample)
- 확률변수들 이 독립이고, 이들 각각의 분포가 대상모집단의 분포 와 동일하면, 이 확률변수들 을 분포가 인 모집단으로부터의 크기가 인 확률표본이라고 한다.
2. 통계량
- 값이 알려져 있지 않은 모수들을 포함하지 않으며 관측 가능한 확률변수들 의 실수치함수를 말한다. 그리고 통계량 자체는 확률변수이다.
(예제) 크기가 인 확률표본을 라고 하자. 그러면 들 모두는 확률변수이다. 이때 , , , 등은 모두 통계량들이다. 그러나 값이 알려져 있지 않은 모수들 와 등이 포함되어 있는 , 등은 통계량들이 아니다.
(정의) 표본평균과 표본분산
- 개의 확률변수들을 라고 한다면, 이들의 표본평균 와 표본분산 은 각각 다음과 같이 정의된다.
,
3. 표본분포(sampling distribution)
- 어떠한 모집단으로부터 크기가 동일한 가능한 표본을 무수히 많이 뽑았을 때 그 모든 표본에서 나타난 통계량(평균, 분산, 비율 등)의 확률분포를 말한다.
6.3 표본평균 의 분포와 중심극한정리
1. 표본평균 의 분포
- 어떠한 모집단으로부터 선택 가능한 표본을 모두 추출했을 때 각 표본평균의 확률분포를 의미한다.
(1) 표본평균의 기대값과 분산
- 어떠한 모집단으로부터 크기가 동일한 가능한 표본을 모두 추출할 때 매 표본마다 평균값은 변한다.
① 표본평균의 기대값
② 표본평균의 분산
※ 표준오차(standard error)
- 표본평균의 표준편차 를 표본평균의 표준오차라고도 부른다.
※ 표본평균의 표준화
(예) 관측값들이 1, 2, 3, 4로 구성된 크기가 인 유한모집단을 고려하자. 확률변수 는 이 유한모집단의 관측값을 나타낸다고 할 때, 이 확률변수 의 분포는 다음과 같은 이산형 밀도함수를 갖는 이산형 균등분포를 따른다고 가정하자.
이때 이 모집단의 모평균 와 모분산 은 각각 다음과 같다.
(1) 모분산
(2) 모분산
- 특정표본의 표본평균값 (n=2인 경우)
() () ()
(1,1) 2/2 (2,4) 6/2 (4,3) 7/2
(1,2) 3/2 (3,1) 4/2 (4,4) 8/2
(1,3) 4/2 (3,2) 5/2
(1,4) 5/2 (3,3) 6/2
(2,1) 3/2 (3,4) 7/2
(2,2) 4/2 (4,1) 5/2
(2,3) 5/2 (4,2) 6/2
- 표본평균 의 확률분포표(n=2인 경우)
합계
확률
1.0
()
(정리) 평균이 이고 분산 은 유한인 임의의 모집단으로부터 크기가 인 확률표본에 의한 정의되는 표본평균 의 평균 와 분산 는 각각 다음과 같다.
,
2. 중심극한정리
(정리) 모집단이 정규모집단일때(정규분포를 따르는 경우) 표본평균 는 정규분포를 따른다.
평균이 이고 분산이 인 정규분포를 따르는 모집단에서 확률표본 을 추출하였을 때 이들의 평균인 표본평균 는 평균이 이고 분산이 인 정규분포를 따른다.
의 표준화.
참고) 의 표준화.
[실습 3] 어느 공장에서 생산되는 전구는 평균수명 2000시간, 표준편차 100시간으로 정규분포를 하도록 품질관리를 하고 있다. 이들 전구 가운데 임의로 36개의 제품을 뽑아 수명을 검사할 때 평균수명이 1950시간에서 2050시간 사이에 있을 확률을 다음의 절차를 따라 구하여라.
1) 전구 수명을 확률변수 X라 할 때 X는 를 따른다. 여기서 a,b를 구하라.
a = ( ), b = ( )
2) 36개의 제품의 평균수명 는 를 따른다. 여기서 c,d를 구하라.
c = ( ), d = = ( )
3) 를 표준화한 는 표준정규분포를 따른다는 성질을 이용하면 구하고자 하는 확률은 아래와 같이 구해진다.
= ( )
(정리) 중심극한정리(Central limit theorem)
- 평균이 이고 분산이 인 유한인 임의의 모집단으로부터 추출된 크기가 인 확률표본에 의해 정의되는 표본평균 의 분포는 표본크기 이 커짐에 따라 평균이 이고 분산은 인 정규분포에 접근한다. 따라서 확률변수 의 분포는 표본크기 이 커짐에 따라 표준정규분포 에 접근한다.
(예제) 어떤 공장에서 생산되는 전구들의 수명시간은 평균이 (시간)이고 표준편차는 (시간)임이 알려져 있다. 이 모집단으로부터 크기가 (개)인 확률분포의 표본평균수명시간 가 791시간 미만이 될 확률값을 구하라.
(풀이) 중심극한정리를 이용하여 의 분포를 근사적으로 평균이 이고, 분산은 인 정규분포로 취급할 수 있다. 따라서
(정리) 모비율이 인 이항모집단으로부터 크기가 인 확률표본에 의해 정의되는 표본비율 의 분포는 표본크기 이 커짐에 따라 평균이 p이고 분산은 인 정규분포에 접근한다. 따라서 확률변수 의 분포는 표본크기 이 커짐에 따라 표준정규분포 에 접근한다.