목차
1 실험계획의 기본개념
1) 실험목적의 설정
2) 특성치의 선택
3) 인자와 인자수준 및 반복수의 선택
4) 실험의 배치와 실험순서의 랜덤화
5) 실험의 실시
6) 데이터의 분석
7) 분석결과의 해석과 조치
2 분산분석의 개념
3 반복수가 같은 일원배치법
⑴ 일원배치실험의 개념
⑵ 데이터의 구조
⑶ 분산분석표의 작성
⑷ 모평균의 추정
4 반복수가 같지 않은 일원배치법
⑴ 제곱합의 계산
5 이원배치법의 개념
6 변동의 분해와 계산
6 변동의 분해와 계산
7 분산분석표의 작성
8 모평균의 추정
1) 실험목적의 설정
2) 특성치의 선택
3) 인자와 인자수준 및 반복수의 선택
4) 실험의 배치와 실험순서의 랜덤화
5) 실험의 실시
6) 데이터의 분석
7) 분석결과의 해석과 조치
2 분산분석의 개념
3 반복수가 같은 일원배치법
⑴ 일원배치실험의 개념
⑵ 데이터의 구조
⑶ 분산분석표의 작성
⑷ 모평균의 추정
4 반복수가 같지 않은 일원배치법
⑴ 제곱합의 계산
5 이원배치법의 개념
6 변동의 분해와 계산
6 변동의 분해와 계산
7 분산분석표의 작성
8 모평균의 추정
본문내용
이 LSD보다 작으면 두 수준간의 차이는 유의하지 않다고 결론짓는 것이 계산방법이 될 것이다. 이러한 수준별 모평균의 차이 검정도 컴퓨터에 의해 출력되므로 각각의 유의확률(P-Value)에 의한 유의성 검정만 실시하면 된다.
4 반복수가 같지 않은 일원배치법
실제의 일원배치실험에서는 다음과 같은 이유 등으로 인하여 수준에서 서로 다른 개의 반복을 가진 데이터를 얻게 되는 경우가 있다.(결측치(missing value))
① 측정에 실패하거나, 결측치(missing value)가 생기거나 하여 같은 수의 표본(또는 시료)이 얻어지는 경우
② 어떤 특정의 수준에 대하여 모평균 추정의 정도(precision)를 높이기 위하여 반복수가 다른 수준보다 많게 할 경우
⑴ 제곱합의 계산
표(9-3) 반복이 같지 않은 일원배치법 데이터의 배열
반복수가 일정하지 않은 경우에도 모든 실험을 랜덤화 순서로 행하는 것이 원칙이며, 얻어진 데이터를 정리하면 위 표(9-3)과 같다.
전체데이터의 수를 로 놓으면 , , 의 계산공식은 다음과 같다.
반복수가 같은 경우와는 약간의 차이가 있으니 유의해야 한다.
다음으로 각 변동들의 자유도도 약간의 차이를 갖게 된다. 즉,
, , 이다. 따라서 의 100(1-)% 신뢰구간은
이다. 두 수준 와 간의 모평균차의 구간추정을 해보자.
점추정값은 이며, 이의 분산은 오차항의 독립성으로부터
이 얻어진다.
따라서 이 분산의 추정값은이며, 의 100(1-)% 신뢰구간은
이다.
5 이원배치법의 개념
일원배치법에서는 문제가 되는 인자로 하나만을 취하고, 인자로서 취급되지 않았던 여러 가지 조건들은 일정하게 한 후에 전체를 랜덤화하여 실험하였다. 이원배치법이란 문제가 되는 인자 두 개를 취하여 행하는 실험으로 반복이 없는 이원배치법은 인자의 수준을 조합한 모든 조건에서 실험의 반복을 행하지 않는 경우이다.
예를 들면, 시멘트의 압축강도가 소성온도 , , 에 따라 차이가 있는지의 여부를 알고 싶을 때, 소성시간에 의한 영향도 알아보고 싶으므로 소성시간 , , 에 따라 합계 3×3 = 9회 실험했다. 이렇게 9개의 수준조합에서 압축강도에 유의한 영향을 주는지를 검정하고, 더 나아가서 어떤 수준의 조합에서 가장 바람직한 압축강도를 주는지를 실험하는 것이 이원배치의 실험이 된다.
실험의 랜덤화는 실험전체를 완전랜덤화(complete randomization)하는 것이 원칙이다. 예를 들면, 어떤 열처리공정에 있어서 열처리 압력 , , 와 열처리 온도 , , 에 대한 실험을 계획할 때 12회의 처리조건이 있으므로, 이들 12회의 실험전체를 랜덤하게 행하여야 한다.
인자의 수준수가 이고 인자의 수준수가 인 반복이 없는 이원배치법의 데이터 구조식은 다음과 같다.
이원배치법의 데이터 구조식
, 는 이고 서로 독립
여기서 = 실험전체의 모평균
= 가 주는 효과
= 가 주는 효과
= 와 에서 얻은 측정값
= 와 에서 얻은 측정값의 오차를 의미하고 인자 , 가 모두 모수인자라 할 때 , 을 가정한다.
표(9-4) 반복이 없는 이원배치법의 데이터의 배열
을 의미한다.
6 변동의 분해와 계산
개개의 데이터 와 총평균 의 차이는 다음과 같이 세 부분으로 나누어진다.
양변을 제곱한 후에 모든 와 에 대하여 합하면 다음의 등식을 얻는다.
위 식에서 왼쪽 항은 총변동 이고, 오른쪽 항은 차례대로 의 변동, 의 변동, 오차변동인 , ,가 된다.실제로 데이터로부터 변동을 계산할 때에는 좀 더 간편한 공식으로 다음을 이용하는 것이 편리하다.
7 분산분석표의 작성
반복이 없는 이원배치법의 분산분석표를 작성하면 아래 표(9-5)와 같다.
여기에서 만약 이면 귀무가설
(또는 )은 유의수준 에서 기각된다. 귀무가설이 기각되면 의 변동 가 유의하게 크다고 말하고 인자의 각 수준에서의 모평균 간에는 차가 있다는 의미가 된다. 에서의 모평균을 편의상 로 표현하면 이는 = 로 쓸 수 있으므로 귀무가설은
과 동일하다.
표(9-5) 반복이 없는 이원배치법의 분산분석표(ANOVA Table)
마찬가지로 만약 이면 귀무가설
(또는 ) 은 유의수준 에서 기각된다. 귀무가설이 기각되면 의 변동 가 유의하게 크다고 말하고 인자의 각 수준에서의 모평균 간에는 차가 있다는 의미가 된다. 에서의 모평균을 로 놓으면 귀무가설은 과 같으며, 이 귀무가설이 기각되면 인자의 수준 간에 모평균의 차가 있는 것이 존재한다는 의미가 된다.
8 모평균의 추정
분산분석표를 작성하여 -검정만으로 데이터의 분석이 끝나서는 실험계획법에 의한 자료의 활용이 충분하다고 볼 수 없고, 반드시 분산분석 후에 각종의 추정을 행하여 줌으로써 분석결과를 실제로 최적조건의 선정에 응용할 수 있도록 유도하여야 한다. 분산분석 후의 추정으로 다음의 세 가지를 검토해 보자.
① 인자 의 모평균 추정
② 인자 의 모평균 추정
③ 두 인자의 수준을 조합한 조건에서의 모평균의 추정
먼저 인자 의 수준에서의 모평균은 이며,
이의 분산은 임을 알 수 있다.
따라서 위에 추정된 값을 이용하여 의 100 (1- )% 신뢰구간은
표현된다.
두 번째로 인자 의 수준에서의 모평균 의 구간추정을 구하여 보자.
이며, 이의 분산이 이므로
의 추정된 100 (1- )% 신뢰구간은 임을 알 수 있다.
다음으로 두 인자 , 의 수준을 조합한 조건에 있어서 모평균의 추정을 해보자.
일반적으로, 인자의 구간추정이나 인자의 구간추정은 , 가 분산분석표의 -검정으로부터 유의하게 판정되어야만 행하는 것이 보통이다. 두 인자의 수준조합에서 모평균의 추정도 , 가 모두 유의한 경우에 의미가 있다고 말할 수 있다. 그러나 경우에 따라서 인자 가 유의하지 않더라도 경제적 조건 등으로 인하여 를 어떤 수준에 고정하고 공정의 대책을 수립하고자 하는 경우에는 , 의 조합조건에서 모평균의 추정을 행하여 볼 필요가 있다.
인자의 수준과 인자의 수준에서의 모평균의 점추정값은
이다.
이의 분산은 다음과 같다.
우변의 분모를 반복이 없는 이원배치법의 유효반복수(effective number of replication)라고 부르며 흔히 로 나타낸다. 즉, 이다.
따라서 의 100 (1- )% 신뢰구간은 가 된다.
4 반복수가 같지 않은 일원배치법
실제의 일원배치실험에서는 다음과 같은 이유 등으로 인하여 수준에서 서로 다른 개의 반복을 가진 데이터를 얻게 되는 경우가 있다.(결측치(missing value))
① 측정에 실패하거나, 결측치(missing value)가 생기거나 하여 같은 수의 표본(또는 시료)이 얻어지는 경우
② 어떤 특정의 수준에 대하여 모평균 추정의 정도(precision)를 높이기 위하여 반복수가 다른 수준보다 많게 할 경우
⑴ 제곱합의 계산
표(9-3) 반복이 같지 않은 일원배치법 데이터의 배열
반복수가 일정하지 않은 경우에도 모든 실험을 랜덤화 순서로 행하는 것이 원칙이며, 얻어진 데이터를 정리하면 위 표(9-3)과 같다.
전체데이터의 수를 로 놓으면 , , 의 계산공식은 다음과 같다.
반복수가 같은 경우와는 약간의 차이가 있으니 유의해야 한다.
다음으로 각 변동들의 자유도도 약간의 차이를 갖게 된다. 즉,
, , 이다. 따라서 의 100(1-)% 신뢰구간은
이다. 두 수준 와 간의 모평균차의 구간추정을 해보자.
점추정값은 이며, 이의 분산은 오차항의 독립성으로부터
이 얻어진다.
따라서 이 분산의 추정값은이며, 의 100(1-)% 신뢰구간은
이다.
5 이원배치법의 개념
일원배치법에서는 문제가 되는 인자로 하나만을 취하고, 인자로서 취급되지 않았던 여러 가지 조건들은 일정하게 한 후에 전체를 랜덤화하여 실험하였다. 이원배치법이란 문제가 되는 인자 두 개를 취하여 행하는 실험으로 반복이 없는 이원배치법은 인자의 수준을 조합한 모든 조건에서 실험의 반복을 행하지 않는 경우이다.
예를 들면, 시멘트의 압축강도가 소성온도 , , 에 따라 차이가 있는지의 여부를 알고 싶을 때, 소성시간에 의한 영향도 알아보고 싶으므로 소성시간 , , 에 따라 합계 3×3 = 9회 실험했다. 이렇게 9개의 수준조합에서 압축강도에 유의한 영향을 주는지를 검정하고, 더 나아가서 어떤 수준의 조합에서 가장 바람직한 압축강도를 주는지를 실험하는 것이 이원배치의 실험이 된다.
실험의 랜덤화는 실험전체를 완전랜덤화(complete randomization)하는 것이 원칙이다. 예를 들면, 어떤 열처리공정에 있어서 열처리 압력 , , 와 열처리 온도 , , 에 대한 실험을 계획할 때 12회의 처리조건이 있으므로, 이들 12회의 실험전체를 랜덤하게 행하여야 한다.
인자의 수준수가 이고 인자의 수준수가 인 반복이 없는 이원배치법의 데이터 구조식은 다음과 같다.
이원배치법의 데이터 구조식
, 는 이고 서로 독립
여기서 = 실험전체의 모평균
= 가 주는 효과
= 가 주는 효과
= 와 에서 얻은 측정값
= 와 에서 얻은 측정값의 오차를 의미하고 인자 , 가 모두 모수인자라 할 때 , 을 가정한다.
표(9-4) 반복이 없는 이원배치법의 데이터의 배열
을 의미한다.
6 변동의 분해와 계산
개개의 데이터 와 총평균 의 차이는 다음과 같이 세 부분으로 나누어진다.
양변을 제곱한 후에 모든 와 에 대하여 합하면 다음의 등식을 얻는다.
위 식에서 왼쪽 항은 총변동 이고, 오른쪽 항은 차례대로 의 변동, 의 변동, 오차변동인 , ,가 된다.실제로 데이터로부터 변동을 계산할 때에는 좀 더 간편한 공식으로 다음을 이용하는 것이 편리하다.
7 분산분석표의 작성
반복이 없는 이원배치법의 분산분석표를 작성하면 아래 표(9-5)와 같다.
여기에서 만약 이면 귀무가설
(또는 )은 유의수준 에서 기각된다. 귀무가설이 기각되면 의 변동 가 유의하게 크다고 말하고 인자의 각 수준에서의 모평균 간에는 차가 있다는 의미가 된다. 에서의 모평균을 편의상 로 표현하면 이는 = 로 쓸 수 있으므로 귀무가설은
과 동일하다.
표(9-5) 반복이 없는 이원배치법의 분산분석표(ANOVA Table)
마찬가지로 만약 이면 귀무가설
(또는 ) 은 유의수준 에서 기각된다. 귀무가설이 기각되면 의 변동 가 유의하게 크다고 말하고 인자의 각 수준에서의 모평균 간에는 차가 있다는 의미가 된다. 에서의 모평균을 로 놓으면 귀무가설은 과 같으며, 이 귀무가설이 기각되면 인자의 수준 간에 모평균의 차가 있는 것이 존재한다는 의미가 된다.
8 모평균의 추정
분산분석표를 작성하여 -검정만으로 데이터의 분석이 끝나서는 실험계획법에 의한 자료의 활용이 충분하다고 볼 수 없고, 반드시 분산분석 후에 각종의 추정을 행하여 줌으로써 분석결과를 실제로 최적조건의 선정에 응용할 수 있도록 유도하여야 한다. 분산분석 후의 추정으로 다음의 세 가지를 검토해 보자.
① 인자 의 모평균 추정
② 인자 의 모평균 추정
③ 두 인자의 수준을 조합한 조건에서의 모평균의 추정
먼저 인자 의 수준에서의 모평균은 이며,
이의 분산은 임을 알 수 있다.
따라서 위에 추정된 값을 이용하여 의 100 (1- )% 신뢰구간은
표현된다.
두 번째로 인자 의 수준에서의 모평균 의 구간추정을 구하여 보자.
이며, 이의 분산이 이므로
의 추정된 100 (1- )% 신뢰구간은 임을 알 수 있다.
다음으로 두 인자 , 의 수준을 조합한 조건에 있어서 모평균의 추정을 해보자.
일반적으로, 인자의 구간추정이나 인자의 구간추정은 , 가 분산분석표의 -검정으로부터 유의하게 판정되어야만 행하는 것이 보통이다. 두 인자의 수준조합에서 모평균의 추정도 , 가 모두 유의한 경우에 의미가 있다고 말할 수 있다. 그러나 경우에 따라서 인자 가 유의하지 않더라도 경제적 조건 등으로 인하여 를 어떤 수준에 고정하고 공정의 대책을 수립하고자 하는 경우에는 , 의 조합조건에서 모평균의 추정을 행하여 볼 필요가 있다.
인자의 수준과 인자의 수준에서의 모평균의 점추정값은
이다.
이의 분산은 다음과 같다.
우변의 분모를 반복이 없는 이원배치법의 유효반복수(effective number of replication)라고 부르며 흔히 로 나타낸다. 즉, 이다.
따라서 의 100 (1- )% 신뢰구간은 가 된다.