목차
1. 교재 p.160 예제 6-7의 데이터(어느 마을 초등학생 16명이 1년 동안 읽은 책 수)에 대하여 아래의 과정을 수행하시오.
(1) 히스토그램을 그리시오. (2점)
①코드 ②결과
(2) 상자그림을 그리시오. (2점)
①코드 ②결과
(3) 다섯수치요약을 산출하시오. (2점)
①코드 ②결과
(4) 이 16명의 데이터가 대표하는 모집단(어느 마을 초등학생 전체)에서 1년 동안 읽은 책 수의 평균이 14와 다르다고 할 수 있는지 유의수준 5%에서 검정하시오. (2점)
①코드 ②결과
2. 새로 개발된 다이어트 보조제의 효과를 알아보기 위하여 성인 12명의 자원자를 모집하여 몸무게를 측정하였다. 이후 3개월간 다이어트 보조제를 복용한 직후 다시한번 몸무게를 측정한 결과가 아래와 같다. 다이어트 보조제 복용 후 체중이 줄었다고 할 수 있는지 아래의 단계를 따라 단측검정하시오.
(1) 귀무가설은 무엇인가? (2점)
(2) 대립가설은 무엇인가? (2점)
(3) 대응표본 t-검정을 수행하시오. 유의확률은 얼마인가? (2점)
①코드 ②결과
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
3. 스마트폰을 가지고 있는 초등학생 100명을 랜덤으로 뽑았더니 그 중 30명이 안경을 쓰고 있었다. 스마트폰을 가지고 있지 않은 초등학생 150명을 랜덤으로 뽑았더니 그 중 20명이 안경을 쓰고 있었다. 스마트폰 소유 여부와 안경 착용 여부는 서로 독립인가? 아래의 단계를 따라 검정하시오.
(1) 귀무가설은 무엇인가? (2점)
(2) 대립가설은 무엇인가? (2점)
(3) 적절한 가설검정을 수행하시오. 유의확률은 얼마인가? (2점)
①코드 ②결과
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
4. 다음은 어느 학급의 학생 15명의 국어점수와 영어점수 데이터이다.
(1) 국어점수를 가로축으로, 영어점수를 세로축으로 하는 산점도를 그리시오. 산점도의 제목으로 본인의 학번을 넣으시오. (2점)
①코드 ②결과
(2) 국어점수와 영어점수의 상관계수를 계산하시오. (2점)
①코드 ②결과
(3) 국어점수를 독립변수로, 영어점수를 종속변수로 하는 회귀직선을 구하시오. 적합된 회귀모형에 따르면, 국어점수가 1점 높아지면 영어점수는 평균적으로 몇점 높아지는가? (2점)
①코드 ②결과
5. 참고문헌
(1) 히스토그램을 그리시오. (2점)
①코드 ②결과
(2) 상자그림을 그리시오. (2점)
①코드 ②결과
(3) 다섯수치요약을 산출하시오. (2점)
①코드 ②결과
(4) 이 16명의 데이터가 대표하는 모집단(어느 마을 초등학생 전체)에서 1년 동안 읽은 책 수의 평균이 14와 다르다고 할 수 있는지 유의수준 5%에서 검정하시오. (2점)
①코드 ②결과
2. 새로 개발된 다이어트 보조제의 효과를 알아보기 위하여 성인 12명의 자원자를 모집하여 몸무게를 측정하였다. 이후 3개월간 다이어트 보조제를 복용한 직후 다시한번 몸무게를 측정한 결과가 아래와 같다. 다이어트 보조제 복용 후 체중이 줄었다고 할 수 있는지 아래의 단계를 따라 단측검정하시오.
(1) 귀무가설은 무엇인가? (2점)
(2) 대립가설은 무엇인가? (2점)
(3) 대응표본 t-검정을 수행하시오. 유의확률은 얼마인가? (2점)
①코드 ②결과
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
3. 스마트폰을 가지고 있는 초등학생 100명을 랜덤으로 뽑았더니 그 중 30명이 안경을 쓰고 있었다. 스마트폰을 가지고 있지 않은 초등학생 150명을 랜덤으로 뽑았더니 그 중 20명이 안경을 쓰고 있었다. 스마트폰 소유 여부와 안경 착용 여부는 서로 독립인가? 아래의 단계를 따라 검정하시오.
(1) 귀무가설은 무엇인가? (2점)
(2) 대립가설은 무엇인가? (2점)
(3) 적절한 가설검정을 수행하시오. 유의확률은 얼마인가? (2점)
①코드 ②결과
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
4. 다음은 어느 학급의 학생 15명의 국어점수와 영어점수 데이터이다.
(1) 국어점수를 가로축으로, 영어점수를 세로축으로 하는 산점도를 그리시오. 산점도의 제목으로 본인의 학번을 넣으시오. (2점)
①코드 ②결과
(2) 국어점수와 영어점수의 상관계수를 계산하시오. (2점)
①코드 ②결과
(3) 국어점수를 독립변수로, 영어점수를 종속변수로 하는 회귀직선을 구하시오. 적합된 회귀모형에 따르면, 국어점수가 1점 높아지면 영어점수는 평균적으로 몇점 높아지는가? (2점)
①코드 ②결과
5. 참고문헌
본문내용
lue)은 0.215이다.
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
유의확률이 0.215로 유의수준 5%(0.05)보다 크므로 다이어트 보조제 복용 전후의 체중 차이가 없다는 귀무가설을 기각할 수 없다. 즉, 다이어트 보조제 복용 후 체중 감량 효과가 없다고 판단할 수 있다.
3. 스마트폰을 가지고 있는 초등학생 100명을 랜덤으로 뽑았더니 그 중 30명이 안경을 쓰고 있었다. 스마트폰을 가지고 있지 않은 초등학생 150명을 랜덤으로 뽑았더니 그 중 20명이 안경을 쓰고 있었다. 스마트폰 소유 여부와 안경 착용 여부는 서로 독립인가? 아래의 단계를 따라 검정하시오.
(1) 귀무가설은 무엇인가? (2점)
귀무가설(H0): 스마트폰 소유 여부와 안경 착용 여부는 서로 독립이다.
(2) 대립가설은 무엇인가? (2점)
대립가설(H1): 스마트폰 소유 여부와 안경 착용 여부는 서로 독립이 아니다.
(3) 적절한 가설검정을 수행하시오. 유의확률은 얼마인가? (2점)
카이제곱 독립성 검정을 통해 두 범주형 변수 사이에 통계적으로 유의미한 관계가 있는지 여부를 판단한다.
①코드
# 스마트폰 소유 여부에 따른 안경 착용 여부의 분할표 생성
data <- matrix(c(30, 70, 20, 130), nrow = 2, byrow = TRUE,
dimnames = list(c(\"스마트폰 있음\", \"스마트폰 없음\"), c(\"안경 착용\", \"안경 미착용\")))
data
# 카이제곱 독립성 검정
test_result <- chisq.test(data, correct=F)
# 검정 결과
test_result
# 다음 코드도 위 코드와 동일한 결과이다(교재의 예제 7-10 방식).
smartphone <- c(rep(\"YP\", 100), rep(\"NP\", 150))
glasses <- c(rep(\"YG\", 30), rep(\"NG\", 70), rep(\"YG\", 20), rep(\"NG\", 130))
sg <- data.frame(smartphone, glasses)
contingency_table <- xtabs(~smartphone+glasses, data=sg) # 분할표
contingency_table
chisq.test(contingency_table, correct=F) # 카이제곱 검정
correct=F는 연속성 수정을 하지 않는다는 것이다. 이산형 자료를 카이제곱 분포 등과 같이 연속형 분포와 비교할 때에는 이를 보정할 필요가 있는 이를 연속성 수정이라고 한다. 연속성 수정(Yates\' correction)은 주로 2x2 분할표에서 각 셀의 기대 빈도가 5 미만일 때 카이제곱 검정의 정확도를 높이기 위해 사용된다. 이 문제에서 분할표를 이용하여 각 셀의 기대 빈도를 구해보면 모두 5 이상이므로, 연속성 수정 없이 카이제곱 검정을 수행하는 것이 일반적으로 권장된다.
참고로 기대빈도 계산은 다음과 같다.
안경 착용
안경 미착용
합계
스마트폰 소유
30
70
100
스마트폰 미소유
20
130
150
합계
50
200
250
스마트폰 소유 & 안경 착용 기대 빈도:
스마트폰 소유 & 안경 미착용 기대 빈도:
스마트폰 미소유 & 안경 착용 기대 빈도:
스마트폰 미소유 & 안경 미착용 기대 빈도:
②결과
분할표(data)
따라서 유의확률은 0.001249이다.
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
유의확률 0.001249는 유의수준 0.05보다 매우 작으므로 귀무가설은 기각한다. 즉, 스마트폰 소유 여부와 안경 착용 여부는 서로 독립이 아니다.
4. 다음은 어느 학급의 학생 15명의 국어점수와 영어점수 데이터이다.
학생 번호
국어점수
영어점수
1
85
84
2
78
87
3
57
60
4
64
71
5
78
75
6
51
66
7
73
78
8
93
86
9
63
74
10
79
91
11
50
63
12
85
82
13
62
71
14
92
88
15
58
60
(1) 국어점수를 가로축으로, 영어점수를 세로축으로 하는 산점도를 그리시오. 산점도의 제목으로 본인의 학번을 넣으시오. (2점)
①코드
korean_scores <- c(85, 78, 57, 64, 78, 51, 73, 93, 63, 79, 50, 85, 62, 92, 58)
english_scores <- c(84, 87, 60, 71, 75, 66, 78, 86, 74, 91, 63, 82, 71, 88, 60)
plot(korean_scores, english_scores, main=\"학번\", xlab=\"국어점수\", ylab=\"영어점수\", pch=19, col=\"blue\")
# pch는 point symbol를 나타내는 정수(default=1)
②결과
(2) 국어점수와 영어점수의 상관계수를 계산하시오. (2점)
①코드
correlation_coefficient <- cor(korean_scores, english_scores)
print(correlation_coefficient)
②결과
(3) 국어점수를 독립변수로, 영어점수를 종속변수로 하는 회귀직선을 구하시오. 적합된 회귀모형에 따르면, 국어점수가 1점 높아지면 영어점수는 평균적으로 몇점 높아지는가? (2점)
①코드
model <- lm(english_scores ~ korean_scores)
summary(model)
②결과
따라서 회귀직선은 다음과 같다.
그리고 적합된 회귀모형에 따르면, 회귀직선의 기울기가 0.65이므로 국어점수가 1점 높아질 때 영어점수는 평균적으로 약 0.65점 높아진다. 즉, 기울기는 독립변수(국어점수)가 한 단위 변할 때 종속변수(영어점수)가 얼마나 변하는지를 나타낸다.
총변동에서 회귀변동이 차지하는 비율인 결정계수(R-Square)는 0과 1사이의 값으로 자료에 회귀선이 잘 적합되면 1에 가깝고, 그렇지 않으면 0에 가까워진다. 결정계수가 0.7882이므로 잘 적합된 회귀선이고, 유의확률은 9.974e-6으로 유의수준 0.05보다 매우 작으므로 회귀모형은 통계적으로 유의하다고 판단한다.
5. 참고문헌
박서영·이기재·이긍희·장영재(2022). 통계학개론. 방송통신대학교출판문화원.
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
유의확률이 0.215로 유의수준 5%(0.05)보다 크므로 다이어트 보조제 복용 전후의 체중 차이가 없다는 귀무가설을 기각할 수 없다. 즉, 다이어트 보조제 복용 후 체중 감량 효과가 없다고 판단할 수 있다.
3. 스마트폰을 가지고 있는 초등학생 100명을 랜덤으로 뽑았더니 그 중 30명이 안경을 쓰고 있었다. 스마트폰을 가지고 있지 않은 초등학생 150명을 랜덤으로 뽑았더니 그 중 20명이 안경을 쓰고 있었다. 스마트폰 소유 여부와 안경 착용 여부는 서로 독립인가? 아래의 단계를 따라 검정하시오.
(1) 귀무가설은 무엇인가? (2점)
귀무가설(H0): 스마트폰 소유 여부와 안경 착용 여부는 서로 독립이다.
(2) 대립가설은 무엇인가? (2점)
대립가설(H1): 스마트폰 소유 여부와 안경 착용 여부는 서로 독립이 아니다.
(3) 적절한 가설검정을 수행하시오. 유의확률은 얼마인가? (2점)
카이제곱 독립성 검정을 통해 두 범주형 변수 사이에 통계적으로 유의미한 관계가 있는지 여부를 판단한다.
①코드
# 스마트폰 소유 여부에 따른 안경 착용 여부의 분할표 생성
data <- matrix(c(30, 70, 20, 130), nrow = 2, byrow = TRUE,
dimnames = list(c(\"스마트폰 있음\", \"스마트폰 없음\"), c(\"안경 착용\", \"안경 미착용\")))
data
# 카이제곱 독립성 검정
test_result <- chisq.test(data, correct=F)
# 검정 결과
test_result
# 다음 코드도 위 코드와 동일한 결과이다(교재의 예제 7-10 방식).
smartphone <- c(rep(\"YP\", 100), rep(\"NP\", 150))
glasses <- c(rep(\"YG\", 30), rep(\"NG\", 70), rep(\"YG\", 20), rep(\"NG\", 130))
sg <- data.frame(smartphone, glasses)
contingency_table <- xtabs(~smartphone+glasses, data=sg) # 분할표
contingency_table
chisq.test(contingency_table, correct=F) # 카이제곱 검정
correct=F는 연속성 수정을 하지 않는다는 것이다. 이산형 자료를 카이제곱 분포 등과 같이 연속형 분포와 비교할 때에는 이를 보정할 필요가 있는 이를 연속성 수정이라고 한다. 연속성 수정(Yates\' correction)은 주로 2x2 분할표에서 각 셀의 기대 빈도가 5 미만일 때 카이제곱 검정의 정확도를 높이기 위해 사용된다. 이 문제에서 분할표를 이용하여 각 셀의 기대 빈도를 구해보면 모두 5 이상이므로, 연속성 수정 없이 카이제곱 검정을 수행하는 것이 일반적으로 권장된다.
참고로 기대빈도 계산은 다음과 같다.
안경 착용
안경 미착용
합계
스마트폰 소유
30
70
100
스마트폰 미소유
20
130
150
합계
50
200
250
스마트폰 소유 & 안경 착용 기대 빈도:
스마트폰 소유 & 안경 미착용 기대 빈도:
스마트폰 미소유 & 안경 착용 기대 빈도:
스마트폰 미소유 & 안경 미착용 기대 빈도:
②결과
분할표(data)
따라서 유의확률은 0.001249이다.
(4) 유의수준 5%에서 가설검정의 결론은 무엇인가? (2점)
유의확률 0.001249는 유의수준 0.05보다 매우 작으므로 귀무가설은 기각한다. 즉, 스마트폰 소유 여부와 안경 착용 여부는 서로 독립이 아니다.
4. 다음은 어느 학급의 학생 15명의 국어점수와 영어점수 데이터이다.
학생 번호
국어점수
영어점수
1
85
84
2
78
87
3
57
60
4
64
71
5
78
75
6
51
66
7
73
78
8
93
86
9
63
74
10
79
91
11
50
63
12
85
82
13
62
71
14
92
88
15
58
60
(1) 국어점수를 가로축으로, 영어점수를 세로축으로 하는 산점도를 그리시오. 산점도의 제목으로 본인의 학번을 넣으시오. (2점)
①코드
korean_scores <- c(85, 78, 57, 64, 78, 51, 73, 93, 63, 79, 50, 85, 62, 92, 58)
english_scores <- c(84, 87, 60, 71, 75, 66, 78, 86, 74, 91, 63, 82, 71, 88, 60)
plot(korean_scores, english_scores, main=\"학번\", xlab=\"국어점수\", ylab=\"영어점수\", pch=19, col=\"blue\")
# pch는 point symbol를 나타내는 정수(default=1)
②결과
(2) 국어점수와 영어점수의 상관계수를 계산하시오. (2점)
①코드
correlation_coefficient <- cor(korean_scores, english_scores)
print(correlation_coefficient)
②결과
(3) 국어점수를 독립변수로, 영어점수를 종속변수로 하는 회귀직선을 구하시오. 적합된 회귀모형에 따르면, 국어점수가 1점 높아지면 영어점수는 평균적으로 몇점 높아지는가? (2점)
①코드
model <- lm(english_scores ~ korean_scores)
summary(model)
②결과
따라서 회귀직선은 다음과 같다.
그리고 적합된 회귀모형에 따르면, 회귀직선의 기울기가 0.65이므로 국어점수가 1점 높아질 때 영어점수는 평균적으로 약 0.65점 높아진다. 즉, 기울기는 독립변수(국어점수)가 한 단위 변할 때 종속변수(영어점수)가 얼마나 변하는지를 나타낸다.
총변동에서 회귀변동이 차지하는 비율인 결정계수(R-Square)는 0과 1사이의 값으로 자료에 회귀선이 잘 적합되면 1에 가깝고, 그렇지 않으면 0에 가까워진다. 결정계수가 0.7882이므로 잘 적합된 회귀선이고, 유의확률은 9.974e-6으로 유의수준 0.05보다 매우 작으므로 회귀모형은 통계적으로 유의하다고 판단한다.
5. 참고문헌
박서영·이기재·이긍희·장영재(2022). 통계학개론. 방송통신대학교출판문화원.
소개글