목차
1. (25점) 다음을 SAS를 이용하여 작성하시오.
1) 교재 5장 연습문제(p.208) 2, 10번
(2번) 다음은 상장된 금융사 중 외국기업(F)과 내국기업(K)의 주가이다. 외국기업과 내국기업별로 기술통계량을 구하고 줄기-잎 그림, 상자그림을 그려서 비교·분석하라.
(10번) 부모와 자식 간 정치 성향의 관련성에 관한 미국의 연구자료이다. 부모의 정치활동 수준이 활동적인 경우와 비활동적인 경우 각각에 대해서 분할표를 만든 다음 카이제곱 검정을 시행하라. 어떤 결론을 내릴 수 있는가? 민주당은 진보적, 공화당은 보수적이다.
2) 교재 6장 연습문제(p.235) 3번, 5번
(3번)어떤 화학약품의 제조에 상표가 다른 두 종류의 원료가 사용되고 있다. 각 원료에서 주성분 A의 함량은 다음과 같다. 단, 함량은 정규분포를 따른다고 가정한다. 이 두 원료의 주성분 A의 함량이 다른지를 분석하라.
(5번)고등학교 육상선수에게 체중감량을 시키면 달리기에 어떤 변화가 일어나는지 조사하기 위하여, 어떤 고등학교 육상선수 10명에게 감량훈련(2~4kg 정도)을 시킨 후 100m 달리기를 실시하여 다음의 데이터를 얻었다. 감량 전과 후에 달리기 속도에 차이가 있는지 대응·비교하라.
3) 교재 7장 연습문제(p.277) 6번
(6번)다음은 13개 시중은행에 대한 편리성, 신속성, 친절, 능률, 쾌적, 자동화 등의 점수를 나타내고 있는 자료이다.
1) 교재 5장 연습문제(p.208) 2, 10번
(2번) 다음은 상장된 금융사 중 외국기업(F)과 내국기업(K)의 주가이다. 외국기업과 내국기업별로 기술통계량을 구하고 줄기-잎 그림, 상자그림을 그려서 비교·분석하라.
(10번) 부모와 자식 간 정치 성향의 관련성에 관한 미국의 연구자료이다. 부모의 정치활동 수준이 활동적인 경우와 비활동적인 경우 각각에 대해서 분할표를 만든 다음 카이제곱 검정을 시행하라. 어떤 결론을 내릴 수 있는가? 민주당은 진보적, 공화당은 보수적이다.
2) 교재 6장 연습문제(p.235) 3번, 5번
(3번)어떤 화학약품의 제조에 상표가 다른 두 종류의 원료가 사용되고 있다. 각 원료에서 주성분 A의 함량은 다음과 같다. 단, 함량은 정규분포를 따른다고 가정한다. 이 두 원료의 주성분 A의 함량이 다른지를 분석하라.
(5번)고등학교 육상선수에게 체중감량을 시키면 달리기에 어떤 변화가 일어나는지 조사하기 위하여, 어떤 고등학교 육상선수 10명에게 감량훈련(2~4kg 정도)을 시킨 후 100m 달리기를 실시하여 다음의 데이터를 얻었다. 감량 전과 후에 달리기 속도에 차이가 있는지 대응·비교하라.
3) 교재 7장 연습문제(p.277) 6번
(6번)다음은 13개 시중은행에 대한 편리성, 신속성, 친절, 능률, 쾌적, 자동화 등의 점수를 나타내고 있는 자료이다.
본문내용
달리기 속도가 같다”는 귀무가설을 기각하지 못한다. 즉, 감량 전과 감량 후의 달기기 속도에 차이가 없다.
3) 교재 7장 연습문제(p.277) 6번
(6번)다음은 13개 시중은행에 대한 편리성, 신속성, 친절, 능률, 쾌적, 자동화 등의 점수를 나타내고 있는 자료이다.
convenience
accuracy
kindness
efficiency
pleasant
automatic
Kookmin
70.5
59.4
63.7
54.3
66.9
62.6
Enterpr
64.8
70.3
68.6
55.2
68
64.1
Boram
67.1
79.6
78.5
62.4
79.8
62.4
Ccommerce
61.1
65
65.6
54.4
64.5
63.9
Seoul
63.4
66.5
67.9
65
59.7
62
Shinhan
72.3
69.1
74.2
60
70.1
68.2
City
64.2
72
71.4
56.9
72.8
57.8
Exchange
68.4
67.5
67.3
51.3
71.3
65.8
First
66.1
66.5
67.3
50.7
63.4
63.3
Chohung
63.5
65.7
64.3
53.9
61.7
62.7
Hana
69
74.3
80.5
63.6
75.7
55.9
Hanil
63.2
65.5
68.3
49.8
64.6
59.1
House
64.1
64.8
67.8
59.7
65.7
61.8
(자료출처 : 유종열 외 3인, S-PLUS를 이용한 통계계산, 박영사, 1997)
(1)각 변수의 히스토그램을 그리고 설명하라.
PROC IMPORT DBMS=XLSX
DATAFILE=\"7-6.xlsx\"
OUT=evaluation
REPLACE;
RUN;
/* 히스토그램 */
PROC GCHART DATA=evaluation;
VBAR convenience accuracy kindness efficiency pleasant automatic;
RUN;
/* 산점도 행렬 */
PROC SGSCATTER DATA=evaluation;
MATRIX convenience accuracy kindness efficiency pleasant automatic
/ DIAGONAL=(HISTOGRAM NORMAL);
RUN;
/* 상관계수 행렬 */
PROC CORR DATA=evaluation NOSIMPLE;
VAR convenience accuracy kindness efficiency pleasant automatic;
RUN;
/* PLOTS=MATRIX로 산점도 행렬을 삽입한다. */
/* NOSIMPLE 옵션이 없으면, 각 변수의 기본통계량도 출력된다. */
/* DIAGONAL=(HISTOGRAM NORMAL)은 산점도행렬의 대각선에 히스트로그램과 정규분포곡선을 삽입한다. */
/* 아래 코드를 사용하면 산점도 행렬의 경우 5개의 변수만 보여주어 SGSCATTER로 산점도 행렬 그림. */
/* automatic 변수의 산점도를 그려주지 않는 이유는 알 수 없음.
/* PROC CORR DATA=evaluation PLOTS=MATRIX NOSIMPLE;
VAR convenience accuracy kindness efficiency pleasant automatic; */
히스토그램에서 각 변수의 데이터 개수는 13개이다. 대체로 봉우리는 중앙에 하나만 존재하고, 데이터가 오른쪽이나 왼쪽으로 확연하게 치우쳐 있지는 않지만 정규분포와 달리 좌우대칭을 이루지는 않는다. 특히 kindness의 경우는 중앙에 봉우리가 있지 않고 왼쪽에 있다. 또한 convenience는 데이터가 봉우리를 중심으로 오른쪽에 집중되어 있는 모양이다. 모든 히스토그램에서 다른 데이터 값에 비해 멀리 떨어져 있는 값, 즉 이상치는 보이지 않는다.
(2)산점도 행렬 및 상관계수 행렬을 구하고, 변수들의 관계를 설명하라.
산점도 행렬을 보면, convenience와 automatic는 어떤 변수와도 뚜렷한 선형관계를 보이지 않는다. 다만, conveniences는 다른 변수에 비해 상대적으로 pleasant와는 상관관계가 다소 있어 보인다. 상관계수행렬에서 conveniences와 pleasant의 상관계수는 0.49이다. accuracy, kindness, pleasant는 서로 상관관계가 높아 높인다. 상관계수행렬에서 이들 변수의 상관계수는 모두 0.6 이상으로 높다. efficiency는 kindness와 상관관계가 높아 보이고, accuracy와도 어느 정도 선형관계가 확인된다.
3) 교재 7장 연습문제(p.277) 6번
(6번)다음은 13개 시중은행에 대한 편리성, 신속성, 친절, 능률, 쾌적, 자동화 등의 점수를 나타내고 있는 자료이다.
convenience
accuracy
kindness
efficiency
pleasant
automatic
Kookmin
70.5
59.4
63.7
54.3
66.9
62.6
Enterpr
64.8
70.3
68.6
55.2
68
64.1
Boram
67.1
79.6
78.5
62.4
79.8
62.4
Ccommerce
61.1
65
65.6
54.4
64.5
63.9
Seoul
63.4
66.5
67.9
65
59.7
62
Shinhan
72.3
69.1
74.2
60
70.1
68.2
City
64.2
72
71.4
56.9
72.8
57.8
Exchange
68.4
67.5
67.3
51.3
71.3
65.8
First
66.1
66.5
67.3
50.7
63.4
63.3
Chohung
63.5
65.7
64.3
53.9
61.7
62.7
Hana
69
74.3
80.5
63.6
75.7
55.9
Hanil
63.2
65.5
68.3
49.8
64.6
59.1
House
64.1
64.8
67.8
59.7
65.7
61.8
(자료출처 : 유종열 외 3인, S-PLUS를 이용한 통계계산, 박영사, 1997)
(1)각 변수의 히스토그램을 그리고 설명하라.
PROC IMPORT DBMS=XLSX
DATAFILE=\"7-6.xlsx\"
OUT=evaluation
REPLACE;
RUN;
/* 히스토그램 */
PROC GCHART DATA=evaluation;
VBAR convenience accuracy kindness efficiency pleasant automatic;
RUN;
/* 산점도 행렬 */
PROC SGSCATTER DATA=evaluation;
MATRIX convenience accuracy kindness efficiency pleasant automatic
/ DIAGONAL=(HISTOGRAM NORMAL);
RUN;
/* 상관계수 행렬 */
PROC CORR DATA=evaluation NOSIMPLE;
VAR convenience accuracy kindness efficiency pleasant automatic;
RUN;
/* PLOTS=MATRIX로 산점도 행렬을 삽입한다. */
/* NOSIMPLE 옵션이 없으면, 각 변수의 기본통계량도 출력된다. */
/* DIAGONAL=(HISTOGRAM NORMAL)은 산점도행렬의 대각선에 히스트로그램과 정규분포곡선을 삽입한다. */
/* 아래 코드를 사용하면 산점도 행렬의 경우 5개의 변수만 보여주어 SGSCATTER로 산점도 행렬 그림. */
/* automatic 변수의 산점도를 그려주지 않는 이유는 알 수 없음.
/* PROC CORR DATA=evaluation PLOTS=MATRIX NOSIMPLE;
VAR convenience accuracy kindness efficiency pleasant automatic; */
히스토그램에서 각 변수의 데이터 개수는 13개이다. 대체로 봉우리는 중앙에 하나만 존재하고, 데이터가 오른쪽이나 왼쪽으로 확연하게 치우쳐 있지는 않지만 정규분포와 달리 좌우대칭을 이루지는 않는다. 특히 kindness의 경우는 중앙에 봉우리가 있지 않고 왼쪽에 있다. 또한 convenience는 데이터가 봉우리를 중심으로 오른쪽에 집중되어 있는 모양이다. 모든 히스토그램에서 다른 데이터 값에 비해 멀리 떨어져 있는 값, 즉 이상치는 보이지 않는다.
(2)산점도 행렬 및 상관계수 행렬을 구하고, 변수들의 관계를 설명하라.
산점도 행렬을 보면, convenience와 automatic는 어떤 변수와도 뚜렷한 선형관계를 보이지 않는다. 다만, conveniences는 다른 변수에 비해 상대적으로 pleasant와는 상관관계가 다소 있어 보인다. 상관계수행렬에서 conveniences와 pleasant의 상관계수는 0.49이다. accuracy, kindness, pleasant는 서로 상관관계가 높아 높인다. 상관계수행렬에서 이들 변수의 상관계수는 모두 0.6 이상으로 높다. efficiency는 kindness와 상관관계가 높아 보이고, accuracy와도 어느 정도 선형관계가 확인된다.
소개글