데이터처리실무-연습문제
본 자료는 미리보기를 지원하지 않습니다.
닫기
  • 1
  • 2
  • 3
  • 4
해당 자료는 1페이지 까지만 미리보기를 제공합니다.
1페이지 이후부터 다운로드 후 확인할 수 있습니다.

소개글

데이터처리실무-연습문제에 대한 보고서 자료입니다.

목차

I. 교재 1장 2번,9번 연습문제
1)문제
2)풀이
II. 3장 1번 연습문제
1)문제
2)풀이
III.4장 3번 연습문제
1)문제
2)풀이

본문내용

연습문제1장2번 다음은 최근 15년간 주요 연안 해수 오염도(COD)자료이다. 연안별로
오염도를 알려면 어떤 그래프를 사용하는 것이 가장 적절한지 알아보아라.
연도별로 조사하는 것이므로, 연도는 연속변수로 히스토그램으로 설명할 수 있다.
연습문제1장9번 IQ점수를 평행좌표로 그려보아라. 그리고 어떤내용을 알아볼 수 있는지
해석하여라.(DAVIS이용)
※ 뇌 자료의 평행좌표계로 수직선은 변수를, 수평선은 관축값을 나타낸다.
키가 클수록 뇌가 크다는 것을 알 수 있다.
※ 산점도행렬에서는 FSIQDHK VIQ,PIG 의 상관관계가 높음을 알 수 있으며,
키와 몸무게도 상관관계가 높은 것을 알 수 있다.
연습문제3장1번 다음은 13개 시중은행에 대한 편리성,신속성, 친절,능률, 쾌적, 자동화
등의 점수를 나타내고 있는 자료이다. R를 이용하여 물음에 답하여라.
(1) read.table로 데이터 파일을 읽어 bank로 저장하고, bank의 결과를 보여라.
(2) dimnames(bank)[[1]]과 dimnames(bank)[[2]]의 결과를 보여라.
(3) bank < - as.matrix(bank)의 의미를 말하여라.
배열을 행렬로 변환하라는 명령입니다.
(4) bank 데이터에서 편리성(convenience)의 히스토그램을 그리려고 한다. 다음 결과
를 보이고 차이를 말하여라.
convenience <-bank[,1]
hist(convenience)
※ 편리성에 대한 히스토그램에서 밀도함수로 62점에서 66점사이가 가장 높게
나온 것을 알 수 있다.
hist(convenience, nclass=12)
※ 편리성에 대한 히스토그램에서 편리성에 대한 도수를12개로 나누어서 더 정확
하게 알 수 있다.
hist(convenience, probability=T)
※ 편리성에 대한 히스토그램에서 밀도함수로 62점에서 66점사이가 가장 높게
나온 것을 알 수 있다.
(5) 산점도 행렬을 그리려고 한다. 다음 결과를 보이고 설명하여라.
pairs(bank)
※ 산점도 행렬은 다변량 자료의 분석에서 변수들 간의 연관성등을 살펴보는 데
이용되는데 accuracy와 kindness, efficiency, pleasant에서 상관관계가
높은 것을 알 수 있다.
(6) 별그림을 그리고자 한다. 다음 결과를 보이고 설명하여라.
stars(bank, head="Star Graphs of Korean Banks")
stars(bank, head="Star Graphs of Korean Banks",ncol=3)
※ 별그림은 다변량 자료의 분석에서 케이스들의 군집 여부등을 살펴보는 데 이용
되는데, 이것은 별의 크기와 모양을 가지고 변수의 관계 및 유사한 관찰값을
찾는 데 이용한다.

추천자료

  • 가격5,300
  • 페이지수4페이지
  • 등록일2008.12.03
  • 저작시기2008.10
  • 파일형식압축파일(zip)
  • 자료번호#500983
본 자료는 최근 2주간 다운받은 회원이 없습니다.
청소해
다운로드 장바구니