-
1
-
2
-
3
-
4
-
5
-
6
-
7
-
8
-
9
-
10
-
11
-
12
-
13
-
14
-
15
-
16
-
17
-
18
-
19
-
20
-
21
-
22
-
23
-
24
-
25
-
26
-
27
-
28
-
29
-
30
-
31
-
32
-
33
-
34
-
35
-
36
-
37
-
38
-
39
-
40
-
41
-
42
-
43
-
44
-
45
-
46
-
47
-
48
-
49
-
50
-
51
-
52
목차
1. 교재 연습문제 3장 (p. 73) - 1번, 2번, 4번, 5번 (배점 8점)
2. 교재 연습문제 4장 (p. 100) - 5번, 6번, 7번, 8번 (배점 8점)
3. 교재 연습문제 8장 (p. 269) - 3번 (배점 14점)
※ 8장 연습문제는 R과 파이썬을 각각 이용하여 작업하기 바랍니다.
4. 참고문헌
2. 교재 연습문제 4장 (p. 100) - 5번, 6번, 7번, 8번 (배점 8점)
3. 교재 연습문제 8장 (p. 269) - 3번 (배점 14점)
※ 8장 연습문제는 R과 파이썬을 각각 이용하여 작업하기 바랍니다.
4. 참고문헌
본문내용
(연습문제 1번) R을 사용하여 다음의 자료로 3개의 열을 갖는 데이터프레임을 만드시오 (이때 각 변수 의 이름은 name, height, weight로 한다). 이 자료에서 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)만 배열로 추출하시오.
x1 <- c("kim", "lee", "park")
x2 <- c(170, 160, 180)
x3 <- c(60, 55, 75)
df <- data.frame(name=x1, height=x2, weight=x3)
df
# df[1, 2:3]에서 1은 1행을 의미하고 2:3은 2열에서 3열까지를 의미한다.
df[1, 2:3]
"배열(array)은 일반적으로 한 변수의 이름에 2 개 이상의 값을 저장한 것을 일컫는다. R에서는 1차원인 경우 벡터(vector), 2차원이면 행렬(matrix) 또는 데이터프레임(data frame)이라고 하며 벡터, 행렬 및 3 차원 이상의 자료 모음을 일반적으로 배열이라고 한다. 벡터·행렬 등 배열의 첨자(인덱스)는 R은 1부터, 파이썬은 0부터 시작한다. 즉, 벡터 x에 대해 x[1]에서는 첫 번째 값, 파이썬에서는 두 번째 값(0부터 시작하므로) 임에 유의하여야 한다. 파이썬에서는 차원에 상관없이 자료의 성질에 따라 리스트(list), 튜플(tuple), 딕셔너리(dict) 등으로 구분한다. 수치계산 등을 편하게 하기 위해서는 파이썬의 경우 numpy 패키지를 사용하여 벡터와 행렬 등 배열을 사용하는 것이 더 편리하다." (p42)
R에서 데이터프레임은 data.frame 함수로 생성한다.
data.frame(..., row.names = NULL, stringsAsFactors = default.stringsAsFactors())
여기서 '...'은 데이터프레임을 구성할 원소를 설정한다.
벡터의 이름을 나열하거나 matrix 형식의 자료를 입력한다.
row.names는 행의 이름을 설정해 준다.
stringsAsFactors는 자료가 문자열일 때 이 문자열을 'factor'로 처리할지를 선택한다.
기본값은 default.stringsAsFactors()에서 설정된 값을 사용하는데, 디폴트 값은 TRUE이다.
x1 <- c("kim", "lee", "park")
x2 <- c(170, 160, 180)
x3 <- c(60, 55, 75)
df <- data.frame(name=x1, height=x2, weight=x3)
df
# df[1, 2:3]에서 1은 1행을 의미하고 2:3은 2열에서 3열까지를 의미한다.
df[1, 2:3]
"배열(array)은 일반적으로 한 변수의 이름에 2 개 이상의 값을 저장한 것을 일컫는다. R에서는 1차원인 경우 벡터(vector), 2차원이면 행렬(matrix) 또는 데이터프레임(data frame)이라고 하며 벡터, 행렬 및 3 차원 이상의 자료 모음을 일반적으로 배열이라고 한다. 벡터·행렬 등 배열의 첨자(인덱스)는 R은 1부터, 파이썬은 0부터 시작한다. 즉, 벡터 x에 대해 x[1]에서는 첫 번째 값, 파이썬에서는 두 번째 값(0부터 시작하므로) 임에 유의하여야 한다. 파이썬에서는 차원에 상관없이 자료의 성질에 따라 리스트(list), 튜플(tuple), 딕셔너리(dict) 등으로 구분한다. 수치계산 등을 편하게 하기 위해서는 파이썬의 경우 numpy 패키지를 사용하여 벡터와 행렬 등 배열을 사용하는 것이 더 편리하다." (p42)
R에서 데이터프레임은 data.frame 함수로 생성한다.
data.frame(..., row.names = NULL, stringsAsFactors = default.stringsAsFactors())
여기서 '...'은 데이터프레임을 구성할 원소를 설정한다.
벡터의 이름을 나열하거나 matrix 형식의 자료를 입력한다.
row.names는 행의 이름을 설정해 준다.
stringsAsFactors는 자료가 문자열일 때 이 문자열을 'factor'로 처리할지를 선택한다.
기본값은 default.stringsAsFactors()에서 설정된 값을 사용하는데, 디폴트 값은 TRUE이다.
소개글