목차
1. 교재 연습문제 3장(p. 73) ? 1번, 2번, 3번 (배점 9점)
2. 교재 연습문제 4장(p. 100) - 7번, 8번, 9번 (배점 9점)
3. 교재 연습문제 8장(p. 268) - 2번 (배점 12점)
※ 8장 연습문제는 R과 파이썬을 각각 이용하여 작업하기 바람.
2. 교재 연습문제 4장(p. 100) - 7번, 8번, 9번 (배점 9점)
3. 교재 연습문제 8장(p. 268) - 2번 (배점 12점)
※ 8장 연습문제는 R과 파이썬을 각각 이용하여 작업하기 바람.
본문내용
2022년 2학기 방송통신대 파이썬과R 출석수업대체과제물)R을 사용하여 다음의 자료로 3개의 열을 갖는 데이터프레임을 만드시오 R에서 example 함수문을 만들고 실행한 예이다. 파이썬에서 이와 같은 기능을 실행하는 클래스를 만들고 등
1. 교재 연습문제 3장(p. 73) ? 1번, 2번, 3번 (배점 9점)
(연습문제 1번) R을 사용하여 다음의 자료로 3개의 열을 갖는 데이터프레임을 만드시오 (이때 각 변수 의 이름은 name, height, weight로 한다). 이 자료에서 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)만 배열로 추출하시오.
"배열(array)은 일반적으로 한 변수의 이름에 2 개 이상의 값을 저장한 것을 일컫는다. R에서는 1차원인 경우 벡터(vector), 2차원이면 행렬(matrix) 또는 데이터프레임(data frame)이라고 하며 벡터, 행렬 및 3 차원 이상의 자료 모음을 일반적으로 배열이라고 한다. 벡터·행렬 등 배열의 첨자(인덱스)는 R은 1부터, 파이썬은 0부터 시작한다. 즉, 벡터 x에 대해 x[1]에서는 첫 번째 값, 파이썬에서는 두 번째 값(0부터 시작하므로) 임에 유의하여야 한다. 파이썬에서는 차원에 상관없이 자료의 성질에 따라 리스트(list), 튜플(tuple), 딕셔너리(dict) 등으로 구분한다. 수치계산 등을 편하게 하기 위해서는 파이썬의 경우 numpy 패키지를 사용하여 벡터와 행렬 등 배열을 사용하는 것이 더 편리하다." (p42)
R에서 데이터프레임은 data.frame 함수로 생성한다.
data.frame(..., row.names = NULL, stringsAsFactors = default.stringsAsFactors())
여기서 '...'은 데이터프레임을 구성할 원소를 설정한다.
벡터의 이름을 나열하거나 matrix 형식의 자료를 입력한다.
row.names는 행의 이름을 설정해 준다.
stringsAsFactors는 자료가 문자열일 때 이 문자열을 'factor'로 처리할지를 선택한다.
기본값은 default.stringsAsFactors()에서 설정된 값을 사용하는데, 디폴트 값은 TRUE이다.
x1 <- c("kim", "lee", "park")
x2 <- c(170, 160, 180)
x3 <- c(60, 55, 75)
df <- data.frame(name=x1, height=x2, weight=x3)
1. 교재 연습문제 3장(p. 73) ? 1번, 2번, 3번 (배점 9점)
(연습문제 1번) R을 사용하여 다음의 자료로 3개의 열을 갖는 데이터프레임을 만드시오 (이때 각 변수 의 이름은 name, height, weight로 한다). 이 자료에서 첫 번째 사람 kim의 키와 몸무게 두 값(이름 제외)만 배열로 추출하시오.
"배열(array)은 일반적으로 한 변수의 이름에 2 개 이상의 값을 저장한 것을 일컫는다. R에서는 1차원인 경우 벡터(vector), 2차원이면 행렬(matrix) 또는 데이터프레임(data frame)이라고 하며 벡터, 행렬 및 3 차원 이상의 자료 모음을 일반적으로 배열이라고 한다. 벡터·행렬 등 배열의 첨자(인덱스)는 R은 1부터, 파이썬은 0부터 시작한다. 즉, 벡터 x에 대해 x[1]에서는 첫 번째 값, 파이썬에서는 두 번째 값(0부터 시작하므로) 임에 유의하여야 한다. 파이썬에서는 차원에 상관없이 자료의 성질에 따라 리스트(list), 튜플(tuple), 딕셔너리(dict) 등으로 구분한다. 수치계산 등을 편하게 하기 위해서는 파이썬의 경우 numpy 패키지를 사용하여 벡터와 행렬 등 배열을 사용하는 것이 더 편리하다." (p42)
R에서 데이터프레임은 data.frame 함수로 생성한다.
data.frame(..., row.names = NULL, stringsAsFactors = default.stringsAsFactors())
여기서 '...'은 데이터프레임을 구성할 원소를 설정한다.
벡터의 이름을 나열하거나 matrix 형식의 자료를 입력한다.
row.names는 행의 이름을 설정해 준다.
stringsAsFactors는 자료가 문자열일 때 이 문자열을 'factor'로 처리할지를 선택한다.
기본값은 default.stringsAsFactors()에서 설정된 값을 사용하는데, 디폴트 값은 TRUE이다.
x1 <- c("kim", "lee", "park")
x2 <- c(170, 160, 180)
x3 <- c(60, 55, 75)
df <- data.frame(name=x1, height=x2, weight=x3)
소개글