본문 바로가기

반영훈/R9

[R][Data.table][Packages]-대용량 데이터를 빠르게 읽어들일 수 있음. ##To Handle 'big data' : [package]data.table## install.packages("data.table") #install the packages library("data.table") #I will use this packages #to solv EOF within Issue t1_20t=fread("file.txt", stringsAsFactors = FALSE, data.table = FALSE) install.packages('bit64') 2020. 7. 8.
[R][환경설정][한글 깨질 때] R 사용 중, 한글이 깨져서 고생했던 기억이 한번쯤은 있을 것. 각설하고 필요한 부분만 적도록 하겠음. R studio -> tools -> Global options -> code -> saving -> Default text encoding: UTF-8로 설정. -> Project options -> Code Editing -> Text excoding: UTF-8로 설정 2020. 7. 8.
R-기술통계학 명령어 요약 명령어 설명 Length() 데이터의 특정 변수의 표본수를 계산해줌 summary() 데이터에 포함된 변수들의 최소값, 1사분위수, 중앙값, 평균, 3사분위수, 최대값을 보여줌 mean() 평균값을 계산해줌 var() 분산을 계산해줌 sd() 표준편차를 계산해줌 quantile() 사분위수를 계산해줌 fivenum() 오분위수를 계산해줌 IQR() 사분위범위(interquartile range)를 계산해줌 boxplot() Box Plot 차트를 그려줌 pairs() Scatter Plot 차트를 그려줌 hist() Histogram 차트를 그려줌 stem() Stem-and-Leaft Plot 차트를 그려줌 qqnorm() Quantile-Quantile Plot 차트를 그려줌 참조-https://m... 2019. 8. 22.
R 데이터 전처리에 사용했던 함수 정리 #다양한 패키지 install.packages("dplyr") install.packages("data.table") install.packages("bit64") install.packages("readxl") #외부 데이터 불러오기 1.txt(메모장) data v v[3] [1] 3 > v[1:3] [1] 1 2 3 2.Matrix [a,b] #[행,열] m m [,1] [,2] [1,] 1 2 [2,] 3 4 3.Data Frame [a,b], [[a]] #[[a]] a번째 열을 벡터로 출력 = list indexing df[c(a,b),c] #df 에서 a번째&b번째 row, c번째열을 인덱싱 4.subset() dplyr패키지에 내장된 함수로 조건에 만족하는 벡터, 행렬, 데이터 프레임의 일부를.. 2019. 7. 12.
Error: not compatible: Incompatible type for column `SICK_01`: x numeric, y logical [R] 해결 오류를 검색해도 해결방법이 바로 나오지 않았음. 특정컬럼에 호환되지 않는 유형이라고 한다. 필자의 경우는 setdiff(x,y)를 하는 문장에서 오류를 발견하였고 위의 조언에 따라 무엇이 문제인지 확인해보았음 str(y) str(x) 위의 함수str()을 이용해서 각 열의 형태를 확인 한 결과 4번째 열의 형태가 에러코드와 같이 x는 숫자, y는 논리였다(위가 y 아래가 x) 따라서 아래의 함수를 이용하여 한가지 타입으로 통일시켜주어서 해결하였음. as.character(x) as.complex(x) as.numeric(x) or as.double(x) as.integer(x) as.logical(x) 2019. 7. 10.
[R][저장용][list.files()] 폴더 내 여러파일 자동으로 불러오기 폴더내 여러 파일들을 한번에 불러오고 나아가 하나의 데이터프레임으로 만들기 (1) 폴더 경로 객체로 만들기 (2) 폴더 내 파일들 이름을 list-up 하여 객체로 만들기 (3) 파일 개수 객체로 만들기 (4) 폴더 내 파일들을 LOOP 돌려서 불러오기 : read.table() (5) 파일을 내보내면서 합치기 : write.table(dataset, APPEND = TRUE) (6) 데이터프레임으로 불러오기, 칼럼 이름 넣기 : read.table(dataset_all, col.names = c()) ##Automatically import files in a folder## #cleansing up environmet getwd() rm(list=ls()) #making directory as an .. 2019. 7. 4.