본문 바로가기

빅데이터3

[R][Data.table][Packages]-대용량 데이터를 빠르게 읽어들일 수 있음. ##To Handle 'big data' : [package]data.table## install.packages("data.table") #install the packages library("data.table") #I will use this packages #to solv EOF within Issue t1_20t=fread("file.txt", stringsAsFactors = FALSE, data.table = FALSE) install.packages('bit64') 2020. 7. 8.
R studio 실행도중 종료시 빠르게 종료 꿀팁 R studio 로 빅데이터를 다루다 보면 실행도중 종료가 절실한 상황이 많습니다. 아... 이거 코드 잘못짰는데 실행시켜버렸네... 싶을 때, 종료를 누르고 기다리면 정말 한 세월을 기다려야 하죠. 종료가 왜이리 오래 걸리는지... 막상 저장도 안되고... 빨리 끄고싶을 때 어떻게 해야하는지? 1. 작성한 코드를 복사한다. 2. 시작 -> 메모장(notepad, 이미 사용중이시면 shift 키를 누르고 클릭하시면 새 창으로 뜹니다.) -> 붙여넣기 3. ctrl + shift + esc 로 작업관리자를 열어 RStudio R Session을 찾습니다. 4. 마우스 우클릭 후 작업을 끝내줍니다. 5. 메모장에 붙여둔 코드를 ctrl + a 로 '복사' -> R studio에 ctrl + v 로 '붙여넣기.. 2019. 10. 8.
R 데이터 전처리에 사용했던 함수 정리 #다양한 패키지 install.packages("dplyr") install.packages("data.table") install.packages("bit64") install.packages("readxl") #외부 데이터 불러오기 1.txt(메모장) data v v[3] [1] 3 > v[1:3] [1] 1 2 3 2.Matrix [a,b] #[행,열] m m [,1] [,2] [1,] 1 2 [2,] 3 4 3.Data Frame [a,b], [[a]] #[[a]] a번째 열을 벡터로 출력 = list indexing df[c(a,b),c] #df 에서 a번째&b번째 row, c번째열을 인덱싱 4.subset() dplyr패키지에 내장된 함수로 조건에 만족하는 벡터, 행렬, 데이터 프레임의 일부를.. 2019. 7. 12.