본문 바로가기

R packages27

tcltk의 유용성 R은 빅데이터시대에서 느린 전산통계언어로 평가받는다. 그 이유의 하나는 기본설정에서 하나의 cpu 단위를 사용하기 때문이다. 멀티코어/다중CPU 환경에서 하나의 cpu만 사용한다면 연산속도가 느린것이 답답할 수 있다. 여러개의 cpu코어를 사용하도록 환경설정을 변경할 수 있고, 여러개의 cpu코어를 사용하는 R 배포판(?)을 사용할 수 도 있다.만약 메모리가 넉넉한 시스템에서 R의 연산과정이 길어지는 경우, 다른 R 작업을 병행해야할 때가 있다. 내 경우는 언론기사분석의 텍스트마이닝 작업에서 빈빈하게 발생하는 상황이기도 했다. RStudio 무료판은 하나의 R 엔진만 사용할 수 있어서 불편함이 많았다. 그래서 RServer를 설치하고 원격에서 고성능 서버에 접속해서 RStudio를 쓰는것이 만능책이 아닌.. 2018. 6. 16.
rattle - 설치 (gtk 설치) Rattle ( R Analytic Tool to Learn Easily : 배우기 쉬운 R 분석 툴?) install.packages("rattle", dep=T)GTK+ (Gimp Toolkit?)을 먼저 설치해야한다. 그런데, GTK+는 R 바깥에 라이브러리를 다운로드받아 설치해야하며, rattle 설치과정에서 R의 내부 의존성 패키지를 자동으로 설치하게된다. 그리고, library(rattle)rattle() 2017. 3. 6.
read.spss() 함수 사용법 SPSS라는 유명한 사회과학용 통계패키지가 있다: Statistical Package for the Social Sciences 요즘은 비사회과학분야에서도 많이 사용되고 있다고 한다. .sav 라는 확장자로 데이터셋을 주로 저장한다. SPSS 데이터셋을 R로 불러들이는 방법 중에서 foreign 패키지의 read.spss() 함수 사용법을 추천한다. ============================== install.packages("foreign", dep=T) library(foreign) # 기본 사용법 function (file, use.value.labels = TRUE, to.data.frame = FALSE, max.value.labels = Inf, trim.factor.names = F.. 2017. 2. 25.
knitr 기초 연습 2013. 6. 5.