본문 바로가기

분류 전체보기300

R - R Commander - data - managing variables of the active data set - 'delete variables from the data set ' .csv 파일로부터 데이터를 불러왔다고 하자. 어쩐일인지...불필요한 변수들이 추가되는 경우, 불필요한 사례들이 추가되는 경우가 발생한다. (이유는 잘 모르겠지만, 엑셀-넘버 등에서 자료를 전환하는 과정에서 발생하기도 한다.) 이 경우에 불필요한 변수들을 제거해야 한다. 이 작업은 R Commander 에서는 손쉽게 진행된다. 불필요한 변수들을 마우스와 화살표키로 선택하면서 한꺼번에 삭제할 수 있다. 이 작업은 다음과 같은 반복적인 스크립트의 결과이다: table7.1$X 2012. 1. 27.
R Packages - base - t() - 메트릭스 자료의 전치 번역어로 전치라는 표현이 있다. 행과 열의 위치를 '맞'바꾸는 것을 말한다. 영어로 transpose라고 하고, R에서는 t()를 사용한다. 매트릭스의 전치를 할 때 사용한다. 참고) aperm 현실적으로는 왜 t()를 사용할까? 표를 작성할 때 가장 왼쪽에 대상을 놓고, 오른쪽에 시간의 경과 순서에 의한 결과를 차례대로 적는 경우가 많다. 시간변수로 적는다는 뜻이다. 하지만, 대상변수를 만들고, 시간의 경과를 행의 사례 이름들로 만드는 경우가 있다. 시계열적 분석에서 일반적으로 행한다. 대상들의 변화에 차이가 없는가를 알기 위해서 anova를 사용할 때 필요하기도 하다. 이경우 시간변수를 행이름으로, 사례이름들을 행변수로 바꿀 이유가 발생한다. 이때 t() 를 사용한다. 2012. 1. 26.
R Packages - base - row.names() - 문자형 case 이름을 만들때... *.csv 파일을 읽어들일때, 첫째 주의해야할 점이 header의 유-무가 되겠다. 두번째는 .csv 파일의 특성상 숫자형 row names이 생성된다는 특징을 파악하는 것이다. 첫째행에 있는 사례의 이름들을 첫째 변수의 사례들로 읽어오게되는데, 이 경우 첫째 변수를 행의 이름으로 변환하면 보다 보기에 편해진다. row.names(original) 2012. 1. 26.
R - R terminal mode - 자료(data.frame) 범위 축소하기 R에는 데이터셋의 관리를 위한 많은 함수들이 있다. 하지만, 함수를 사용하지 않고 기초문법만으로도 자료 범위를 조정할 수 있다. > data(mtcars) # mtcars라는 데이터셋을 불러온다. >mtcars.10 = mtcars[1:10,] # mtcars라는 데이터셋에서 row번호, 1에서 10까지의 데이터셋을 만들고, 그 이름을 mtcars.10으로 붙인다. >mtcars.10.5 = mtcars[1:10, c(1,2)] # mtcars라는 데이터셋에서 row번호 1에서 10까지에 있는 변수 1, 변수 2의 값을 mtcars.10.5로 부여한다. >mtcars11.1 = mtcars[1:10, c(1,4)] # mtcars라는 데이터셋에서 row 번호 1부터10까지에 있는 변수1, 변수 2, 변수.. 2012. 1. 22.