본문 바로가기

R/R terminal mode14

R - 변수이름 바꾸기 변수이름을 바꿔야 할 경우가 흔히 발생한다. > test.matrix test.data.frame str(test.data.frame)> names(test.data.frame)[c(2)] str(test.data.frame) 2012. 5. 6.
R base - grep() - gsub() - 숫자들 중간의 , (comma)를 제거해야할 경우 흔히 사용 많은 수치형 자료에 comma를 사용하여 천단위로 끊는것이 일반적이다. 보기에 수월하기 때문이다. 이러한 자료를 R로 불러들일 경우 comma 처리에 신경을 쓰지 않으면, 수치형 변수가 문자형 변수로서 처리되는 경우가 발생한다. 수치형변수가 문자형변수로 처리되면 어떤 문제가 발생할까... 99,999 가 977,000보다 크다고 해석이 된다(내림차순으로 정렬할 때 말이다) 이 경우를 막기 위해서 숫자 중간의 comma를 삭제해주어야 한다. 이 때 gsub()를 사용할 수 있다: gsub(",","") #문자중간에 있는 comma를 지우고 앞뒤간격을 없애라는 것이다. 1. read.csv()의 stringsAsFactors = FALSE 인자를 사용하여 변수들을 문자형으로 불러들인뒤, 2. str()를 사.. 2012. 3. 26.
as.Date() - 요인형 변수로 불러들여진 값들을 다시 날짜형 변수로 바꾸는 법 날짜별 자료들중에서 날짜를 연/월/일로 표시한 것들이 있다. 자료가 불러들여지는 과정에서 요인(factor)로 변환되기도 한다. 이 경우 다시 날짜형 변수의 값으로 변환시켜야 한다. 예를 들어서 다음과 같: kospi200.week.60$date 2012. 3. 23.
R - base - sample(), matrix() 2012. 3. 8.