본문 바로가기
R packages

broom - 분석의 결과를 데이터프레임으로 관리할 때

by 거인과난쟁이 2019. 4. 23.

R에는 통계분석과 관련된 많은 함수가 있다. 차이검정, 선형회귀, 일반화선형모델, 모델비교 등 사회과학에서 사용하는 많은 분석 함수들이 있다. 이러한 추리통계 관련 함수들의 결과값은 리스트로 출력된다. 화면에서 보기에는 큰 무리가 없다.

통계관련 논문을 쓰는 연구자는, 소속 또는 분야별 추리통계 결과에 대한 요약표현 방식이 있다. 분야별 문화라고 해야할까. 제한된 지면에 핵심 결과값을 표로 보여주는 경우가 흔하다. 이 경우, R의 추리통계 관련 분석 함수 결과값을 논문에 작성한다면, 리스트 형태의 화면 출력값을 논문에 그대로 작성하기는 어렵다. 다시 핵심 결과값을 표로 일일이 만들어줘야 하는 상황이 발생한다.

broom 패키지는 추리통계 관련 분석결과를 데이터프레임과 호환되는 tibble 형식으로 출력한다. 각 결과값을 .csv 유형의 파일로 저장한다면, 엑셀과 같은 스프레드시트 어플리케이션에서 표의 형식을 유지한채 쉽게 불러올 수 있다. 논문 작성에 효과적으로 재활용할 수 있는 것이다.

다음을 비교해보라. 이원 회귀분석의 사례가 된다.

require(car)

style1 <- lm(prestige ~ income + education, data=Prestige)

summary(style1)

###########

install.packages("broom", dep=T)

tidy(style1)

glance(style1)

output1 <- tidy(style1)

output2 <- glance(style2)

write.csv(output1, file="output1.csv")

write.csv(output2, file="output2.csv")