-
[R studio] 기술통계 출력하는 다양한 방법들.R프로그래밍/R 2019. 9. 29. 20:16반응형
# 기술통계
기술통계란 평균, 표준편차, 분산 등 연속형 데이터를 의미있는 수치로 나타내는 것을 말한다.
R로 기술통계를 추출하는 방법은 여러가지가 있는데 간단한 예제를 이용해 살펴보고자 한다.
(물론 본문에 기재된 함수들 말고도 더 있음.)
# 직접 만든 간단한 예제
# R에서 엑셀데이터 불러오기
위의 엑셀 데이터를 R로 불러오려면 readxl 패키지를 이용하면 된다.
다만 주의할 점은 해당 파일이 있는 디렉토리 경로를 디폴트로 설정해야 한다는 것!
install.packages("readxl")
library(readxl)
list = read_excel("예제.xlsx")#기술통계량 출력하기
- list 테이블에 있는 '나이' 변수를 통해서 기술통계량을 구해보도록 하자.
1) summary 함수 사용
다른 패키지 설치없이 사용할 수 있는 함수이다.
2) psych 패키지에 들어있는 describe 함수 사용하기
3) funModeling 패키지에 들어있는 profiling_num 함수 사용하기
#그룹별 기술통계
자, 그러면 남녀별 나이 통계를 보고 싶을땐 어떡해야할까?
2가지 방법이 있다.
1) list 파일을 subset 함수로 남/녀를 나눠서 각각 저장한 다음 통계량을 내기
-subset(list, list$성별=='여') 함수를 woman이라는 변수에 저장한다.
2) tapply 함수를 사용하기
이제 와서 보니 참 쉽지만
R린이로써 남/녀별로 나눠서 출력하기 넘 어려웠다.. (tapply 함수사용 말고)
그냥 두 테이블로 나눠서 $나이 하면 될 것을
조건식 넣어가며 출력하려고 고생함..
단순하게 생각하자!! ㅇㅋ?
반응형'프로그래밍 > R' 카테고리의 다른 글
[R studio] 그래프 그릴 때 margin 뜻.R (0) 2019.10.13 [R studio] T-TEST & WELCH TEST.R (0) 2019.10.13