ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [R studio] 기술통계 출력하는 다양한 방법들.R
    프로그래밍/R 2019. 9. 29. 20:16
    반응형

    # 기술통계

    기술통계란 평균, 표준편차, 분산 등 연속형 데이터를 의미있는 수치로 나타내는 것을 말한다.

     


    R로 기술통계를 추출하는 방법은 여러가지가 있는데 간단한 예제를 이용해 살펴보고자 한다.

    (물론 본문에 기재된 함수들 말고도 더 있음.)

     

    # 직접 만든 간단한 예제

    예제.xlsx
    0.01MB


    # R에서 엑셀데이터 불러오기

    위의 엑셀 데이터를 R로 불러오려면 readxl 패키지를 이용하면 된다. 

    다만 주의할 점은 해당 파일이 있는 디렉토리 경로를 디폴트로 설정해야 한다는 것!

     

    install.packages("readxl")
    library(readxl)
    list = read_excel("예제.xlsx")

     

    list를 출력한 결과

    #기술통계량 출력하기

    - list 테이블에 있는 '나이' 변수를 통해서 기술통계량을 구해보도록 하자.

     

    1) summary 함수 사용

    다른 패키지 설치없이 사용할 수 있는 함수이다.

     

     

    2) psych 패키지에 들어있는 describe 함수 사용하기

     

     

    3) funModeling 패키지에 들어있는 profiling_num 함수 사용하기


    #그룹별 기술통계

    자, 그러면 남녀별 나이 통계를 보고 싶을땐 어떡해야할까?

    2가지 방법이 있다.

     

    1) list 파일을 subset 함수로 남/녀를 나눠서 각각 저장한 다음 통계량을 내기

    -subset(list, list$성별=='여') 함수를 woman이라는 변수에 저장한다.

    woman을 출력한 결과
    woman 테이블의 나이를 출력하면 여자의 나이 평균이 출력된다.

    2) tapply 함수를 사용하기


    이제 와서 보니 참 쉽지만

    R린이로써 남/녀별로 나눠서 출력하기 넘 어려웠다.. (tapply 함수사용 말고)

    그냥 두 테이블로 나눠서 $나이 하면 될 것을

    조건식 넣어가며 출력하려고 고생함..

    단순하게 생각하자!! ㅇㅋ? 

     

     

     

     

    반응형

    '프로그래밍 > R' 카테고리의 다른 글

    [R studio] 그래프 그릴 때 margin 뜻.R  (0) 2019.10.13
    [R studio] T-TEST & WELCH TEST.R  (0) 2019.10.13

    댓글

Designed by Tistory.