분류 전체보기
-
[파이썬] 블로그 제목 크롤러 만들기 make a crawler for crawling blog title프로그래밍/Python 2020. 2. 1. 00:25
사실 긁어오는 것 자체는 어렵지 않다. 크롬 - 검사 기능을 통해 해당 태그만 잘 긁어오면 되니까. 오늘은 티스토리 게시글 제목을 긁어오는 크롤러를 만들어보자 R 통계 과제하며 썼던 코드를 짜집기 해보도록 하자^*^ ※여기부턴 시행착오가 매우 많은 코드니 맨 밑에 정리된 코드를 사용할 것※ import os from selenium import webdriver import time #유튜브 댓글과 같이 스크롤 해야 뜨는 형식을 위해 쓰는 코드니까 지금은 딱히 필요없다 from selenium.webdriver.common.keys import Keys #얘도 유튜브 검색할때 쓰던거라 딱히 필요 없음 import pandas as pd from bs4 import BeautifulSoup os.chdir..
-
[R studio] T-TEST & WELCH TEST.R프로그래밍/R 2019. 10. 13. 21:43
R STUDIO T-TEST 과정 1) 등분산 검증 귀무가설(영가설): 두 변수의 분산은 같다. 대립가설: 두 변수의 분산은 다르다. var.test(변수1, 변수2) -> P값이 0.05보다 작으면 귀무가설 기각, 크면 귀무가설 성립 귀무가설이 성립되면(등분산) -> T-test 기각되면(등분산X) -> Welch test 2-1)T-test t.test(종속변수~독립변수, data= , var.equal=TRUE) T검증 또한 P값이 0.05보다 작으면 귀무가설이 기각되고, 크면 성립 2-2)Welch test t.test(종속변수~독립변수, data= ) T.test와의 차이는 var.equal값이 true냐 false냐이다. var.equal값을 지정해주지 않으면 자동으로 false 처리된다. 양..
-
[R studio] 기술통계 출력하는 다양한 방법들.R프로그래밍/R 2019. 9. 29. 20:16
# 기술통계 기술통계란 평균, 표준편차, 분산 등 연속형 데이터를 의미있는 수치로 나타내는 것을 말한다. R로 기술통계를 추출하는 방법은 여러가지가 있는데 간단한 예제를 이용해 살펴보고자 한다. (물론 본문에 기재된 함수들 말고도 더 있음.) # 직접 만든 간단한 예제 # R에서 엑셀데이터 불러오기 위의 엑셀 데이터를 R로 불러오려면 readxl 패키지를 이용하면 된다. 다만 주의할 점은 해당 파일이 있는 디렉토리 경로를 디폴트로 설정해야 한다는 것! install.packages("readxl") library(readxl) list = read_excel("예제.xlsx") #기술통계량 출력하기 - list 테이블에 있는 '나이' 변수를 통해서 기술통계량을 구해보도록 하자. 1) summary 함수 ..