r
-
[파이썬] 블로그 제목 크롤러 만들기 make a crawler for crawling blog title프로그래밍/Python 2020. 2. 1. 00:25
사실 긁어오는 것 자체는 어렵지 않다. 크롬 - 검사 기능을 통해 해당 태그만 잘 긁어오면 되니까. 오늘은 티스토리 게시글 제목을 긁어오는 크롤러를 만들어보자 R 통계 과제하며 썼던 코드를 짜집기 해보도록 하자^*^ ※여기부턴 시행착오가 매우 많은 코드니 맨 밑에 정리된 코드를 사용할 것※ import os from selenium import webdriver import time #유튜브 댓글과 같이 스크롤 해야 뜨는 형식을 위해 쓰는 코드니까 지금은 딱히 필요없다 from selenium.webdriver.common.keys import Keys #얘도 유튜브 검색할때 쓰던거라 딱히 필요 없음 import pandas as pd from bs4 import BeautifulSoup os.chdir..
-
[R studio] 기술통계 출력하는 다양한 방법들.R프로그래밍/R 2019. 9. 29. 20:16
# 기술통계 기술통계란 평균, 표준편차, 분산 등 연속형 데이터를 의미있는 수치로 나타내는 것을 말한다. R로 기술통계를 추출하는 방법은 여러가지가 있는데 간단한 예제를 이용해 살펴보고자 한다. (물론 본문에 기재된 함수들 말고도 더 있음.) # 직접 만든 간단한 예제 # R에서 엑셀데이터 불러오기 위의 엑셀 데이터를 R로 불러오려면 readxl 패키지를 이용하면 된다. 다만 주의할 점은 해당 파일이 있는 디렉토리 경로를 디폴트로 설정해야 한다는 것! install.packages("readxl") library(readxl) list = read_excel("예제.xlsx") #기술통계량 출력하기 - list 테이블에 있는 '나이' 변수를 통해서 기술통계량을 구해보도록 하자. 1) summary 함수 ..