Crawling15 네이버 날씨 온도 데이터 가져오기 실습 ( res = rq.get(url) / soup = bs(res.text, "lxml") / list 형태의 soup.select('data값') / for문으로 list[i].text로 결과값 추출) 2022. 7. 1. BeautifulSoup 라이브러리로 parshing(파싱) 작업하기 = BeautifulSOup 객체화 / select로 태그 가져오기 (아이디 # , 클래스 . ) / res.text 값을 컴퓨터언어로 바꿔줘야 함 ( parshing 파싱 작업) ----------------------------------------- from bs4 import BeautifulSoup as bs으로 BeautifulSoup 라이브러리를 불러오고 bs(parsing할 데이터, parsing할 종류) 이렇게 파싱하면 해당 값이 평소 보던 html 태그 형식으로 바뀐다 !파싱의 종류중 lxml이 작업속도가 빠르고 허술하여 오류가 잘 안남! 이 과정을 BeautifulSoup 객체화라고 한다 이 값을 변수에 담아준다 soup = bs(res.text, 'lxml') --------------------------------------------------- soup.select('가져올 .. 2022. 7. 1. request 라이브러리로 Server에서 데이터 요청하기 / response 오류의 종류 / 딕셔너리 형태의 User-Agent / import requests as rq 변수명 = rq.get("URL주소") -->> response[200]떠야 정상 변수명.text -> 해당 자료 문자형으로 가져오기 (ex) res=rq.get(url) res.text ---------------------------------------------------------------- response 오류 response 200이 떠야 정상진행 400-> 요청오류 / 500 ->서버오류 ----------------------------------------------------------------------- request 라이브러리로 불러왔는데 400대 오류가 뜰 경우 해당 서버에서 코드로 접근하는 것을 막아둔것임 이럴때 사용하는 것이 Use.. 2022. 7. 1. 이전 1 2 3 4 다음