(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 4, 실습
Data Analyst

빅데이터 관련 자료/Crawling

(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 4, 실습

carpe08 2022. 2. 4. 00:34
320x100
320x100

로또 번호 크롤링

url: https://dhlottery.co.kr/gameResult.do?method=byWin&wiselog=C_A_1_2

 

로또6/45 - 회차별 당첨번호

1000회 당첨결과 (2022년 01월 29일 추첨) 당첨번호 2 8 19 22 32 42 1000회 순위별 등위별 총 당첨금액, 당첨게임 수, 1게임당 당첨금액, 당첨기준, 비고 안내 순위 등위별 총 당첨금액 당첨게임 수 1게임

dhlottery.co.kr

 

당청번호와 보너스 숫자가 들어 있는 태그와 선택자를 찾으려고 합니다.

'

<div class = 'nums'>  부분을 찾을 수 있고, 관심있는 부분의 태그는 'div' 이고, class는 'nums' 입니다.

태그의 위쪽으로 올라가면 id를 가진 태그를 찾을 수 있습니다.

<div id='article' class='contentsArticle'>
	...
    	...
        ...
        	...
            <div class='nums'>

HTML은 태그의 내용으로 태그가 사용되는 포함 관계를 가집니다.

HTML 코드에서 id가 article인 div 태그 안에 class가 nums인 div가 포함된 것을 확인할 수 있습니다.

따라서, id를 가진 태그를 활용하여 정확하게 원하는 요소를 검색할 수 있습니다.

참고) 태그와 id를 함께 사용할 경우에는 태그#id로 검색합니다.

div#article div.nums

-> id = article인 div 태그안의 class='nums'인 div태그

320x100
320x100