320x100
320x100
로또 번호 크롤링
url: https://dhlottery.co.kr/gameResult.do?method=byWin&wiselog=C_A_1_2
로또6/45 - 회차별 당첨번호
1000회 당첨결과 (2022년 01월 29일 추첨) 당첨번호 2 8 19 22 32 42 1000회 순위별 등위별 총 당첨금액, 당첨게임 수, 1게임당 당첨금액, 당첨기준, 비고 안내 순위 등위별 총 당첨금액 당첨게임 수 1게임
dhlottery.co.kr
당청번호와 보너스 숫자가 들어 있는 태그와 선택자를 찾으려고 합니다.
<div class = 'nums'> 부분을 찾을 수 있고, 관심있는 부분의 태그는 'div' 이고, class는 'nums' 입니다.
태그의 위쪽으로 올라가면 id를 가진 태그를 찾을 수 있습니다.
<div id='article' class='contentsArticle'>
...
...
...
...
<div class='nums'>
HTML은 태그의 내용으로 태그가 사용되는 포함 관계를 가집니다.
HTML 코드에서 id가 article인 div 태그 안에 class가 nums인 div가 포함된 것을 확인할 수 있습니다.
따라서, id를 가진 태그를 활용하여 정확하게 원하는 요소를 검색할 수 있습니다.
참고) 태그와 id를 함께 사용할 경우에는 태그#id로 검색합니다.
div#article div.nums
-> id = article인 div 태그안의 class='nums'인 div태그
320x100
320x100
'빅데이터 관련 자료 > Crawling' 카테고리의 다른 글
(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 3, 선택자 사용법 (0) | 2022.02.03 |
---|---|
(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 2, id 와 class (0) | 2022.02.02 |
(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 1 (0) | 2022.02.01 |
(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 웹페이지와 HTML (0) | 2022.01.30 |
(이해하기 쉽게 설명) HTML 기초, 라이브러리와 크롤링 준비 (0) | 2022.01.29 |