320x100
선택자
웹 페이지를 표현하는 데이터 모두가 태그로 구성되어 있어 서로 동일한 태그가 존재할 것입니다.
이렇게 동일한 태그들은 분간을 하기 위해 HTML에서는 선택자를 사용합니다. 각 태그를 구별할 수 있는 주소를 부여 해줍니다.
선택자 필요성
<div>
<div>
<span>파이썬</span>
<span>apply</span>
</div>
<div>
<span>java</span>
<span>split</span>
</div>
</div>
해당 웹 페이지에서 언어와 관련된 데이터만 필요하다고 한다고 가정해보겠습니다.
만약 태그로만 해당 데이터를 선택한다면 태그 <span>을 사용할 것입니다.
하지만 태그 <span>에 언어 정보뿐 아니라 함수정보(apply, split)도 포함됩니다.
이러한 경우에 선택자를 사용합니다.
<div id = 'content'>
<div class = 'metadata1'>
<span class='language'>파이썬</span>
<span class='function'>apply</span>
</div>
<div class = 'metadata2'>
<span class='language'>java</span>
<span class='function'>split</span>
</div>
</div>
class='language' 선택자를 추가해 준다면, 우리는 span 태그와 language 라는 선택자를 사용해 언어 관련 데이터만을 받을 수 있습니다.
320x100
320x100
'빅데이터 관련 자료 > Crawling' 카테고리의 다른 글
(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 3, 선택자 사용법 (0) | 2022.02.03 |
---|---|
(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 2, id 와 class (0) | 2022.02.02 |
(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 웹페이지와 HTML (0) | 2022.01.30 |
(이해하기 쉽게 설명) HTML 기초, 라이브러리와 크롤링 준비 (0) | 2022.01.29 |
크롤링은 종류 (0) | 2022.01.23 |