(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 1
Data Analyst

빅데이터 관련 자료/Crawling

(이해하기 쉽게 설명) HTML 기초, 파이썬 크롤링 선택자 - 1

carpe08 2022. 2. 1. 23:35
320x100
320x100

선택자

웹 페이지를 표현하는 데이터 모두가 태그로 구성되어 있어 서로 동일한 태그가 존재할 것입니다.

이렇게 동일한 태그들은 분간을 하기 위해 HTML에서는 선택자를 사용합니다. 각 태그를 구별할 수 있는 주소를 부여 해줍니다.

 

선택자 필요성

<div>
	<div>
    	<span>파이썬</span>
        <span>apply</span>
    </div>
    
   	<div>
    	<span>java</span>
        <span>split</span>
    </div>
</div>

 

해당 웹 페이지에서 언어와 관련된 데이터만 필요하다고 한다고 가정해보겠습니다.

만약 태그로만 해당 데이터를 선택한다면 태그 <span>을 사용할 것입니다.

하지만 태그 <span>에 언어 정보뿐 아니라 함수정보(apply, split)도 포함됩니다.

 

이러한 경우에 선택자를 사용합니다.

<div id = 'content'>
	<div class = 'metadata1'>
    	<span class='language'>파이썬</span>
        <span class='function'>apply</span>
    </div>
    
   	<div class = 'metadata2'>
    	<span class='language'>java</span>
        <span class='function'>split</span>
    </div>
</div>

class='language' 선택자를 추가해 준다면, 우리는 span 태그와 language 라는 선택자를 사용해 언어 관련 데이터만을 받을 수 있습니다.

 

 

320x100
320x100