코린이_탈출/크롤링

[모각코_크롤링] HTML 구조

오월&절미 2021. 1. 14. 12:52

[공부 내용]

크롤링을 하기 위해서는 웹페이지에 대해 알아야 한다.

웹페이지는 HTML을 기반으로 한다.

HTML(HyperText Markup Language)은 '마크로 둘러싸인 언어'라는 뜻으로 구조에 대한 정보를 기반으로 작성된 언어

즉, 웹 페이지를 이루고 있는 구성 요소들에 대해 작성되어 있는 문서 또는 가이드북.

> HTML

웹페이지의 시작과 끝 <html></html>

문서의 제목 <title></title>

웹에 실제로 표시되는 내용 <body></body>

ul 태그 : unordered list. 순서가 필요 없는 목록

li 태그 : list item. 목록의 내용이 되는 실질적 태그

a 태그 : 링크

p 태그 : paragraph(단락)의 약자로 긴 글div 태그 : 페이지의 구획을 나눌 때stronh 태그 : 중요, 긴급 등을 나타내는 태그