用方法就是将文档内容传入BeautifulSoup 然后得到一个文档对象。

x = BeautifulSoup(文档,"解析器")
x = BeautifulSoup(y,""html5lib")

参数:解析器。可根据实际情况使用html.parser、lxml、xml、html5lib
官方推荐使用lxml作为解析器更高效率。

# 调用模块
from bs4 import BeautifulSoup

# 1 读取文档
x = BeautifulSoup(open("y.html"), "lxml")

# 2 读取字符串
x = BeautifulSoup("<html>y</html>", "lxml")

# 3 读取爬虫爬取的网页变量
y = requests.get(url)
x = BeautifulSoup(y, "lxml")
html5lib