html5lib 解析器
优点:
  最好的容错性
  以浏览器的方式解析文档
  生成HTML5格式的文档
缺点:
  速度慢
  不依赖外部扩展

安装方法:
pip install html5lib
easy_install html5lib
apt-get install Python-html5lib

# 使用方法
BeautifulSoup(markup, "html5lib")
lxml XML 使用方法