当前位置:网站首页 > 编程语言 > 正文

bs4解析器有哪些(bs4解析xml)



安装:

1.bs4遍历文档树
bs4:解析xml格式的模块,从xml中找想要的数据。
html是xml的一种,解析html,使用requests返回的数据,可能是json、html、文件,再使用bs4解析html格式。

用法:

 

注:lxml比html.parser速度块,但是需要安装lxml模块()

2.bs4搜索文档树
搜索文档树速度是比遍历慢一些的。

用法:

 

案例:

 

3.bs4其他用法
遍历和搜索,可以混合用
recursive :是否递归查找
limit:查找多少条

用法:

 

补充:
1 链式调用(跟语言没关系)

 

2 bs4支持修改文档树,对爬虫没用,对实际写后台代码有用

3 主流软件的配置文件方式
xxx.conf(redis,nginx)
xxx.ini(mysql)
xxx.xml(uwsgi,java的配置文件居多)
xxx.yaml

4 css选择器
所有解析库,通常会有自己的查找方式(bs4就是find和find_all),还会支持css和想xpath选择。
记住一些css选择器用法:

id#
类名.
标签名p
标签名>标签名 紧邻的子
标签名 标签名 子子孙孙

 

5 xpath:在xml中查找文档的语言

6 css、xpath都不会写怎么办
终极大招:浏览器F12选中页面元素,鼠标右击选择xpath或css复制即可~~
示例:

到此这篇bs4解析器有哪些(bs4解析xml)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!
                            

版权声明


相关文章:

  • ubuntu 安装qt(ubuntu 安装qt库)2024-12-14 08:00:10
  • 静态库和动态库的缺点(静态库和动态库的缺点区别)2024-12-14 08:00:10
  • ewm系统(ewm系统的不足)2024-12-14 08:00:10
  • 打印机共享修复合集(打印机共享失败怎么解决)2024-12-14 08:00:10
  • ip地址换算网络地址(ip地址换算网络地址怎么算)2024-12-14 08:00:10
  • 国内驾照换国际驾照需要什么(国内怎么换国际驾照)2024-12-14 08:00:10
  • hpl怎么读(help怎么读)2024-12-14 08:00:10
  • 程序员知识精选(程序员知识点)2024-12-14 08:00:10
  • 十大至强法则(九大至高法则)2024-12-14 08:00:10
  • 圈11符号(圈11符号怎么打)2024-12-14 08:00:10
  • 全屏图片