目录
一、网页抓取已失效视频的相关信息
二、脚本运行环境的配置(PYTHON)
1.配置python环境(略)
2.引入库
三、使用脚本
1.参数count是收藏视频页面的总页数(第四行代码)
2.根据之前打开json文件的链接来修改需要爬取的url(第六行代码)
在收藏内容中的已失效视频无法被点开,只能模糊地显示出该视频被收藏的日期,并不能为我们提供其他相关的信息,我们考虑使用Chrome的检查功能,找到数据的真实地址,从而找到已失效内容的具体信息
1.打开Chrome浏览器,进入个人主页的收藏夹,找到对应的已失效视频所在的那一页
2.右键窗口的任意位置,点击“检查”指令,进入下图所示页面
3.在最上方的一栏中找到network选项,然后刷新网页。此时,network会显示浏览器从网页服务器中所得到的所有文件,我们所需要的已失效视频的相关信息也在其中。
4.一般这些数据以json文件格式获取,因此我们可以单击network中的XHR选项,下拉找到开头为
格式的链接
5.双击打开链接,我们可以得到以json格式储存的数据,同时记住链接中对应的list?media_id后面的数字,它们对应着你的list?media_id,代码中将会用到。
6.看起来有些头疼,但是我们可以一行一行解析这些数据都代表着什么(这部分可以跳过)
上图其中一个未失效视频对应的数据,"tittle"是标题,"cover"是封面的图片url,"intro"是视频的简介,"upper"对应的是UP主的名字,头像等数据,我们在脚本中将视频的名称,简介和
代码如下:
下面是代码(不能直接复制粘贴用)
使用脚本之前需要对该脚本进行修改
可以看到笔者的收藏总共有27页,读者可以根据自己实际的情况进行修改
在这一行中,我们需要第一步中获取的json文件的链接来修改url
将
这一部分中的xxxxxx修改为之前获得的链接中自己对应的list?media_id即可
爬取结果如图
到此这篇b站上的视频链接怎么打开(b站的链接怎么用)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!
版权声明:
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。
如若内容造成侵权、违法违规、事实不符,请将相关资料发送至xkadmin@xkablog.com进行投诉反馈,一经查实,立即处理!
转载请注明出处,原文链接:https://www.xkablog.com/qkl-jc/75955.html