b站直接用BV号爬虫抓取评论
b站的评论由js加载,所以我们有两种方法获取, 第一种用selenium,拖拽导航条,刷新出评论再抓取(效率低且代码量大) 第二种直接找到js接口去获取数据 先说下我一开始的思路 我刚开始不确定是xhr还是js,所以现在xhr中找,发现并没有,于是搜索了js,发现在这个接口里 page代表页数和评论数量,replies是所有评论的内容 于是我们开始分析这个接口的参数 刚开始我以为callback是js加密,后来发现这个参数加不加效果是一样的, 多次试验后发现只有pn,type,oid,sort是必须的 pn是当前页数 type默认为1,作用未知 oid是视频的id sort是排序 我这边直
用户评论