爬虫工程师和反爬虫工程师之间的友好问候
爬虫和反爬虫 爬虫工程师的手段 从渲染好的 html 页面直接找到感兴趣的节点,然后获取对应的文本 去分析对应的接口数据,更加方便、精确地获取数据 反爬虫: 基于用户行为 检测cookie,封ip 动态网页 某一时间内请求次数过多 反爬虫措施 反爬虫的措施 使用HTTPS 协议 单位时间内限制掉请求次数过多,则封锁该账号 前端技术限制 (接下来是核心技术) 比如需要正确显示的数据为“19950220” 先按照自己需求利用相应的规则(数字乱序映射,比如正常的0对应还是0,但是乱序就是 0 1,1 9,3 8,...)制作自定义字体(ttf) 根据上面的乱序映射规律,求得到需要返回的数据 199
用户评论