爬虫返回一堆JS怎么办？

最新推荐文章于 2024-09-17 23:15:58 发布

Sitin涛哥

最新推荐文章于 2024-09-17 23:15:58 发布

阅读量3.5k

收藏 14

点赞数 2

文章标签： python 编程语言数据分析数据可视化数据挖掘

点击上方蓝色小字，关注“涛哥聊Python”

重磅干货，第一时间送达

来源：学习python的正确姿势

今天给你分享一下篇反反爬的实例。

一个思路，也许给你带来些许启发..

也许你会遇到这样的情况：

打开某个网站，可以看到页面是正常显示的，但是当你通过 Python 去请求的时候，你会得到一堆无厘头的 JS..

像这样的操作，应该怎么玩呢？

接下来由【小帅b的朋友：lin】给大家演示一下。

当你使用 requests 请求某网站的时候，得到的是这样的：

这时候就要看看是不是用啥了，是不是协议头问题呢？

通过不断的测试最终确定是 cookie 中 acwsc_v2 的问题。

那不就好办了，我们使用一个hook：

这段 hook 有俩种使用方式：一是油猴、二是fd插件。看各位的喜好啦！

打上 hook，打开 F12 调试器，刷新网页，先是遇到了我们熟悉的无限 debugger：

常规的做法是在 debugger 一行左边右键选择 never pause here：

接着 F8 放行断点就行了

如果没有断下来，先清除cookie在刷新网页：

很快就能看到 cookie 被 hook 下来了。

接着在 call stack 往上找：

到 reload 这里看到 x 是我们需要的值：

接着可以观察到原来是在 settimeout 里面做了操作：

所以我们所需要分析的逻辑就变为了:

var _0x23a392 = arg1[_0x55f3('0x19', '\x50\x67\x35\x34')]();

arg2 = _0x23a392[_0x55f3('0x1b', '\x7a\x35\x4f\x26')](_0x5e8b26);

不懂的人会看不懂这种混淆代码，其实这是一种 ob 混淆，可以看到很多函数名变量名基本被混淆了的。

但是不用慌我们可以通过 AST 的方法或者硬刚的方法来解决：

可以看到只需要把解密函数的代码圈起来就能拿到解密后的值，我们就可以按照这个来分析改写了。

这里使用了arg1：

arg1就在页面上层能找到：

然后整个圈起来：

扣和改就行了，工作量不会很大：

还原改写后运行试试看，会看到报一个错，缺少提示的变量，那我们就去 js 里面找这个值：

找到这一段值补上即可，通过几次刷新尝试，发现这段值是固定的，所以可以写死。

补完后运行：

发现和网页计算的一模一样，那我们这个值就正确啦。

最后我们用python实现：

完美！撒花

【完】

今天给大家整理了关于 Python 资源最全的中文合集！

这个开源是由 vinta 发起维护的 Python 资源列表，内容包括：

1 Web 框架网络爬虫

2 网络内容提取

3 模板引擎

4 数据库

5 数据可视化

6 图片处理

7 文本处理

8 自然语言处理

9 机器学习

10 日志

11 代码分析

最难得可贵的是该资源，还有人专门持续更新。

项目的详细内容如下：

（可上下滑动查看全部资源）

资料获取方法

1. 扫描下方二维码

2. 后台回复关键词：开源

????长按上方二维码 2 秒
回复「开源」即可获取资料

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

CSDN认证博客专家 CSDN认证企业博客

1764: 原创

5349: 周排名

150: 总排名

379万+: 访问

: 等级

5万+: 积分

1万+: 粉丝

3万+: 获赞

431: 评论

3万+: 收藏

写文章

热门文章

4个方法，教你1分钟查询你的手机注册了多少软件和网站 83372
B 站疯传，堪称最强，10 大免费的白嫖网站 32315
这几个奇奇怪怪的网站，看完震到腰疼！ 29786
熬夜给女朋友搭建了一个网站~ 24741
Python 中的字符串分割函数 split() 详解 24345

分类专栏

Python 1431篇
资源 14篇
linux 1篇
语言 1篇
随笔
杂记 3篇
工具 4篇
git

最新评论

pygraphviz，一个好用的 Python 库！
qq_33457053: 为什么我pip安装失败呢 ERROR: Failed to build installable wheels for some pyproject.toml based projects (pygraphviz)
aiokafka，一个非常实用的 Python 库！
sinat_35521718: 查阅过aiokafka官方文档，AIOKafkaProducer提供的实现“发送消息”功能的函数是：send、send_and_wait、send_batch，AIOKafkaConsumer提供的实现“消费消息”功能的函数是：get_many、get_one
aiokafka，一个非常实用的 Python 库！
sinat_35521718: 不知道文章示例中的代码是怎么来的，用到的函数并不存在
aiokafka，一个非常实用的 Python 库！
sinat_35521718: 查阅了官方文档，发现AIOKafkaProducer并没有提供send_message、send_messages函数，AIOKafkaConsumer也并没有提供batches函数
boto3，一个不可思议的 Python 库！
Key_June627: 收费吗这个

最新文章

Python函数编程：参数传递与返回值
掌握Python控制流：if语句的高级用法
Python编程技巧：使用vars轻松获取对象属性

目录

目录

分类专栏

Python 1431篇

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

深圳SEO优化公司网站优化排名提升通州网站优化收费甘肃网站优化注意事项宁波网站优化快速排名奉贤区360网站优化费用巩义网站优化推广哪里不错潮州网站搜索优化东宝区网站关键词排名优化厂家甘南网站优化推广找哪个公司福建省给网站优化哪家专业呈贡网站优化报价网站关键词优化值得信赖商丘百度网站优化推荐安康网站关键词优化排名安义网站优化平台网站优化到底是啥意思十堰本地网站优化多少钱高新区网站优化服务郑东新区网站优化平台建材行业网站优化营销泸州网站优化服务园区网站优化多少钱杭州专业网站优化排名多少钱优化网站点击日照正规网站优化咨询电话寿光网站快速优化秋长优化网站公司渭南网站搜索优化长安网站优化专业价格网站可以优化多少词歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发春山在望成都发生巨响当地回应 60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警 #春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅：唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子 19岁小伙救下5人后溺亡多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人？开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头 315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU 恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化