python动态页面元素爬取_python动态爬取网页

最新推荐文章于 2024-08-13 17:55:51 发布

Gonnch

最新推荐文章于 2024-08-13 17:55:51 发布

阅读量761

收藏 1

点赞数

文章标签： python动态页面元素爬取

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/weixin_42517854/article/details/114960945

版权

本文介绍了如何处理动态加载的网页，通过分析页面请求和使用Selenium+PhantomJS模拟浏览器行为。针对动态页面，可以监控网络请求找出数据加载的URL，直接获取JSON数据；或者使用Selenium打开页面，获取完整的源码，从而抓取动态加载的内容。以豆瓣电影为例，展示了如何使用Selenium搜索电影并提取相关信息。

摘要由CSDN通过智能技术生成

简介

有时候，我们天真无邪的使用urllib库或Scrapy下载HTML网页时会发现，我们要提取的网页元素并不在我们下载到的HTML之中，尽管它们在浏览器里看起来唾手可得。

这说明我们想要的元素是在我们的某些操作下通过js事件动态生成的。举个例子，我们在刷QQ空间或者微博评论的时候，一直往下刷，网页越来越长，内容越来越多，就是这个让人又爱又恨的动态加载。

爬取动态页面目前来说有两种方法

分析页面请求

selenium模拟浏览器行为

1.分析页面请求

键盘F12打开开发者工具，选择Network选项卡，选择JS(除JS选项卡还有可能在XHR选项卡中，当然也可以通过其它抓包工具)，如下图

然后，我们来拖动右侧的滚动条，这时就会发现，开发者工具里出现了新的js请求(还挺多的)，不过草草翻译一下，很容易就能看出来哪个是取评论的，如下图

好，复制出js请求的目标url

最低0.47元/天解锁文章

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Gonnch CSDN认证博客专家 CSDN认证企业博客

87: 原创

-: 周排名

147万+: 总排名

10万+: 访问

: 等级

10: 积分

5: 粉丝

6: 获赞

0: 评论

52: 收藏

写文章

热门文章

csgo被会话踢出什么鬼_【解决方案】“CSGO游戏—断开连接，VAC无法验证会话”问题解决方案... 4963
明确职责分工的重要性_发挥属地作用明确责任分工 3607
使命召唤16计算机内存不足,使命召唤16出现一个问题怎么解决 3328
java程序组成_java程序是由什么组成的 3270
计算机专业学生实习目的,计算机专业应届毕业生实习目的 3244

最新文章

电脑的服务器操作系统是什么,电脑的服务器操作系统是什么
静态文件用什么服务器配置,静态文件服务器路径怎么配置好
ajax 购物车 c#,c#购物车功能实现及收藏功能实现

目录

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

玻璃钢生产厂家四川工业玻璃钢雕塑摆件浙江玻璃钢动漫雕塑四川节庆商场美陈费用西宁节日商场美陈开封玻璃钢不锈钢树叶雕塑小品有诚信的玻璃钢雕塑造型湖滨玻璃钢雕塑价格上海镜面玻璃钢雕塑常用解决方案河南玻璃钢雕塑设计常用玻璃钢花盆费用玻璃钢花盆儿童画山东玻璃钢广场雕塑厂家性价比高的玻璃钢雕塑卡通晋中玻璃钢马雕塑附近校园玻璃钢景观雕塑价格买玻璃钢雕塑广场玻璃钢雕塑供货厂家商场美陈商场庐阳玻璃钢雕塑厂家花都玻璃钢人物雕塑来图定制亳州玻璃钢雕塑优势走廊商场美陈价格订制玻璃钢座椅雕塑玻璃钢跑步的人物雕塑玻璃钢雕塑打磨抛光黄石玻璃钢雕塑厂招聘仙鹤玻璃钢卡通雕塑订做湖北玻璃钢雕塑灯价格情人节国外商场创意美陈乌鲁木齐气球商场美陈装饰电话香港通过《维护国家安全条例》两大学生合买彩票中奖一人不认账让美丽中国“从细节出发”19岁小伙救下5人后溺亡多方发声单亲妈妈陷入热恋 14岁儿子报警汪小菲曝离婚始末遭遇山火的松茸之乡雅江山火三名扑火人员牺牲系谣言何赛飞追着代拍打萧美琴窜访捷克外交部回应卫健委通报少年有偿捐血浆16次猝死手机成瘾是影响睡眠质量重要因素高校汽车撞人致3死16伤司机系学生 315晚会后胖东来又人满为患了小米汽车超级工厂正式揭幕中国拥有亿元资产的家庭达13.3万户周杰伦一审败诉网易男孩8年未见母亲被告知被遗忘许家印被限制高消费饲养员用铁锨驱打大熊猫被辞退男子被猫抓伤后确诊“猫抓病”特朗普无法缴纳4.54亿美元罚金倪萍分享减重40斤方法联合利华开始重组张家界的山上“长”满了韩国人？张立群任西安交通大学校长杨倩无缘巴黎奥运 “重生之我在北大当嫡校长”黑马情侣提车了专访95后高颜值猪保姆考生莫言也上北大硕士复试名单了网友洛杉矶偶遇贾玲专家建议不必谈骨泥色变沉迷短剧的人就像掉进了杀猪盘奥巴马现身唐宁街黑色着装引猜测七年后宇文玥被薅头发捞上岸事业单位女子向同事水杯投不明物质凯特王妃现身！外出购物视频曝光河南驻马店通报西平中学跳楼事件王树国卸任西安交大校长师生送别恒大被罚41.75亿到底怎么缴男子被流浪猫绊倒投喂者赔24万房客欠租失踪房东直发愁西双版纳热带植物园回应蜉蝣大爆发钱人豪晒法院裁定实锤抄袭外国人感慨凌晨的中国很安全胖东来员工每周单休无小长假白宫：哈马斯三号人物被杀测试车高速逃费小米：已补缴老人退休金被冒领16年金额超20万

玻璃钢生产厂家 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化