python如何爬取网页视频_快就完事了！10分钟用python爬取网站视频和图片

最新推荐文章于 2024-04-16 16:27:39 发布

weixin_39953673

最新推荐文章于 2024-04-16 16:27:39 发布

阅读量6k

收藏 21

点赞数 3

文章标签： python如何爬取网页视频

原标题：快就完事了！10分钟用python爬取网站视频和图片

话不多说，直接开讲！教你如何用Python爬虫爬取各大网站视频和图片。

638855753

网站分析：

我们点视频按钮，可以看到的链接是：http://www.budejie.com/video/

接着我们点开网页源码，看下面之处

接着我们把那个下面画红线的链接点开，可以看到是个视频。

下面我进行相似的操作点图片按钮，可以看到链接：http://www.budejie.com/pic/

接着我们点开网页源码。

相同操作，我们点开链接：http://mpic.spriteapp.cn/ugc/2016/07/07/577d9f0cdd67d_1.jpg

基本上就是这么个套路，也就用了python的两个模块一个urllib 一个re正则

效果图：

这个是我爬下来的图片

这个是我爬下来的视频

这个是我把Linux上的视频拖一下到Windows上给大家看效果。

下面直接上代码！！！

爬视频的代码

#!/usr/bin/env python

# -*- coding:utf-8 -*-

importurllib,re

defgeturl:

html = urllib.urlopen("http://www.budejie.com/video/").read

reg = r'data-mp4="(.*?)"'

returnre.findall(reg,html)

forpage inrange(1,100):

fori ingeturl:

printi #i是视频的链接地址

video = urllib.urlopen(i).read

fwc = open('./video/%s'%i.split('/')[-1],'wb')

fwc.write(video)

fwc.close

爬图片的代码

# -*- coding:utf-8 -*-importurllib,redefgeturl:html = urllib.urlopen("http://www.budejie.com/pic/").readreg = r'data-original="(.*?)"'returnre.findall(reg,html)forpage inrange(1,100):fori ingeturl:printi #i是图片的链接地址video = urllib.urlopen(i).readfwc = open('./picture/%s'%i.split('/')[-1],'wb')fwc.write(video)fwc.close

声明：本文于网络整理，著作权归原作者所有，如有侵权，请联系小编删除。返回搜狐，查看更多

责任编辑：

weixin_39953673

3
点赞
踩
21

收藏

觉得还不错? 一键收藏
0
评论
python如何爬取网页视频_快就完事了！10分钟用python爬取网站视频和图片

原标题：快就完事了！10分钟用python爬取网站视频和图片话不多说，直接开讲！教你如何用Python爬虫爬取各大网站视频和图片。 638855753网站分析：我们点视频按钮，可以看到的链接是：http://www.budejie.com/video/ 接着我们点开网页源码，看下面之处接着我们把那个下面画红线的链接点开，可以看到是个视频。下面我进行相似的操作点图片按钮，可以看到链接：http:...
复制链接

扫一扫

weixin_39953673

博客等级

码龄7年

164
原创

39
点赞

262
收藏

32
粉丝

关注

私信

写文章

热门文章

服务器运行时错误怎么办,内部服务器错误怎么办 13680
box-shadow属性四个值_boxshadow的妙用 11246
我的世界1.12.2java下载_我的世界1.12.2电脑版下载 9627
局域网联机_红警如何局域网联机？详细联机教程，方法特别简单 8091
python pip3 install_python3安装pip3（install pip3 for python 3.x） 6320

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

刀片服务器在哪看cpu型号,了解认识刀片服务器
多台服务器做一个网站,一台云服务器做多个网站
美国服务器查询网站查询网站查询网站查询网站查询,全球DNS节点查询网

2021年142篇

2020年225篇

目录

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

深圳SEO优化公司桂林关键词按天扣费哪家好大连网站定制推荐鹤岗SEO按天扣费报价资阳网页设计价格铜陵企业网站建设推荐鹤岗百度竞价包年推广公司天水网站搭建公司临汾网络推广安康网站搜索优化张家界设计公司网站公司宝鸡关键词按天收费推荐杭州网站优化哪家好辽源SEO按天收费价格南通关键词排名推荐济宁模板制作公司塔城百度爱采购哪家好梅州网站设计公司承德百度竞价包年推广莱芜百度关键词包年推广石岩企业网站设计公司宁波SEO按天收费价格呼和浩特网站设计模板公司玉溪高端网站设计多少钱盐田百姓网标王推广公司盐城百姓网标王吴忠关键词排名价格眉山网站优化排名哪家好和县网站设计模板苏州百姓网标王推荐南澳网站推广多少钱歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发春山在望成都发生巨响当地回应 60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警 #春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅：唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子 19岁小伙救下5人后溺亡多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人？开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头 315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU 恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化