python如何爬取网页视频_快就完事了!10分钟用python爬取网站视频和图片

原标题:快就完事了!10分钟用python爬取网站视频和图片

话不多说,直接开讲!教你如何用Python爬虫爬取各大网站视频和图片。

85cf7c6a1ebf481795194cf14e8c97aa.jpeg

638855753

网站分析:

我们点视频按钮,可以看到的链接是:http://www.budejie.com/video/

06e3162e8993425ebcd5a4ae4efc8791.png

接着我们点开网页源码,看下面之处

16cf3d58ac184db99b835aced286269e.png

接着我们把那个下面画红线的链接点开,可以看到是个视频。

cbf1c5b9d50647fca4b18f2e26834955.png

下面我进行相似的操作点图片按钮,可以看到链接:http://www.budejie.com/pic/

b543e7b1930541ec8161c0bb955d10dc.png

接着我们点开网页源码。

836bffac639d49e2a899cfd76d69c094.png

相同操作,我们点开链接:http://mpic.spriteapp.cn/ugc/2016/07/07/577d9f0cdd67d_1.jpg

9fd6b0d6099e446fa8f512b3c81d60af.png

基本上就是这么个套路,也就用了python的两个模块 一个urllib 一个re正则

效果图:

这个是我爬下来的图片

99e9656b7d6b414d856f5dcb21151288.jpeg

这个是我爬下来的视频

fc44c323c25841efbc4588f9ab34792d.jpeg

这个是我把Linux上的视频拖一下到Windows上给大家看效果。

5baf8b47f9d24e838371b0c762d47482.jpeg

下面直接上代码!!!

爬视频的代码

#!/usr/bin/env python

# -*- coding:utf-8 -*-

importurllib,re

defgeturl:

html = urllib.urlopen("http://www.budejie.com/video/").read

reg = r'data-mp4="(.*?)"'

returnre.findall(reg,html)

forpage inrange(1,100):

fori ingeturl:

printi #i是视频的链接地址

video = urllib.urlopen(i).read

fwc = open('./video/%s'%i.split('/')[-1],'wb')

fwc.write(video)

fwc.close

爬图片的代码

# -*- coding:utf-8 -*-importurllib,redefgeturl:html = urllib.urlopen("http://www.budejie.com/pic/").readreg = r'data-original="(.*?)"'returnre.findall(reg,html)forpage inrange(1,100):fori ingeturl:printi #i是图片的链接地址video = urllib.urlopen(i).readfwc = open('./picture/%s'%i.split('/')[-1],'wb')fwc.write(video)fwc.close

声明:本文于网络整理,著作权归原作者所有,如有侵权,请联系小编删除。返回搜狐,查看更多

责任编辑:

weixin_39953673
关注 关注
  • 3
    点赞
  • 21
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
python爬取网页视频
csdn_drinker的博客
11-25 1353
#coding=gbk from lxml import etree import requests from multiprocessing.dummy import Pool import random #@starttime:2021/11/25 10:21 #@endtime:2021/11/25 15:20 if __name__=='__main__': # video_down_url = [] url='https://www.pearvideo.com/' head
python如何爬取视频
热门推荐
weixin_44355653的博客
11-23 1万+
Python爬虫实现获取数据以及视频,如你也要获取数据以及视频可以进来看看,希望对你有所帮助
python爬取视频源代码
03-19
利用python中的re和requests模块,实现对网站中的视频进行爬取,对于图片和文字的爬取也是同样的原理,重点是学会就网页html标签的正确正则就能获取到我们需要的数据,这里是用的单线程爬取
Python爬虫:爬取各种视频
m0_65438914的博客
02-21 2591
各种视频爬取,短视频,中视频,长视频等等
简短的爬虫程序,14行Python代码轻松实现爬取网站视频
最新发布
2401_83816794的博客
04-16 382
通过网页网址:http://www.budejie.com/video/1,我们可以发现针对不同页码变化的知识网址最后一个数值,而这个数值代表了页数,所以只需要改变为固定网址+变量的形式批量获取该站的网址URL。我们通过谷歌浏览器访问页面,按F12并切换到Network,刷新界面观察访问进程,可以从进程文件中选取一个查看头文件,添加到代码中,(这里选取的baisibudejie.js)修改代码如下,可以正常爬取界面。(3)通过对于源代码UTF-8编码恢复中文的显示。批量获取URL,并从中提取视频的URL。
python爬虫教程,爬取任意网站上面的视频
PythonJavaPHP的博客
11-19 1万+
前言 对于Python爬虫很多人都不陌生,可以用它来批量下载文字、图片视频等,其中涉及的知识点也是比较多的,但是Python中有一个方法,一行代码就能爬取任意网站上面的视频,只要你安装了Python环境就可以,哪怕是小白也能轻松学会。 You-Get You-Get是一个基于 Python 3 的下载工具。使用 You-Get 可以很轻松的下载到网络上的视频图片及音乐。 1.安装P...
python爬虫】爬取网页视频,解析m3u8文件,获取ts并合成mp4
03-02
python爬虫相关: 由于很多网站上的视频只提供在线观看,没有下载入口,故有必要进行网络爬虫获取视频资源。 利用requests获取网页源代码中的m3u8链接,对链接进行逐步解析,获取ts列表,下载所有ts文件,将其合并生成mp4文件。做到对视频爬取。 同名博文相关代码。
python慕课视频-python爬虫:爬取网站视频
weixin_37988176的博客
11-01 552
新建一个py文件,代码如下:#!/usr/bin/python# -*- coding: UTF-8 -*-import urllib,re,requestsimport sysreload(sys)sys.setdefaultencoding('utf-8')url_name = [] #url namedef get():#获取源码hd = {"User-Agent":&q...
超详细Python-一键爬取图片、音频、视频资源
QQ2352108083的博客
04-27 1221
前言 使用Python爬取任意网页的资源文件,比如图片、音频、视频;一般常用的做法就是把网页的HTML请求下来通过XPath或者正则来获取自己想要的资源,这里我做了一个爬虫工具软件,可以一键爬取资源 媒体文件;但是需要说明的是,这里爬取资源文件只针对HTML已有的文件,如果需要二次请求的是爬取不到的,比如酷狗音乐播放界面,因为要做通用工具,匹配不同的网站!!!???????????? 这里主推图片爬取,一些需要...
python爬取网站视频
梦里逆天的博客
08-03 6424
python爬取网站视频,实现步骤:1.发送请求,对于视频信息数据包发送请求;2.获取数据,获取服务器返回的数据;3.解析数据,提取我们想要的内容:视频url地址、视频标题;4.保存数据,将视频内容保存到指定文件夹。.........
python爬虫,爬取CNNNews网页的带视频的新闻
03-25
python爬虫,爬取CNNNews网页的带视频的新闻。 可爬取新闻标题,文本,图片视频。 可根据关键字进行爬取
Python爬虫进阶之爬取视频并下载的实现
01-21
这几天在家闲得无聊,意外的挖掘到了一个资源网站(你懂得),但是网速慢广告多下载不了种种原因让我突然萌生了爬虫的想法。 下面说说流程: 一、网站分析 首先进入网站,F12检查,本来以为这种低端网站很好爬取,是我太低估了web主。可以看到我刷新网页之后,出现了很多js文件,并且响应获取的代码与源代码不一样,这就不难猜到这个网站是动态加载页面。 目前我知道的动态网页爬取的方法只有这两种:1、从网页响应中找到JS脚本返回的JSON数据;2、使用Selenium对网页进行模拟访问。源代码问题好解决,重要的是我获取的源代码中有没有我需要的东西。我再一次进入网站进行F12检查源代码,点击左上角然后在页面
百度图片爬取_爬取_爬取图片_爬虫_python爬_python_
09-29
利用python爬取指定关键词的百度图片
python爬虫.rar_python_python爬取图片_python爬虫_爬虫
07-14
指定一个网站,从该网站爬取全部匹配的图片到任意指定的文件夹当中,关键是正则表达式的使用
zhp.zip_python爬取飞猪网机票_爬取飞猪_爬取飞猪网_爬猪网
09-21
python2.7爬取飞猪网特价机票 用户输入所在地和目的地即可看到符合要求特价机票并按省份归类
python爬取图片搜索网站.zip_python_图片_爬虫_网页
07-14
本程序可以爬取一个免费图片搜索的网站,并且一键下载到本地文件夹里面,支持英文关键词搜索.
Python爬取视频(其实是一篇福利)过程解析
09-18
主要介绍了Python爬取视频(其实是一篇福利)过程解析,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下
40行代码教你利用Python网络爬虫批量抓取小视频
WANGJUNAIJIAO的博客
12-19 5273
还在为在线看小视频缓存慢发愁吗?还在为想重新回味优秀作品但找不到资源而忧虑吗?莫要慌,让python来帮你解决,40行代码教你爬遍小视频网站,先批量下载后仔细观看,岂不美哉!本文主要基于Python网络爬虫,利用40行代码,针对小视频网页,进行批量获取网页视频到本地。方法简单易行,而且行之有效,欢迎大家踊跃尝试。如果想获取本文代码,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费】
ubuntu20.04下载搜狐输入法
08-15
要在Ubuntu 20.04上下载搜狐输入法,你可以按照以下步骤进行操作: 1. 打开浏览器,访问搜狗输入法的下载页面。链接是:https://pinyin.sogou.com/linux/?r=pinyin。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [Ubuntu(20.04)中安装搜狗输入法详细教程](https://blog.csdn.net/mr__bai/article/details/118674640)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *2* *3* [ubuntu server 20.04安装vnc远程桌面xfce4](https://blog.csdn.net/lxyoucan/article/details/121672487)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v92^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
164
原创
39
点赞
262
收藏
32
粉丝
关注
私信
写文章

热门文章

  • 服务器 运行时错误怎么办,内部服务器错误怎么办 13680
  • box-shadow属性四个值_boxshadow的妙用 11246
  • 我的世界1.12.2java下载_我的世界1.12.2电脑版下载 9627
  • 局域网联机_红警如何局域网联机?详细联机教程,方法特别简单 8091
  • python pip3 install_python3安装pip3(install pip3 for python 3.x) 6320

您愿意向朋友推荐“博客详情页”吗?

  • 强烈不推荐
  • 不推荐
  • 一般般
  • 推荐
  • 强烈推荐
提交

最新文章

  • 刀片服务器在哪看cpu型号,了解认识刀片服务器
  • 多台服务器做一个网站,一台云服务器做多个网站
  • 美国服务器查询网站查询网站查询网站查询网站查询,全球DNS节点查询网
2021年142篇
2020年225篇

目录

目录

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43元 前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值

深圳SEO优化公司桂林关键词按天扣费哪家好大连网站定制推荐鹤岗SEO按天扣费报价资阳网页设计价格铜陵企业网站建设推荐鹤岗百度竞价包年推广公司天水网站搭建公司临汾网络推广安康网站搜索优化张家界设计公司网站公司宝鸡关键词按天收费推荐杭州网站优化哪家好辽源SEO按天收费价格南通关键词排名推荐济宁模板制作公司塔城百度爱采购哪家好梅州网站设计公司承德百度竞价包年推广莱芜百度关键词包年推广石岩企业网站设计公司宁波SEO按天收费价格呼和浩特网站设计模板公司玉溪高端网站设计多少钱盐田百姓网标王推广公司盐城百姓网标王吴忠关键词排名价格眉山网站优化排名哪家好和县网站设计模板苏州百姓网标王推荐南澳网站推广多少钱歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化