python爬取微博热门消息（一）——效果展示

最新推荐文章于 2024-04-06 22:17:01 发布

置顶柠檬不甜会酸

最新推荐文章于 2024-04-06 22:17:01 发布

阅读量1.8k

收藏 12

点赞数 4

分类专栏： python 文章标签： python 大数据数据挖掘

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接： https://blog.csdn.net/weixin_45666660/article/details/112478704

版权

python 专栏收录该内容

22 篇文章 13 订阅

订阅专栏

微博的热搜榜对于研究大众的流量有非常大的价值。

今天的教程就来说说如何爬取微博的热搜榜。

感兴趣的小伙伴可以 收藏 + 关注 哦！

另外，关于本项目的效果展示，以及教程，点击一下链接即可。

python爬取微博热门消息（二）—— configs中参数的设置及程序执行过程

python爬取微博热门消息（三）—— 爬取微博热门信息的功能函数

python爬取微博热门消息（四）—— 完整代码

下面，我就介绍一下我的项目效果以及文件结构。

目录

一、目标

二、效果展示

三、文件结构

一、目标

利用 python 爬取微博热门消息榜以及榜单上的热门消息的内容（切记，这里爬取的是公开的微博数据！！！）

并将其保存到本地。

我将会在后面的几篇文章展示我的教程，感兴趣的小伙伴可以关注哦！！！

二、效果展示

以2021年1月11日17:46的热搜榜为例

1、控制台输出我们爬取到的微博热搜榜

网页版微博热搜内容

控制台微博热搜内容

2、控制台输出我们爬取到的热搜内容

以其中某一个热搜为例，即‘ 6：迪丽热巴双马尾 ’

网页版微博热搜内容

控制台微博热搜内容

3、爬取到的数据我们将其存储到本地，文本内容以txt形式存储

以其中某一个热搜为例，即‘ 6：迪丽热巴双马尾 ’

三、文件结构

1、文件结构

2、information文件夹

information文件存储我们爬取到的信息，注：该文件自动创建，无需手动创建

该文件下的结构为：

-- infoimation

-- 2021-01-11_1746 ------ 命名方式：year-month-day_time，为当前时间。当前时间下爬取的所有热搜内容均存于当前文件夹下

-- 01_***.txt ------ 命名方式：数字_热搜关键词.txt。存储该热搜话题的所有内容

-- 02_***.txt

-- 50_***.txt

-- top.txt ------ 命名方式：top.txt。存储该热搜话题的所有内容

-- topic.txt ------ 命名方式：topic.txt。存储当前时间下的所有热搜关键词

示例：

（1）topic.txt

(2) 其中每个热搜信息的内容均以热搜话题命名，并以txt文件形式保存

2、config.py

该文件为配置文件，一些参数可以在这里修改。

3、MicroBlog.py

该文件中包含一些爬取微博数据的函数

关注博主即可阅读全文

柠檬不甜会酸

4
点赞
踩
12

收藏

觉得还不错? 一键收藏
0
评论
python爬取微博热门消息（一）——效果展示

微博的热搜榜对于研究大众的流量有非常大的价值。今天的教程就来说说如何爬取微博的热搜榜。感兴趣的小伙伴可以收藏 + 关注哦！另外，关于本项目的效果展示，以及教程，点击一下链接即可。下面，我就介绍一下我的项目效果以及文件结构。目录一、目标二、效果展示三、文件结构一、目标利用python爬取微博热门消息榜以及榜单上的热门消息的内容（切记，这里爬取的是公开的微博数据！！！）并将其保存到本地。我将会在后面的几篇文章展示我的教程，感兴趣的小伙伴可以关注哦！！！...
复制链接

扫一扫

柠檬不甜会酸 CSDN认证博客专家 CSDN认证企业博客

145: 原创

3954: 周排名

43万+: 总排名

20万+: 访问

: 等级

2841: 积分

1万+: 粉丝

421: 获赞

222: 评论

2518: 收藏

写文章

热门文章

JAVA实现的小程序 13172
JAVA实现2048小游戏 10134
Python实现2048小游戏 8312
python爬取微博用户信息（二）—— cookie的获取方式以及configs中参数的设置 7668
python爬取微博用户信息（六）—— 完整代码 7657

分类专栏

Java 38篇
LeetCode 82篇
python 22篇
cv 6篇
DIP 1篇
pytorch 4篇
C 1篇
Artificial Intelligence 1篇
Deep Learning 1篇

最新评论

JAVA实现Tom猫
久瞑: 老哥，给我也发一个嘞？
python爬取微博用户信息（六）—— 完整代码
hulala__: 求助！！！如果想爬取大量用户应该如何修改代码！
JAVA实现2048小游戏
燚初音: 给Game2048Panel的构造方法里加addListener就行了 this.addKeyListener(this);
python爬取微博用户信息（六）—— 完整代码
2301_80288962: 是第三个文件类啊
python爬取微博用户信息（六）—— 完整代码
2301_80288962: 为什么我爬取的不是用户的内容而是我的关注内容啊

大家在看

String、StringBuilder、StringBuffer之间的区别是什么？ 244
XMall-Front：基于Vue.js的XMall商城前台页面的开发实践
基于51单片机智能超市自动售货机售卖机电机蓝牙APP设计19-839 417
MySQL基本查询
万维组态绑点示例文档

最新文章

Java学习笔记——网络编程
Java学习笔记——序列化
Java学习笔记——集合

目录

目录

分类专栏

Java 38篇

Artificial Intelligence 1篇

Deep Learning 1篇

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

成就一亿技术人!

发出的红包

使用余额支付

点击重新获取

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

深圳SEO优化公司咸宁网站制作多少钱娄底网站优化按天收费多少钱新余seo优化大运网站优化价格朝阳关键词按天扣费价格毕节品牌网站设计价格坂田网站改版哪家好六安seo网站推广多少钱邵阳网站seo优化多少钱金昌网站优化排名公司衡水推广网站多少钱辽源模板制作多少钱渭南建站价格长沙网站开发价格巴中至尊标王坪地推广网站价格甘南网站排名优化公司伊春百度网站优化排名多少钱襄阳百度竞价包年推广焦作百度竞价包年推广价格四平网站设计黄山seo排名报价长沙英文网站建设价格萍乡推广网站推荐银川建设网站报价咸宁百度网站优化排名大连网站改版哪家好荆门网站优化排名坂田关键词按天扣费价格龙岗外贸网站制作歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发春山在望成都发生巨响当地回应 60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警 #春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅：唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子 19岁小伙救下5人后溺亡多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人？开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头 315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU 恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图虚拟主机 SEO 网站制作网站优化