使用BeautifulSoup查询关键词谷歌搜索结果排名.

使用BeautifulSoup查询关键词谷歌搜索结果排名


ChatGPT账号注册、ChatGPT Plus代升级、OpenAI API key、OpenAI API 国内购买, 美国本地网络100%手工注册 ,https://hmbcloud.cn/gpt/

使用BeautifulSoup查询关键词谷歌搜索结果排名

  谷歌关键词排名是当用户搜索关键词时网站在谷歌搜索中的位置。换句话说,Google 搜索基本上是在搜索索引中对数千亿个网页进行排序,以在几分之一秒内找到最相关、最有用的结果,并以一种可帮助您找到所需内容的方式呈现它们。

  在本文中,我们将学习如何使用BeautifulSoup查询关键词谷歌搜索结果排名,首先需要了解 Google 排名的基础知识,然后继续使用 Python 进行查找。

使用BeautifulSoup查询关键词谷歌搜索结果排名

  我们使用了一个叫做 requests的模块,它有一个方法get返回一个包含页面内容、状态等的响应,我们将响应保存到一个对象页面,并使用page.text方法从对象中提取页面内容,并使用漂亮的汤来使用 python 的内置 HTML 解析器解析 HTML 中的文档,以便我们可以访问 HTML 文档中的数据并从搜索的关键字中获取 URL。

需要的模块

  我们需要在你的系统中通过pip分别安装requests和bs4这两个模块。请求:请求模块允许您发送 HTTP 请求并返回包含所有数据(例如状态、页面内容等)的响应。什么是Python模块,可参考 python模块

pip install requests

  Beautiful Soup:beautiful Soup模块允许您使用 python 的内置 HTML 解析器解析原始 HTML 或 XML 文档,以便我们可以从解析的文档中提取数据。推荐: Beautiful Soup教程

pip install bs4

查询关键词排名方法分析

  1、我们需要提供要搜索的关键字和网站,如果它存在于给定数量的搜索查询中,则可以找到排名。

谷歌搜索的基本网址:“https://www.google.com/search?q=” 
通过用“+”替换空格来添加关键字 
添加 &num=30 以及将搜索结果的数量表示为 30
最终网址 = “ https://www.google.com/search?q=wordpress博客主题&num=30”

Google搜索结果页面

  2.使用requests.get(url)方法向 Google 搜索发送 HTTP 请求,该搜索返回来自搜索引擎的响应,该响应作为对象保存到页面。

page = requests.get(“https://www.google.com/search?q=wordpress博客主题&num=30”)

  3.使用page.text方法获取页面内容,使用beautiful Soup解析原始HTML。

soup = BeautifulSoup(page.text, 'lxml')

  这将创建一个解析树,帮助访问 HTML 文档中的数据。

  4.使用soup.find_all()找到具有相同类“ZINbbc xpd O9g5cc uUPGi”的div,因为它包含所有搜索查询以及<a> 标签内的URL,并将其存储在result_div 中。(参考下面有开发者工具的图片)

result_div = soup.find_all(‘div’, attrs={‘class’: ‘ZINbbc xpd O9g5cc uUPGi’})

这是开发人员工具的图像,其中所有搜索查询都具有相同的 div 类但包含不同的 URL,我们可以通过检查 <a> 标记中的 URL 看到这里的排名为 2。

  5.迭代 result_div 并找到 <a> 标签并检查是否存在任何 URL,如果找到,则检查它是否与输入中提供的网站匹配并将排名添加到 rank_list。(rank_list 是一个字符串变量,因为可以出现多个等级)

link = div.find("a", href=True) 
if link['href'][7:7+len(website)] == website: 
    rank_list += str(rank)+","

  6.迭代结束后,返回rank_list并打印rank。下面是完整的实现:

import requests
from bs4 import BeautifulSoup

def find_rank(keyword, website, search_query):
    
    rank, rank_list = 1, ""
    url = "https://www.google.com/search?q="
    keyword = keyword.replace(" ", "+")
    url = url + keyword + "&num=" + str(search_query)
    page = requests.get(url)
    soup = BeautifulSoup(page.text, 'lxml')
   
   
    result_div = soup.find_all(
        'div', attrs={'class': 'ZINbbc xpd O9g5cc uUPGi'})

   
    for div in result_div:
        try:
            link = div.find("a", href=True)
            if link['href'][7:7 + len(website)] == website:
                rank_list += str(rank) + ","
            rank += 1
        except:
            pass
    return (rank_list, "Website Missing")[rank_list == ""]

if __name__ == "__main__":
    keyword = "wordpress博客主题"
    website = "https://www.pythonthree.com/"
    search_query = 50
    rank = find_rank(keyword, website, search_query)

    if rank == "Website Missing":
        print(rank)
    else:
        print("Rank of Website :", rank[:-1])

  输出:

Rank of Website : 28

总结

  以上是 晓得博客为你介绍的使用BeautifulSoup查询关键词谷歌搜索结果排名的全部内容,本文提供的是简单的查询原理,里面没有涉及爬虫的header信息,也没有区分国家和地区来查询排名,更没有使用用户代理来防止被浏览器屏蔽等措施。

  推荐: python基础教程


晓得博客,版权所有丨如未注明,均为原创
晓得博客 » 使用BeautifulSoup查询关键词谷歌搜索结果排名

转载请保留链接: https://www.pythonthree.com/beautifulsoup-query-keywords-in-google-search/

标签: python3教程, 批量查询关键词排名

滚动至顶部

深圳SEO优化公司山东网站优化公司山东聚搜科技网站301对优化影响网站优化效果更好重庆网站排名优化服务优化好的企业网站源码佛山门窗网站优化软件厦门网站优化开发泰州网站优化蚌埠网站优化服务本地网站如何优化江门专业网站优化加盟价格表宁夏优化网站排名网站性能优化经典书籍衡阳企业网站seo优化报价孝感品牌网站优化要多少钱佛山网站优化排名服务商郑州网站搜索引擎优化哪家好安徽省芜湖市网站关键词优化优秀网站代码优化案例重庆网站优化公司怎么样从化网站 优化扬州网站优化排名企业悟空seo网站优化如何优化网站一样云速捷真品太原网站优化建议手机站seo网站优化哪里有网站优化系统代理项目平台温州网站深度优化湖北诚信服务企业网站优化福建网站关键字优化歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化