python爬虫——requests+xpath 爬取8684公交查询网站
一.分析网站
url = 'http://xian.8684.cn/'
1.第二层路线xpath:
# 查找以数字开头的所有链接
number_href_list = tree.xpath('//div[@class="list"][1]/a/@href')
# 查找以字母开头的所有链接
char_href_list = tree.xpath('//div[@class="list"][2]/a/@href')
2.准确路线xpath:
route_list = tree.xpath('//div[@class="list clearfix"]/a/@href')
3.提取所需要爬取的内容:
3.1获取公交信息:
bus_number = tree.xpath('//div[@class="info"]/h1/text()')[0]
3.2 获取运行时间:
run_time = tree.xpath('//ul[@class="bus-desc"]/li[1]/text()')[0]
3.3获取更新时间:
laster_time = tree.xpath('//ul[@class="bus-desc"]/li[4]/text()')[0]
3.4获取上行总站数:
up_total = tree.xpath('//div[@class="layout-left"]/div[4]/div/div[@class="total"]/text()')[0
en12138: 大佬你好, 请问这上面还有啥别的坑吗? 我现在可以用ssh连接服务器, 按照你的方法设置了服务器的注册表和防火墙, 但还是不能连接远程桌面.
RiceX_904: 您好,我和你一样问题,请问解决了吗
欧欧欧欧小张: 呜呜呜感谢大佬
亘年(Max): 很好很详细感谢
whatever don't care: 那个服务器端的bind里面缺少一个括号