爱站内页反链 爱站首页反链 神马是否收录 360网站安全检测 搜狗是否收录 360是否收录 百度是否收录 百度年收录 网站年龄 百度安全 百度查询 导出链接 网站ip查询 网站ICP备案批量查询 搜狗快照 百度快照 百度反链批量查询 搜狗PR批量查询 谷歌PR批量查询 神马权重批量查询 360移动权重批量查询 站长移动权重批量查询 爱站移动权重批量查询 360权重查询 站长PC权重批量查询 爱站PC权重批量查询 搜狗总收录批量查询 360日收录批量查询 360总收录批量查询 百度月收录批量查询 百度周收录批量查询 百度日收录批量查询 百度网站收录批量查询 获取网站IP 获取网站描述 获取网站关键词 获取网站标题 HTTP状态码 搜狗权重 搜狗反链 神马总收录 百度预计流量 ALEXA排名 360反链

当前位置 博文首页 > 使用Python提取文本中含有特定字符串的方法示例

最大化 缩小

    使用Python提取文本中含有特定字符串的方法示例

    作者:zkw_1998 时间:2021-08-05 18:25

    今天搞了一天的文本处理,发现python真的太适合做数据处理了。废话不多说,一起学习吧!

    1.我的原始数据是这样的,如图

    2.如果要提取每行含有pass的字符串,代码如下:

    import re
    
    filepath = "E:/untitled1/analyze_log/test.log"
    txt = open(filepath, "r").read()
    
    result=""
    test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
    result = result +'\n'.join(test_text)#换行输出
    print(result)
    

    3.执行上面代码,可以取出每行含有pass的文本,如图:

    4.其实我真正要提取的是每行类似上图红色框内的字符串,代码实现如下:

    import re
    
    filepath = "E:/untitled1/analyze_log/test.log"
    txt = open(filepath, "r").read()
    
    result=""
    test_text = re.findall("..............+pass", txt)#取出每行含有pass的文本
    result = result +'\n'.join(test_text)#换行输出
    del_num = re.sub("\d+ ", "", result)#去掉每行行首的数字
    del_awake = del_num.replace("awake", "")#去掉awake
    del_commd = del_awake.replace("commd", "")#去掉commd
    del_string1 = re.sub("-a+\d\d\d\d-\d.wav", "", del_commd)#去掉-a0023-1.wav类型的字符串
    del_string2 = re.sub("-a+\d\d\d\d.wav", "", del_string1)#去掉-a0016.wav类型的字符串
    print(del_string2)
    

    5.执行上面代码,可以取出最后我需要的文本,如图:

    6.拓展

    7.示例代码

    import re
    
    str = 'Hello123/World 45_?6bye'
    result1 = re.findall('\d',str)#\d匹配任何十进制数
    result2 = re.findall('\d+',str)#\d+可匹配一位或多位数字使用
    result3 = re.findall('\D',str)#\d匹配非数字字符任何十进制数
    result4 = re.findall('\w',str)#\w匹配任何字母数字字符,包括下划线在内
    result5 = re.findall('\W',str)#\W匹配非任何字母数字字符,包括下划线在内
    result6 = re.findall('\s',str)#\s匹配任何空白字符
    result7 = re.findall('\S',str)#\S匹配非任何空白字符
    result8 = re.findall('\AHello',str)#\A仅匹配字符串开头
    result9 = re.findall('bye\Z',str)#\Z仅匹配字符串结尾
    print(result1)
    print(result2)
    print(result3)
    print(result4)
    print(result5)
    print(result6)
    print(result7)
    print(result8)
    print(result9)
    

    接下来会更几篇关于文本处理的博客,一边学习一边记笔记。加油!

    jsjbwy
    上一篇: 用python实现一个简单的验证码
    下一篇:没有了
  • 立即下载 - IIS7 站长工具包
    最新 更多<<
  • 使用Python提取文本中含有特定字符串的方法示例
  • 用python实现一个简单的验证码
  • python基于win32api实现键盘输入
  • 如何利用python正则表达式匹配版本信息
  • python中的对数log函数表示及用法
  • call在Python中改进数列的实例讲解
  • python中_del_还原数据的方法
  • python不同版本的_new_不同点总结
  • python中把元组转换为namedtuple方法
  • python RSA加密的示例
  • python的dict判断key是否存在的方法
  • flask项目集成swagger的方法
  • Python APScheduler执行使用方法详解
  • Python urllib request模块发送请求实现过程解析
  • Python urlopen()参数代码示例解析
  • python实现经纬度采样的示例代码
  • 弄清Pytorch显存的分配机制
  • python 实现ping测试延迟的两种方法
  • 详解Python GUI编程之PyQt5入门到实战
  • Python利用imshow制作自定义渐变填充柱状图(colorbar)
  • 详解java调用python的几种用法(看这篇就够了)
  • python给list排序的简单方法
  • Python制作简单的剪刀石头布游戏
  • class类在python中获取金融数据的实例方法
  • python 实现的IP 存活扫描脚本
  • python opencv图像处理(素描、怀旧、光照、流年、滤镜 原理及实
  • python实现图像随机裁剪的示例代码
  • python中append函数用法讲解
  • FP-growth算法发现频繁项集——发现频繁项集
  • Python Pandas模块实现数据的统计分析的方法
    推荐 更多<<
  • 晴天的专栏:怎样规划你毕业以后的人生
  • python 指定源路径来解决import问题的操作
  • python 存储json数据的操作

深圳SEO优化公司马鞍山建站哪家好白银品牌网站设计多少钱普洱百度竞价多少钱关键词按天收费多少钱益阳百度爱采购价格太原关键词按天扣费报价红河关键词按天收费公司仙桃网站优化报价邢台网站优化排名哪家好商丘网站建设推荐桂林网站设计模板银川推广网站多少钱青岛SEO按效果付费公司福永模板推广哪家好亳州营销网站价格马鞍山百搜标王哪家好漯河关键词排名哪家好南平模板网站建设公司西乡seo价格百色设计公司网站公司黄山设计公司网站价格常州关键词排名哪家好商丘百搜标王哪家好柳州网络推广价格赤峰阿里店铺运营同乐网站排名优化多少钱大芬百度竞价哪家好海东百度竞价包年推广多少钱包头网站优化软件报价赤峰百搜标王报价歼20紧急升空逼退外机英媒称团队夜以继日筹划王妃复出草木蔓发 春山在望成都发生巨响 当地回应60岁老人炒菠菜未焯水致肾病恶化男子涉嫌走私被判11年却一天牢没坐劳斯莱斯右转逼停直行车网传落水者说“没让你救”系谣言广东通报13岁男孩性侵女童不予立案贵州小伙回应在美国卖三蹦子火了淀粉肠小王子日销售额涨超10倍有个姐真把千机伞做出来了近3万元金手镯仅含足金十克呼北高速交通事故已致14人死亡杨洋拄拐现身医院国产伟哥去年销售近13亿男子给前妻转账 现任妻子起诉要回新基金只募集到26元还是员工自购男孩疑遭霸凌 家长讨说法被踢出群充个话费竟沦为间接洗钱工具新的一天从800个哈欠开始单亲妈妈陷入热恋 14岁儿子报警#春分立蛋大挑战#中国投资客涌入日本东京买房两大学生合买彩票中奖一人不认账新加坡主帅:唯一目标击败中国队月嫂回应掌掴婴儿是在赶虫子19岁小伙救下5人后溺亡 多方发声清明节放假3天调休1天张家界的山上“长”满了韩国人?开封王婆为何火了主播靠辱骂母亲走红被批捕封号代拍被何赛飞拿着魔杖追着打阿根廷将发行1万与2万面值的纸币库克现身上海为江西彩礼“减负”的“试婚人”因自嘲式简历走红的教授更新简介殡仪馆花卉高于市场价3倍还重复用网友称在豆瓣酱里吃出老鼠头315晚会后胖东来又人满为患了网友建议重庆地铁不准乘客携带菜筐特朗普谈“凯特王妃P图照”罗斯否认插足凯特王妃婚姻青海通报栏杆断裂小学生跌落住进ICU恒大被罚41.75亿到底怎么缴湖南一县政协主席疑涉刑案被控制茶百道就改标签日期致歉王树国3次鞠躬告别西交大师生张立群任西安交通大学校长杨倩无缘巴黎奥运

深圳SEO优化公司 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化