多多色-多人伦交性欧美在线观看-多人伦精品一区二区三区视频-多色视频-免费黄色视屏网站-免费黄色在线

國內最全IT社區平臺 聯系我們 | 收藏本站
阿里云優惠2
您當前位置:首頁 > php開源 > 綜合技術 > python 過濾中文、英文標點特殊符號

python 過濾中文、英文標點特殊符號

來源:程序員人生   發布時間:2014-12-08 08:57:54 閱讀次數:7122次

        在工作中常常遇到很多特殊的標點符號,像中文標點符號,英文標點符號。英文的標點符號比較容易過濾,而過濾中文的標點符號較麻煩。下面是從郵件中過濾特殊符號的方式供參考。


下面是1封垃圾郵件的過濾實例:

"想做/ 兼_職/學生_/ 的 、加,我Q:  1 5.  8 0. !!??  8 6 。0.  2。 3     有,驚,喜,哦"


郵件中的“!?。、”都是中文的,而“/.”是英文的


下面是過濾方式:

<span style="font-size:18px;">#-*-coding:utf⑻-*- import re temp = "想做/ 兼_職/學生_/ 的 、加,我Q: 1 5. 8 0. !!?? 8 6 。0. 2。 3 有,驚,喜,哦" temp = temp.decode("utf8") string = re.sub("[s+.!/_,$%^*(+"']+|[+――!,。?、~@#¥%……&*()]+".decode("utf8"), "".decode("utf8"),temp) print string </span>

過濾后的效果以下:

<span style="font-size:18px;">想做兼職學生的加我Q158086023有欣喜哦</span>

處理成上述格式后就容易進行分詞分析處理了。

生活不易,碼農辛苦
如果您覺得本網站對您的學習有所幫助,可以手機掃描二維碼進行捐贈
程序員人生
------分隔線----------------------------
分享到:
------分隔線----------------------------
關閉
程序員人生
主站蜘蛛池模板: 亚洲国产欧美视频 | 国产精品成 | 久久久久亚洲国产 | 欧美日韩国产另类一区二区三区 | 欧美一级在线观看 | 亚洲三级成人 | 亚洲婷婷综合中文字幕第一页 | 91在线丨亚洲 | 激情视频在线 | 日本黄色免费大片 | 日本不卡视频在线 | 欧美精品久久久亚洲 | 亚洲小说专区 | 伊人中文 | 久久久久久综合成人精品 | 中文字幕2021免费看 | 毛片大全网站 | 亚洲男人的天堂久久精品 | 欧美午夜三级我不卡在线观看 | 逼逼自拍 | 最近中文字幕无免费视频 | 午夜老司机在线观看 | 午夜宅男网站 | 在线观看一区二区三区四区 | 色在线网站 | 亚洲综合区图片小说区 | 亚洲最新永久在线观看 | 欧美a在线播放 | 一区二区三区四区在线播放 | 澳门成人免费永久视频 | 欧美精品成人久久网站 | 久久在精品线影院精品国产 | 人成免费a级毛片 | 国产视频一二三 | 精品一区二区三区免费观看 | 久久91精品国产91久 | 亚洲成a人v天堂网 | 黄色一级a毛片 | 欧美黄区| 激情春色 | 亚洲 欧美 自拍 另类 |