介绍
本文章向大家介绍使用Python怎么将文本中的中英文进行分离,主要包括使用Python怎么将文本中的中英文进行分离的使用实例,应用技巧,基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。
Python可以做什么
Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂,容易入门,功能强大,在许多领域中都有广泛的应用,例如最热门的大数据分析,人工智能,网页开发等。
<强> 1,超短文本,ASCII识别。强>
s =,“温家宝的# 39;s Legend Holdings will split its several business arms 用go public 提醒stock 市场,,,组# 39;s president Zhu Linan said 提醒。该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市!” 时间=result ““. join(小姐:for 小姐:拷贝s if 奥德(i), & lt;, 256) print(结果)
: 中国# 39;s  Legend Holdings  will split its several business arms 用go public 提醒stock 市场,,,组# 39;s president Zhu Linan said 周二提醒。
<强> 2,unicode编码识别强>
import 再保险 时间=s “中国# 39;s Legend Holdings will split its several business arms 用go public 提醒stock 市场,从而组# 39;s president Zhu Linan said 提醒。该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市!” 时间=uncn re.compile (" # 39; [\ \ u007a u0061, \ u0020] & # 39;) 时间=en ““. join (uncn.findall (s.lower ())) 打印(en)
: chinas legend  holdings will split  its several business arms 用go public 提醒stock 市场,从而groups president zhu linan said 提醒星期二
<强>中文的编码范围是:\ \ u9fa5 u4e00,相应的[^ \ u4e00 - \ u9fa5]可匹配非中文。强>
匹配英文时,需要将空格[\ u0020]加入,不然单词之间没空格了。