使用Python怎么将文本中的中英文进行分离

  介绍

本文章向大家介绍使用Python怎么将文本中的中英文进行分离,主要包括使用Python怎么将文本中的中英文进行分离的使用实例,应用技巧,基本知识点总结和需要注意事项,具有一定的参考价值,需要的朋友可以参考一下。

Python可以做什么

Python是一种编程语言,内置了许多有效的工具,Python几乎无所不能,该语言通俗易懂,容易入门,功能强大,在许多领域中都有广泛的应用,例如最热门的大数据分析,人工智能,网页开发等。

<强> 1,超短文本,ASCII识别。

s =,“温家宝的# 39;s  Legend  Holdings  will  split  its  several  business  arms 用go  public 提醒stock 市场,,,组# 39;s  president  Zhu  Linan  said 提醒。该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市!”   时间=result ““. join(小姐:for 小姐:拷贝s  if 奥德(i), & lt;, 256)   print(结果) :   中国# 39;s  Legend  Holdings  will  split  its  several  business  arms 用go  public 提醒stock 市场,,,组# 39;s  president  Zhu  Linan  said 周二提醒。

<强> 2,unicode编码识别

import 再保险   时间=s “中国# 39;s  Legend  Holdings  will  split  its  several  business  arms 用go  public 提醒stock 市场,从而组# 39;s  president  Zhu  Linan  said 提醒。该集团总裁朱利安周二表示,中国联想控股将分拆其多个业务部门在股市上市!”   时间=uncn  re.compile (" # 39; [\ \ u007a u0061, \ u0020] & # 39;)   时间=en ““. join (uncn.findall (s.lower ()))   打印(en) :   chinas  legend  holdings  will  split  its  several  business  arms 用go  public 提醒stock 市场,从而groups  president  zhu  linan  said 提醒星期二

<强>中文的编码范围是:\ \ u9fa5 u4e00,相应的[^ \ u4e00 - \ u9fa5]可匹配非中文。

匹配英文时,需要将空格[\ u0020]加入,不然单词之间没空格了。

使用Python怎么将文本中的中英文进行分离