Python语言检测模块langid和langdetect的使用实例 - 行业资讯 - 肥雀云

之前使用数据编码风格检测的模块chardet比较多一点,今天提到的两个模块是检测数据的语言类型,比如是:中文还是英文,模块的使用方法也比较简单,我这里只是简单地使用了一下,因为项目中有这个需求,所以拿来用了一下,并没有深入地去研究这两个模块,模块的地址链接我都给出来了,需要的话可以去研究下:

　　　　　　def langidFunc (): 　　“‘ 　　https://github.com/yishuihanhan/langid.py 　　“‘ 　　打印langid。分类(“我们是一家人”) 　　打印langid。分类(“,e una prova”) 　　打印langid.classify(“我们都有一个家”) 　　标识符=LanguageIdentifier.from_modelstring(模型、norm_probs=True) 　　打印标识符。分类(“我们是一家人”) 　　　　def langdetectFunc (): 　　“‘ 　　https://github.com/yishuihanhan/langdetect 　　“‘ 　　s1=u”本篇文章主要介绍两款语言探测工具,用于区分文本到底是什么语言。” 　　s2=u 'We很高兴介绍今天的新技术　　打印检测(s1) 　　打印检测(s2) 　　打印detect_langs (s2) # detect_langs()输出探测出的所有语言类型及其所占的比例　　打印detect_langs (Otec马卡绸syn。) 　　　　

<强>结果如下:

　　
(“en”, 9.061840057373047)
　　(“它”,-35.41771221160889)
　　(古银的,-85.79573845863342)
　　(“en”, 0.16946150595865334)
　　应用
　　在
　　[en: 0.999998109575]
　　(fi pl: 0.571426592237: 0.428568772028)
　　　　
<强>总结
　　
以上就是这篇文章的全部内容了,希望本文的内容对大家的学习或者工作具有一定的参考学习价值,谢谢大家对的支持。如果你想了解更多相关内容请查看下面相关链接
Python语言检测模块langid和langdetect的使用实例