汉语言处理包Hanlp的使用

  

  本来想通过python调用Java实现Hanlp的使用,参考文章:http://t.cn/RUrIF7z   

  

  # # # # # # # # # # python可以用easy_install安装一些软件# # # # # # # # # # # #   

  

  1. jpype使用介绍   

  

  参考:http://michael-paul.iteye.com/blog/1055786   

  

  Python作为一种灵活的软件开发语言在当今被广泛使用。在软件开发过程中,有时需要在Python项目中利用既有Java的代码,已达到节省时间和开发成本的目的,因此,找到一个Python代码调用Java代码的桥梁是非常有意义的。JPype就是这样的一个工具,利用它可以使Python程序方便的调用Java代码,从而扩充Python语言的能力,弥补Python语言的不足。本文介绍了如何利用JPype整合Python程序和Java程序的一些基本方法。   

  

  下面是一个简单的python程序,通过JPype调用Java的打印函数,打印出字符串。   

  

  清单1。你好,世界   

  

  进口jpype   

  

  jvmPath=jpype.getDefaultJVMPath ()   

  

  jpype.startJVM (jvmPath)   

  

  jpype.java.lang.System.out。println (“hello world !”)   

  

  jpype.shutdownJVM ()   

  

  运行该例程的时候,getDefaultJVMPath()找不到默认的jvm路径,检查发现在命令行下输入java和javac都是没问题,而且已经配置好环境变量。找到jpype官方文档给的例程(http://jpype.sourceforge.net/doc/user-guide/userguide.html),使用说明(http://blog.csdn.net/niuyisheng/article/details/9002926)发现历程中jdk中jre文件有客户文件夹,而现在版本只有服务器文件夹,然后找一篇文章介绍jvm中端模式和服务器模式的区别(http://ryxxlong.iteye.com/blog/1696537),发现他们用的都是jdk1.6,而现在的版本是jdk1.8,猜想新版本已经没有该功能了,把jdk换成1.6版本还是发现没有客户文件夹,放弃在python中调用java包Hanlp,直接在java程序中使用Hanlp。   

  

  
  

  

  11大Java开源中文分词器的使用方法和分词效果对比:   

  

  http://my.oschina.net/apdplat/blog/412921?fromerr=jF95Yz4r   

  

  
  

  

  2 .关于HanLP   

  

  HanLP是一个致力于向生产环境普及NLP技术的开源Java工具包,支持:   

  

  中文分词(N -最短路分词,CRF分词,索引分词,用户自定义词典,词性标注),   

  

  命名实体识别(中国人名,音译人名,日本人名,地名,实体机构名识别),   

  

  关键词提取,自动摘要,短语提取,拼音转换,简繁转换,文本推荐,依存句法分析(MaxEnt依存句法分析,神经网络依存句法分析)。   

  

  Hanlp的安装和入门说明:http://hanlp.linrunsoft.com/doc/_build/html/getting_started.html Hanlp   

  

  HanLP中的数据分为词典和模型,其中词典是词法分析必需的,模型是句法分析必需的   

  

  官网演示:https://github.com/hankcs/HanLP/tree/master/src/test/java/com/hankcs/demo   

  

  汉语言处理包Hanlp的使用“>
  </p>
  <p>
  <br/>
  </p>
  <p>
  <br/>
  </p>
  <p>
  文章来源于zhangqiang1104的博客
  <br/>
  </p><h2 class=汉语言处理包Hanlp的使用