菜鸟如何使用hanlp做分词的过程记录

<强> <强>

hanlp的内容,准备在节后看看有没有时间整理一波hanlp分享下,应该还是会像之前分享DKHadoop一样的方式吧。把整个学习的过程中截图在配文字的方式搞一下。

hanlp学习和使用分享的文章,后面看到的分享也会转载分享给大家。今天分享的这篇也是很早前别人分享的一篇如何用hanlp做分词的文章,新手入门级的可以看看!

菜鸟如何使用hanlp做分词的过程记录

<人力资源/>


hanlp分词

hanlp分词的缺点是只有在java上可以用,但java一是向又是我的弱项,所以在这里写一篇博客从头至尾叙述一下怎么样使用hanlp

hanlp的过程。

<强> jdk <强> <强> openjdk官网去下一个,直接安装即可。

底窗户下的cmd上面,输入java - version看看有没有反应即可判断是否正确安装jdk

jre1.6然而我安装的是jre1.8在cmd里面报错,说找不到jre1.6后来我看了网上的说法,说是也许你别的软件也会下载java环境,所以你可能有许多不同的包,系统在寻找路径的时候,默认会根据你上面配置的环境变量里面找,因此,需要把咱们最新下的那个环境变量放在一大堆环境变量的最前面,尝试即可。】

<强> <强> jdk安装成功之后,第二步,下载eclipse

x86是32位,64位x64是下载之后设定项目的位置【比如我设在了D盘的根目录,结果发现不太好,但是已经改不了了. .教训】

<强> hanlp的各种东西

1。maven方法,下载一个0配置即可。【但是我不会玩儿】

2:先下载hanlp-1.2.8。jar这个jar包<强> <强> <强>

数据。邮政这个数据包,可以选择,选择下载标准数据或迷你数据或全部数据。大小不同,我下的是标准版的.40M

hanlp。属性这个是一个以属性结尾的一个文件,我之前从来没见过,不过可以用txt打开。

eclipse里面去

jar包导入到eclipse的自由目录下

src里面创建一个包,在包里面创建一个类。包会在我设置的根目录D:/下面,类名称首字母必须大写?【貌似不大写的话,会被否决】

数据包解压,然后放在一个自己喜欢的路径【我的路径是D://py/咳缓?在hanlp。属性这个文件里,把根修改为数据存放的上一级目录。

hanlp。属性拖动到src这个目录下

菜鸟如何使用hanlp做分词的过程记录

演示测试,发现报错,import 进口com.hankcs.hanlp。HanLPrun了一下程序

菜鸟如何使用hanlp做分词的过程记录

属性那个文件导入到本目录下,再次打开test0320,在那个本目录下复制属性文件之后运行,成功了

菜鸟如何使用hanlp做分词的过程记录

<强> <强>


菜鸟如何使用hanlp做分词的过程记录