春天框架中怎么调用HanLP分词

介绍

本篇内容介绍了“春框架中怎么调用HanLP分词”的有关知识,在实际案例的操作过程中,不少人都会遇到这样的困境,接下来就让小编带领大家学习一下如何处理这些情况吧!希望大家仔细阅读,能够学有所成!

改了HanLP的词典就意味着不能用maven直接导入仓库里的包了,只能直接将修改后的数据文件放到本地,然后指定路径给HanLP。搜了一下网上很多方法,都是在项目部署的时候,把HanLP的词典数据放到服务器上一个固定位置上,然后再配置HanLP的配置文件,指定一个固定位置。这种方法虽然直接,但是不能把HanLP的词典数据跟整个项目打包到一起,管理起来很麻烦。倘若把数据直接作为项目的资源文件,部署到Tomcat上后无论怎么在配置里写路径都会提示找不到词典文件。研究了一下HanLP之的问题后,我发现这个项目支持自定义读写文件的IO类。在一个将词典数据放到HDFS上的一个博客启发下,我想了一个很鸡贼的方法,我重写一个IOAdapter类,使用读写静态资源文件的方法读取词典数据了,这样不就可以把数据跟项目打包到一起了嘛。

代码如下:

春天框架中怎么调用HanLP分词

整好了之后把数据文件夹和HanLP。属性放到项目的资源文件夹里,在配置文件里修改一下路径和IOAdapte:

春天框架中怎么调用HanLP分词

春天框架中怎么调用HanLP分词