1)安装斯坦福nlp自然语言处理包:pip安装stanfordcorenlp。
2)下载斯坦福CoreNLP文件下载CoreNLP 3.9.2
3)下载中文模型jar包中国下载3.9.2
4)把加压后的斯坦福- CoreNLP -满- 2018 - 10 - 05文件夹和下载的stanford-chinese-corenlp 2018 - 02年- 27模型。罐子放在同一目录下。我是将斯坦福- corenlp -满- 2018 - 10 - 05文件夹更名为stanfordnlp,然后将stanford-chinese-corenlp 2018 - 02年- 27 models.jar放入其中,路径是F: \ \ machine_learning \学习NLP \ stanfordnlp
5)在Python中引用模型:
<代码>从stanfordcorenlp stanfordcorenlp进口 # nlp=StanfordCoreNLP (r 'path lang=zh型”) 学习nlp=StanfordCoreNLP (r 'F: \ \ machine_learning \ nlp \ stanfordnlp lang=zh型”)代码>
但是报错了:FileNotFoundError: [WinError 2]系统找不到指定的文件。
网上很少有类似的问题,终于在LC-HOU博客和大数据和人工智能躺过的坑中找到原因:coreNLP是使用Java编写的,运行环境需要在JDK1.8
于是下载了jdk-8u171-windows-x64(注意这个文件很大)
链接:https://pan.baidu.com/s/1VSdGnSfWGkiSYNbVOMdDmw
提取码:9 uu4
-
<李>双击安装包,进入安装模式,运行→下一步(N),李>
-
<李>接着点击下一步或者,可以更改希望Java安装的路径;(较大建议不装c盘)李>
-
<李>
接着点击下一步或者,可以更改希望Java安装的路径
李> <李>安装完成后,关闭页面;李>
-
<李>安装完成后我们就可以配置java的环境变量了。(最关键的部分)李>
步骤1:进入“计算机”的属“性”选项,选择“高级系统设置”
步骤2:点击“高级系统设置”后,会看到如下图所示的对话框,选择“环境变量”
-
<李>最后,检验是否配置成功运行cmd输入java - version (java和- version之间有空格)李>
若如图所示显示版本信息则说明安装和配置成功。
-
<李>再次运行就没有报错了李>
<代码>从stanfordcorenlp stanfordcorenlp进口 学习nlp=StanfordCoreNLP (r 'F: \ \ machine_learning \ nlp \ stanfordnlp lang=zh型”)代码>