怎么在PHP中利用康盛创想关键词对中文进行分词

介绍

本篇文章为大家展示了怎么在PHP中利用康盛创想关键词对中文进行分词,内容简明扼要并且容易理解,绝对能使你眼前一亮,通过这篇文章的详细介绍希望你能有所收获。

不同于使用自己的服务器进行分词,康盛创想!在线中文分词服务是基于API返回分词结果的。在项目中,我们只需要一个函数即可方便地进行分词,关键词提取。
以下是根据康盛创想!在线分词服务API写的函数,测试可正常运行:

代码如下:


/* *
, * DZ在线中文分词
, *标题字符串(@param美元进行分词的标题
, *内容字符串(@param美元进行分词的内容
, *编码字符串API (@param美元返回的数据编码
, * @return 数组得到的关键词数组
, */
,函数dz_segment ($ title=& # 39; & # 39;, $内容=& # 39;& # 39;,$=& # 39;编码utf - 8 # 39;) {
,,,if ($ title==& # 39; & # 39;) {
,,,,,,,返回false;
,,,}
,,,$ title=rawurlencode (strip_tags(标题)美元);
,,,内容(内容=strip_tags美元);
,,,如果(strlen(内容)美元在2400){//在线分词服务有长度限制
,,,,,,,$内容=,mb_substr(内容、美元0 800美元编码),
,,,}
,,,内容(内容=rawurlencode美元);
,,,$ url=& # 39; http://keyword.discuz.com/related_kw.html?title=& # 39;。美元冠军# 39;公司及内容=& # 39;。内容# 39;公司美元,ics=& # 39;。美元编码# 39;公司及口服避孕药=& # 39;美元编码;
,,,$ xml_array=simplexml_load_file ($ url);,,,,,,,,,,,,,,,,,,,,,,,//将XML中的数据,读取到数组对象中,
,,,结果=xml_array→美元关键字→结果;
,,,$ data=https://www.yisu.com/zixun/array ();
,,,foreach(结果→美元美元关键项=比;美元值){
,,,,,,,,,,,array_push(元数据(字符串)美元价值→千瓦);
,,,}
,,,如果(count ($ data)的在0){
,,,,,,,返回数据;美元
,,,其他}{
,,,,,,,返回false;
,,,}
,}


<强>分词示例,通过url访问:

代码如下:

http://keyword.discuz.com/related_kw.html?title=高三历史全程复习精品教程,内容=,ics=utf-8&口服避孕药utf - 8=

<强>返回的XML数据:

代码如下:

& lt; ?xml version=?.0”;编码=皍tf-8"祝辞;
& lt; total_response>
, & lt; svalid> 36000 & lt;/svalid>
, & lt; keyword>
, & lt; info>
,, & lt; count> 1 & lt;/count>
,, & lt; errno> 0 & lt;/errno>
,, & lt; nextuptime> 1291287160 & lt;/nextuptime>
,, & lt; keep> 0 & lt;/keep>
, & lt;/info>
, & lt; result>
,, & lt; item>
,,, & lt; kw> & lt; ! [CDATA[高三历史]]祝辞& lt;/kw>
,, & lt;/item>
, & lt;/result>
, & lt;/keyword>
& lt;/total_response>

怎么在PHP中利用康盛创想关键词对中文进行分词