转:分词?Dz提供免费Webservice?
PHP代码
- <?php
- //强制使用字符集
- @header('Content-Type: text/html; charset=gbk');
- $subjectenc ='用“超级站长”安装Discuz!和UCHome,超级简单!'; //这是标题
- $messageenc = preg_replace("/\[.+?\]/U", '', '用“超级站长”安装Discuz!和UCHome,超级简单!'); //这是内容
- //从内容中找标题中有TAG;
- $data = @implode('', file("http://keyword.discuz.com/related_kw.html?title=$subjectenc&content=$messageenc&ics=gbk&ocs=gbk"));//把标题和内容发送到dz官方去找
- if($data) {
- $parser = xml_parser_create();//建立一个 XML 解析器
- xml_parser_set_option($parser, XML_OPTION_CASE_FOLDING, 0);
- xml_parser_set_option($parser, XML_OPTION_SKIP_WHITE, 1);
- xml_parse_into_struct($parser, $data, $values, $index);//将 XML 数据解析到数组中
- xml_parser_free($parser);
- $kws = array();
- foreach($values as $valuearray) {
- if(in_array($valuearray['tag'],array('kw','ekw'))) { //kw ekw是什么意思?
- $kws[] = iconv('utf-8','gbk',$valuearray['value']);//编码转换
- }
- }}
- //最后出来的是数组.
- print_r($kws);
- ?>