QQ:在线客服

24小时客服:0531-55587968   15069066861 建站流程

NEWS建网站知识

济南建网站知识,网站建设技术灵魂总结
Website news, Technical summary of soul

济南网站建设中如何使用php自动获取文章内容关键字

点击次数:更新时间:2013-12-10 23:12:07【打印】【关闭】

        济南网站建设中了解网站的优化的人员都很清楚,对于一个网站来说,网站内部结构的优化对于搜索引擎蜘蛛的爬行起到一个决定性的作用。网站内部优化的越好搜索引擎蜘蛛爬行的深度和时间也就越长和越深。淡然蜘蛛爬行的规律还有很多因素的影响,比如网站权重,网站内容质量,蜘蛛类型等,都会决定网站爬行的深度问题。

        怎么样才算是网站内部优化的好呢,网站内部优化可分为两个部分,一是网站内部代码的优化,这其中包括html标签的使用规范,DIV+CSS的使用优化技巧两方面。二是网站结构的优化,网站结构优化归根到底就是能够让网站的内部结构符合人们的浏览习惯,能够在网站浏览者对网站的任何一个页面进行浏览的时候都能够快速方便的找到自己喜欢的东西。

        我们进入正题,想要提高网站的内部结构,让浏览者在适当的位置,找到适当的有效信息。在网站中的文章增加自动获取关键字的功能就成为了一个很好的选择。试想,当你对网站中的一篇文章进行浏览的时候,在文章的最后,有本文相关关键字,本问相关搜索等信息的话,既有可能你会接着往下看和本文相关的内容,从而降低了网站的跳出率,提高了网能浏览性。

网站文章内容关键字自动获取

一、文章内容关键字自动获取的思路

        通过获取php获取到所需提取的内容,通过字典中定义的分词方法,对获取到的内容进行分词,最后将得到的分次进行最终匹配,将最终得到的结果以数组的形式返回给函数。

二、文章内容关键字自动获取实现方法

        首先我们把已经写好的字典文件和分次函数以及测试文件下载到本地,然后打开其中的index.php文件,把其中的//print_r(get_tags_arr($con));这行代码的注视删掉,运行此文件,查看是否有分次输出。正常输出结果如下图所示。

内容自动获取关键字测试结果

通过图可以看到,只需要使get_tags_arr这个函数得到我们所需要的分次的文字就可以了,代码中的实现方法:

<?PHP

$a=trim(strip_tags(content('jianjie')));  //得到所需要提取关键字的文字部分并去除文字中的html标签和空格标签

$arr=get_tags_arr($a);   // 使用get_tags_arr函数将文字进行分词处理,并返回数组

foreach($arr as $k=>$val){

echo "<a href='/search/search.php?key=$val' title='$val' target='_blank'>$val</a> &nbsp;&nbsp;&nbsp;";

}

//通过foreach将数组循环,并输出html格式

?>

通过以上步骤就会发现我们已经得到自己想要的分词结果,就是这么简单,文章内容自动获取关键字的功能就完成了。

三、文章内容自动获取关键字常见错误

①、分词关键字中出现html标签

解决方法:在输出内容之前加入strip_tags()函数,将输出内容中的html标签去除。

②、输出字符中出现乱码

解决方法:将分词在输出之前进行转码处理,所使用函数mb_convert_encoding()。

浏览器乱码现象

③、在不同浏览器中,分词转码之后,会发生乱码现象

解决方法:通过判断浏览器的类型,设置是否需要对分词进行转码处理,所使用函数strpos($_SERVER['HTTP_USER_AGENT']。

浏览器判断和转码处理

        在进行济南网站建设的过程中,我们需要对客户进行网站建设的工作时,要记住尽可能的把网站的每个细节都处理好,其实像网站内容自动提取关键字这个功能,对于一般性的网站来说都是可有可无的,甚至在实际中不加入这个功能对网站正常开发和运营都没有什么影响,但是考虑到网站用户体验上来说,适当的加入类似这样的功能,在很大程度上有助于提高网站的可读性和吸引力,从而提高了网站的权重和关键字的排名。

相关文档下载:自动提取文章内容关键字

您可能对以下文章也感兴趣:

网站建设中如何判断网站原创内容是否被蜘蛛抓取到

网站建设中如何通过中文分词技术优化网站

网站建设如何判断自己的网站是否存在问题

网站建设中网站布局的技巧

济南网站建设成功案例更多
底部线条

7x24小时服务热线:0531-55587968   15069066861   网站建设博客