哈尔滨城城-专业哈尔滨seo优化团队 QQ:577785827

各搜索引擎的中文分词技术

分词这个技术基本上是针对中文搜索引擎而言的,在百度和谷歌上搜索相同的关键词和短语,得出的结果是不同。这不仅仅是算法不同或者技术不同的原因,更多是因为分词算法的存在。百度会根据用户搜索的关键词去进行拆分,而Google更多地是把结果直接返回。

中文分词分为基于词典和统计两种匹配,通常两种方法并不是单一存在着,而是在混合使用。

首先是基于词典的匹配方法,根据用户搜索的词语,搜索引擎会把这些词语与自己词典中的词条进行匹配,如果匹配成功,就切分出一个单词。同时根据方向的不同,分为正向和逆向两种匹配。在正向匹配中,按照词语长度的不同又细分为最大匹配和最小匹配。这种基于词典的匹配很大程度上取决于词典的完整性以及更新情况。

 

其次是基于统计的分词方法,搜索引擎会进行大量的计算,包括字与字相邻的概率,某个短语出现在什么地方最多,用户搜索某个短语或者词的时候回寻找什么样的内容,这些都是搜索引擎基于判断的依据。这种方法有明显的优点,就是对新出现的词有更快的反应,比如当一个新闻出现的时候,如果大家都搜索这个新词语,而百度判断不出来,不能给予正确的搜索结果,那么用户就不会买搜索引擎的账。

基于此,我们应该联想到SEO中很重要的一点,那就是相关性。比如A5这样一个词,我们都知道是代表Admin5站长网,但是刚开始可能搜索引擎并不知道,如果大家搜索的多了,在不同的地方被提及的多了,那么搜索引擎就会判断出A5这个词应该和站长有着某种联系。因此,我们做优化网站的时候也要注意相关性,和相关性的网站做友情链接,或者是发布相关性的内容,都能提升网站在该领域的权威性,当用户搜索的时候,就能够更靠前、有更多的机会被搜索引擎展现。

 


标签:seo
分类:网络推广| 发布:hrbseoadmin| 查看: | 发表时间:2011/12/28
原创文章如转载,请注明:转载自哈尔滨城城 http://www.hrbseo.net/
本文链接:http://www.hrbseo.net/8.html

相关文章

还没有相关文章!

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

Design By 哈尔滨seo | 沪ICP备11005206号-1 | 百度地图 | Power By Z-Blog 1.8 Walle Build 100427.