当前您在:主页>SEO基础>搜索引擎> 中文分词
中文分词
分类:搜索引擎 热度:

  百度搜索引擎中有这中文分词这个过程,它是指将一些长尾词或者组合词拆分成一些有意义的关键词。
 
  中文博大精深,不同的词在不同的语句或者场景中有着不同的意思。而且一个小词往往是由很多个小词组合而成。比如说“南京网站优化”,它由“南京”、“网站”、“优化”组成。这些词都是有着很多含义的,而且它还可以拆分成“南京网站”、“网站优化”这些词。
 
  很显然,我们的站长朋友都很希望用户在搜索这些词的时候能够出现自己的网站,所以分词的出现也能够为站长带来一些短小关键词的排名。
中文分词
 
  分词技术现在已经趋于成熟了,一般有三种方法。
 
  字符串匹配的分词法
 
  词义分词法。
 
  统计分此法。
 
  一、字符串匹配的分词法
 
  是最常用的分词法,百度就是用此种分词。字符串匹配的分词方法又分为3中分词方法:
 
  1.正向最大匹配法
 
  什么意思呢?就是把一个词从左至右来分词。举个例子:“不知道你在说什么”,这句话采用正向最大匹配法是如何分的呢?“不知道,你,在,说什么”与正向最大匹配法相对应的是反向最大匹配发。
 
  2.反向最大匹配法
 
  上面我举的例子是如何分的呢"不知道你在说什么"。反向最大匹配法来分上面这段是如何分的:“不,知道,你在,说,什么”,这个就分的比较多了,反向最大匹配法就是从右至左。
 
  3.就是最短路径分词法
 
  这个怎么理解呢,就是说,我一段话里面要求切出的词数是最少的。还是上面哪句话:“不知道你在说什么”最短路径分词法就是指,我把上面哪句话分成的词要是最少的。不知道,你在,说什么,这就是最短路径分词法,分出来就只有3个词了。好了,当然还有上面三种可以相互结合组成一些分词方法。比如正向最大匹配法和反向最大匹配法组合起来就可以叫做双向最大匹配法。
 
  二、词义分词法
 
  这种其实就是一种机器语音判断的分词方法。很简单,进行句法、语义分析,利用句法信息和语义信息来处理歧义现象来分词,这种分词方法,现在还不成熟。处在测试阶段。
 
  三、统计的分词法
 
  这个很简单,就是根据词组的统计,就会发现两个相邻的字出现的频率最多,那么这个词就很重要。就可以作为用户提供字符串中的分隔符。这样来分词。比如,“我的,你的,许多的,这里,这一,那里”。等等,这些词出现的比较多,就从这些词里面分开来。
 
  当然,有些字的意思在很多语境中是没有什么价值的,百度会自动过滤掉。比如说“的”、“这”、“那”。
 
  根据分词我们可以了解到,在做SEO优化的时候,我们往往可以通过优化长尾词的同时,优化核心关键词。这也就是为什么很多SEO会说,通过长尾词来带核心关键词的关键所在。
百度搜索:南京SEO,了解更多!
上一篇:百度权重 下一篇:没有了
猜你喜欢
热门排行
精彩图文