非凡娱乐SEO專業的網站優化公司

如何理解百度的分詞技術來提升網站的非凡娱乐SEO效果?

瀏覽:/ 2017-08-28

 百度是如何来分词的呢?分词技术现今非常成熟了。

  第一:字符串匹配的分词方法
SEO57.jpg
  (1)正向最大匹配法
  就是把一個詞從左至右來分詞。
  舉個例子:”不知道你在說什么”
  這句話采用正向最大匹配法是如何分的呢?“不知道,你,在,說什么”。
  (2)反向最大匹配法
  “不知道你在說什么”反向最大匹配法來分上面這段是如何分的。“不,知道,你在,說,什么”,這個就分的比較多了,反向最大匹配法就是從右至左。
  (3)就是最短路徑分詞法。
  就是說一段話里面要求切出的詞數是最少的。
  “不知道你在說什么”最短路徑分詞法就是指,把上面那句話分成的詞要是最少的。“不知道,你在,說什么”,這就是最短路徑分詞法,分出來就只有3個詞了。
  (4)雙向最大匹配法。
  而有一種特殊的情況,就是關健詞前后組合內容被認為粘性相差不大,而搜索結果中也同時包含這兩組詞的話,百度會進行正反向同時進行分詞匹配。
  第二:詞義分詞法
  就是一種機器語音判斷的分詞方法。很簡單,進行句法、語義分析,利用句法信息和語義信息來處理歧義現象來分詞,這種分詞方法,現在還不成熟,處在測試階段
  第三:統計分詞法
  根據詞組的統計,就會發現兩個相鄰的字出現的頻率最多,那么這個詞就很重要。就可以作為用戶提供字符串中的分隔符,這樣來分詞。

閱讀"如何理解百度的分詞技術來提升網站的非凡娱乐SEO效果?"的人還閱讀

上一篇:來自一篇送給奮斗在網絡優化工作者一線的兄弟姐妹們的雞湯!

下一篇:返回列表