搜索引擎的TF-IDF分詞算法讓排名加速前進

2019-10-21 來源:搜到網
{literal}{/literal}

搜索引擎的TF-IDF分詞算法讓排名加速前進

我們日常做SEO排名是基于搜索引擎來講的,谷歌SEO和百度SEO是不同的,但是搜索原理是基于TF-IDF分詞原理,下面云無限小編為您介紹一下

搜索引擎的TF-IDF分詞算法讓排名加速前進

圖片來自于網絡,侵刪

什么是TF-IDF分詞
TF-IDF被稱為詞頻-逆向文件頻率,它用于信息檢索與文本挖掘的常用加權技術。用以評估一字詞對于一個文件集或一個語料庫中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時會隨著它在語料庫中出現(xiàn)的頻率成反比下降(類似我們經常說的密度)。
*TF:詞頻
關鍵詞在文本中出現(xiàn)的頻率。
*IDF:逆向文件頻率

逆向文件頻率 (IDF) :某一特定詞語的IDF,可以由總文件數(shù)目除以包含該詞語的文件的數(shù)目,再將得到的商取對數(shù)得到。如果包含詞條t的文檔越少, IDF越大,則說明詞條具有很好的類別區(qū)分能力。

為什么說SEO基于TF-IDF?

不難發(fā)現(xiàn),TF-IDF基于頁面的重要性以及內容的廣度相關性,所以說,我們一味的堆某個關鍵詞密度這種黑帽做法已經不可取了,我們接下來網站的SEO要怎么做才好呢?做相關產品的長尾詞!

如果說一個網站能出現(xiàn)排名是100%的話,TF-IDF占40%,用戶體驗占40%,外鏈和友鏈占20%合起來一共100%,那么TF-IDF則尤為重要。

做更快速的SEO排名選擇云無限!