Tag Archives: pagerank

把 npm 的 dependency 當作 PageRank 的資料來源,分析 npm 目前的生態...

在「An Analysis of the JavaScript Package Ecosystem npm」這篇看到作者把 npm 的 dependency 當作資料來源,計算出 npm 的 PageRank: 可以看到 Underscore.js 的 PageRank 一直都維持在第一位... 這個方法頗有趣的,不知道有沒有其他語言的 :o

Posted in Computer, Murmuring, Network, Programming, Software | Tagged , , , , | 4 Comments

Google PageRank 資料將不再公開

Google 將不再對外公開 PageRank 資訊:「Google has confirmed it is removing Toolbar PageRank」與「RIP Google PageRank score: A retrospective on how it ruined the web」。 PageRank 資訊是透過 Google Toolbar 再反向被挖出來的,而 Toolbar 上的資訊將會拿掉,也預期對應的 API 應該也會關閉: Google has confirmed with Search Engine Land that it … Continue reading

Posted in Computer, Murmuring, Network, Search Engine, WWW | Tagged , , , , , | Leave a comment

Google 發表計算網頁真實性的演算法 (Knowledge-Based Trust)

Slashdot 上看到 Google 發表了計算網頁真實性的演算法,Knowledge-Based Trust (KBT):「Google Wants To Rank Websites Based On Facts Not Links」,原始的論文 PDF 檔案可以在「Knowledge-Based Trust: Estimating the Trustworthiness of Web Sources」這邊取得。 論文本身的原理不難懂 (其實方法相當有趣),主要是給出了三個貢獻。 首先是能夠區分是取出資訊的方法有問題 (extract 的演算法不夠好),或是網站本身就給出錯誤的資訊: Our main contribution is a more sophisticated probabilistic model, which can … Continue reading

Posted in Blog, CMS, Computer, Murmuring, Network, Search Engine, Spam, WWW | Tagged , , , , , , , , , , , , , | Leave a comment