Slashdot 上有人提到 Google 最近調整的情況,繼續調降 low-quality site (這次是 eHow) 在搜尋的排名:「Google Tweaks Algorithm; EHow Traffic Plummets」。
最近用中文版的 search 發現愈來愈找不到想要的東西了,把語系切到英文版試一陣子看看...
幹壞事是進步最大的原動力
Slashdot 上有人提到 Google 最近調整的情況,繼續調降 low-quality site (這次是 eHow) 在搜尋的排名:「Google Tweaks Algorithm; EHow Traffic Plummets」。
最近用中文版的 search 發現愈來愈找不到想要的東西了,把語系切到英文版試一陣子看看...
在反垃圾郵件法案中提到的 Opt-out 是指「預設寄送,使用者可以選擇退出」,而 Opt-in 則是「預設不可以寄送,必須由使用者選擇加入」。這兩者最大的差異在於,Opt-out 後發信人就會知道這個信箱有人在看信,於是就把名單轉到境外發...
所以加拿大的法律從 Opt-out 改為 Opt-in 是很重要的進展:「Canada has An Opt-in Régime and a new Anti-spam Law」。
隔壁的美國到底要不要改呢...
參考 Slashdot 的「Wikipedia Pages Now On Amazon — With Product Links」這篇文章。
Amazon 所產生的 Wikipedia 對應頁面在這:「Main Page - Shopping-enabled Wikipedia Page on Amazon」。
依照 Wikipedia 的文章授權,是可以這樣做沒錯 (沒有禁止商業使用)。不過 Google 禁止複製別人的重複內容:「Duplicate content」。
以目前 www.amazon.com/robots.txt 的內容看起來是沒對 /wiki
設限,接下來就來看 Google 會不會認定 Amazon 試著在惡搞 SEO 而列入處罰清單...
英文版維基百科條目:「Bayesian spam filtering」。
要判斷一個詞 spam 的機率是依照貝式定理:
這之中每個項目都可以先被計算起來,再來是機率的合併:
接下來是罕見字以及其他改善精確度的處理。
其實基本的觀念並不難,當初不知道為什麼一直沒看懂...