用 Spam Karma 很久了,不過最近容易漏 spam 進來,然後發現 Spam Karma GPL 以後就沒有太多進展 (最新一次 commit 是二月),決定換成 Akismet 看看效果如何。
如果誤判太嚴重,或是漏掉的比 Spam Karma 多就會換回來... 要測一陣子才知道。
幹壞事是進步最大的原動力
用 Spam Karma 很久了,不過最近容易漏 spam 進來,然後發現 Spam Karma GPL 以後就沒有太多進展 (最新一次 commit 是二月),決定換成 Akismet 看看效果如何。
如果誤判太嚴重,或是漏掉的比 Spam Karma 多就會換回來... 要測一陣子才知道。
CAPTCHA 廣泛的被用在阻擋機器人,一般是給你一張圖片,要求你輸入圖片的字。為了避免用 OCR 破解,CAPTCHA 通常會有各種變化,讓程式難以破解。
但 Megaupload 的 CAPTCHA 的變化很簡單,像這樣:
於是就有人用 Firefox + Greasemonkey,在純 JavaScript 的環境下以類神經網路破 Megaupload 的 CAPTCHA:「Megaupload auto-fill captcha」。
John Resig 甚至寫了一篇文章分析這隻 Greasemonkey script 的程式碼:「OCR and Neural Nets in JavaScript」,從利用 getImageData
取得圖片內容、轉灰階、切字、去雜訊,到最後計算 Megaupload 的 CAPTCHA...
剛好在 Slashdot 上看到「Building a Better CAPTCHA」也在討論用 CAPTCHA 是否能解決問題。(comment 才是重點)
在 TechCrunch 上看到他們把本來使用 Akismet 的 Plugin 換成 TypePad 提供的 TypePad AntiSpam,然後發現效果不錯:TypePad AntiSpam, A New Open Source Comment Spam Fighter。
TypePad AntiSpam 使用的 API 與 Akismet 一樣,所以,library 本身如果有可以設定 API url 的地方,就可以直接換到 TypePad AntiSpam,像是 CPAN 的 Net-Akismet。
不過我自己還是用 Spam Karma 好了 :p
都是小圖,看不清楚的可以點回 Flickr 的頁面看到大圖。
我不曉得依照這個規則是怎麼算出比彎彎還要高分:(原出處:部落格觀察貼紙各式說明)
下面這張是依照「Page 總分」排序,彎彎在第九名,第七名是 Gene,第八名是 Wildcat,第十三名是 askareiko,剛好是部落格觀察的「GAW」,這個「排行榜」的公信力大家自己心中應該有數。
因為:
國立X山大學 計算機與網路中心 書函
受文者:如正本
發文日期:中華民國96年10月31日
發文字號:中096電字第032號
速別:
密等及解密條件:
附件:
主旨:本中心為杜絕色情廣告氾濫之問題,即日起停止NEWS伺服器轉信服務,不便之處,敬請見諒。
說明:教育部部長民意信箱接獲民眾檢舉,本校之提供之轉信服務,郵件內容大部分為色情廣告,為杜絕色情廣告氾濫問題,故自即日起停止NEWS伺服器轉信服務。
轉自「鴕鳥心態」這篇。我看 Group.NCTU.edu.tw 也應該打包放到非 TANet 的獨立主機好了...
如果天天寫信去部長信箱抱怨信箱裡有太多色情廣告,學校會不會關閉郵件伺服器...
Slashdot 上報導了垃圾郵件的比例創下歷史高點,已經到總量的 95%,其中圖片類的垃圾郵件已經被 PDF 及 Excel 垃圾夾檔取代。
有不少 spam 是將使用者導到有惡意軟體的網站上,以這些網站的所在位置分別的話,美國 36%,俄羅斯 8%,阿根廷與南韓都是 5%,波蘭與英國 4%,印度與丹麥 3%,法國 2%。但如果以 PDF spam 計算的話,美國 24%,台灣 14%,中國 10%,俄羅斯 4%...
自己維護電子郵件的服務愈來愈難做了,還是先靠 Gmail 撐吧...
前陣子才從蔡依林姊姊那邊看到 Remove It Permanently (不過我沒有用,因為要自己設定太麻煩了),結果這幾天就發現 Adblock Plus 可以擋頁面元素,而且 EasyList (某個可以訂閱的 Adblock Plus 清單) 這陣子也開始用這個方式列清單了...
這是 Y! TW 的首頁,被清的乾乾淨淨的,看起來真愉快啊 XD:
這是某大站:
Update:有人翻譯出來了,SEO專業術語剖析:你真的看得懂SEO術語嗎?。
對於搞 SEO (Search Engine Optimization,搜尋引擎最佳化) 業者的謊言,在這邊看到一張表格,將這些謊言對應到事實,寫的超棒啊 XD:SEO Speak Translated: The Real SEO Glossary。
也許應該找個時間翻出來...
美國 (德州) 發生 ISP 在 Transparent Proxy 上插入 Javascript 放廣告的事情 (也就是右方的圖片):ISPs Inserting Ads Into Your Pages (Slashdot)、Real Evil: ISP Inserted Advertising (TechCrunch)。
這已經引起非常強烈的討論了 (Slashdot 以及 TechCrunch 的 comment),來觀察後續情況...
連 Spam Karma 都出語言包了:SK2 in Your Language。
有看到繁體中文的檔案,有需要的人 (像是幫別人裝 WordPress 的人?) 可以套上去用...