Recent Comments
Archives
- May 2012 (8)
- April 2012 (11)
- March 2012 (10)
- February 2012 (11)
- January 2012 (5)
- December 2011 (13)
- November 2011 (12)
- October 2011 (10)
- September 2011 (7)
- August 2011 (5)
- July 2011 (11)
- June 2011 (21)
- May 2011 (22)
- April 2011 (36)
- March 2011 (43)
- February 2011 (23)
- January 2011 (24)
- December 2010 (34)
- November 2010 (19)
- October 2010 (16)
- September 2010 (15)
- August 2010 (10)
- July 2010 (12)
- June 2010 (3)
- May 2010 (3)
- April 2010 (4)
- March 2010 (8)
- February 2010 (14)
- January 2010 (13)
- December 2009 (16)
- November 2009 (28)
- October 2009 (24)
- September 2009 (12)
- August 2009 (7)
- July 2009 (10)
- June 2009 (11)
- May 2009 (22)
- April 2009 (21)
- March 2009 (18)
- February 2009 (7)
- January 2009 (32)
- December 2008 (19)
- November 2008 (12)
- October 2008 (15)
- September 2008 (14)
- August 2008 (15)
- July 2008 (18)
- June 2008 (20)
- May 2008 (19)
- April 2008 (27)
- March 2008 (22)
- February 2008 (21)
- January 2008 (15)
- December 2007 (22)
- November 2007 (17)
- October 2007 (29)
- September 2007 (31)
- August 2007 (34)
- July 2007 (31)
- June 2007 (36)
- May 2007 (23)
- April 2007 (22)
- March 2007 (30)
- February 2007 (50)
- January 2007 (75)
- December 2006 (48)
- November 2006 (59)
- October 2006 (89)
- September 2006 (29)
- August 2006 (48)
- July 2006 (14)
- June 2006 (35)
- May 2006 (62)
- April 2006 (63)
- March 2006 (72)
- February 2006 (83)
- January 2006 (56)
- December 2005 (46)
- November 2005 (60)
- October 2005 (27)
- September 2005 (54)
- August 2005 (83)
Tags
amazon android api aws bittorrent browser cdn certificate chrome cloud cloudfront cpan database dns ec2 facebook firefox freebsd google hosting html https ie image ipv6 javascript jquery js linux mobile mozilla mysql p2p performance perl php secure security ssl twitter ubuntu video web wordpress yahooCategories
- Anime (25)
- AWS (51)
- BBS (17)
- Blog (201)
- Book (18)
- Bridge (1)
- Browser (283)
- CDN (21)
- Cloud (66)
- CMS (33)
- Comic (17)
- Computer (1980)
- Computer and Network Center (32)
- CSS (31)
- Database (132)
- DNS (50)
- Editor (11)
- Financial (37)
- Firefox (149)
- Food (11)
- FreeBSD (115)
- Game (25)
- GoogleChrome (25)
- Hardware (144)
- IE (64)
- Joke (131)
- Lab (3)
- Linux (72)
- MacOS (4)
- Mail (69)
- Movie (18)
- Murmuring (2056)
- Music (37)
- MySQL (97)
- NCTU (63)
- NetBSD (7)
- Network (1486)
- OpenBSD (3)
- Opera (21)
- OS (205)
- P2P (86)
- Photo (57)
- Political (48)
- Programming (315)
- Recreation (372)
- RSS (65)
- Safari (22)
- Science (28)
- Search Engine (126)
- Security (336)
- SMS (5)
- Social (60)
- Software (1062)
- Spam (86)
- Sport (4)
- Telephone (62)
- Television (35)
- Usenet (13)
- Vim (3)
- Wiki (25)
- Windows (48)
- WWW (782)
Blogroll
Meta
Category Archives: Spam
Google 調整參數處罰 Content Farm 的進度
Slashdot 上有人提到 Google 最近調整的情況,繼續調降 low-quality site (這次是 eHow) 在搜尋的排名:「Google Tweaks Algorithm; EHow Traffic Plummets」。 最近用中文版的 search 發現愈來愈找不到想要的東西了,把語系切到英文版試一陣子看看…
加拿大的反垃圾郵件法案由 Opt-out 改成 Opt-in
在反垃圾郵件法案中提到的 Opt-out 是指「預設寄送,使用者可以選擇退出」,而 Opt-in 則是「預設不可以寄送,必須由使用者選擇加入」。這兩者最大的差異在於,Opt-out 後發信人就會知道這個信箱有人在看信,於是就把名單轉到境外發… 所以加拿大的法律從 Opt-out 改為 Opt-in 是很重要的進展:「Canada has An Opt-in Régime and a new Anti-spam Law」。 隔壁的美國到底要不要改呢…
處處有廣告!
這個 extension 真的會讓人噴飯 XDDD TechCrunch 介紹了「Jimmy Wales」這個 Google Chrome Extension:「Chrome Extension Lets You Just Add Jimmy Wales」。 Wikipedia 一直拒絕放廣告取得收入 (參考:「An appeal from Wikipedia founder Jimmy Wales」),但相當諷刺的是,每年大概這個時候都會有超煩人的橫幅廣告,請你捐錢給 Wikimedia… 我有寫一個 Greasemonkey Script 處理這個:「Wikipedia AD remover」。 這個 Extension 相當機車啊 XDDD (以下是裝上去以後的效果,取自 TechCrunch XDDD)
Bayesian spam filtering
英文版維基百科條目:「Bayesian spam filtering」。 要判斷一個詞 spam 的機率是依照貝式定理: 這之中每個項目都可以先被計算起來,再來是機率的合併: 接下來是罕見字以及其他改善精確度的處理。 其實基本的觀念並不難,當初不知道為什麼一直沒看懂…
Posted in Computer, Mail, Murmuring, Network, Programming, Spam Tagged bayesian, spam Leave a comment
Blogger 看不到刪除 comment 按鈕的問題
為了刪除 spam,在 Blogger 的後台找了老半天找不到 (動線不太順暢),用 Google 查到的說明,看起來可以在前台看到「垃圾桶的 icon」,但也看不到,最後只好自己想辦法… 我知道是 Blogger 前後台有很多東西透過 Cross-domain CSS 做,所以我就拉 Firebug 看,發現問題是出在 http://www.blogger.com/dyn-css/ 這個目錄下的回應沒有傳正確的 CSS,看了 header 有一些想法,測試幾次後,發現果然是 Referer 的問題… 解法是在 RefControl 裡面把 www.blogger.com 設成 Normal,用 Block 或是其他的設定都不會動…
Twitter Spam Report
在 Twitter 上遇到 Spam Follower,可以用 direct message 通報給 spam 這個帳號 (不過,你要先 follow 對方,而且對方反過來 follow 你),但手動回報的機制還是太麻煩。 於是有人就在 Greasemonkey 上寫了回報機制:「Twitter Spam Report for Greasemonkey」,裝好後,在每個 Twitter 頁面下面都有 “Report Spam” 的連結… Update:需要改 code,把: var twitterspam_user = $(“h2″).text().replace(/ /g,”); 改成: var twitterspam_user = $(“h2″).eq(0).text().replace(/ /g,”);
Akismet 心得
用 Akismet 一陣子了,其他的語言目前沒有遇到問題,但還蠻常漏 Russian spam 進來,找了一下發現有不少人有這個問題:「Block Russian Comment Spam In WordPress」。 解法是把 .ru 設為黑名單 (我是設成 moderated),再用人工看…
換成 Akismet
用 Spam Karma 很久了,不過最近容易漏 spam 進來,然後發現 Spam Karma GPL 以後就沒有太多進展 (最新一次 commit 是二月),決定換成 Akismet 看看效果如何。 如果誤判太嚴重,或是漏掉的比 Spam Karma 多就會換回來… 要測一陣子才知道。
在 Greasemonkey 裡破 Megaupload 的 CAPTCHA
CAPTCHA 廣泛的被用在阻擋機器人,一般是給你一張圖片,要求你輸入圖片的字。為了避免用 OCR 破解,CAPTCHA 通常會有各種變化,讓程式難以破解。 但 Megaupload 的 CAPTCHA 的變化很簡單,像這樣: 於是就有人用 Firefox + Greasemonkey,在純 JavaScript 的環境下以類神經網路破 Megaupload 的 CAPTCHA:「Megaupload auto-fill captcha」。 John Resig 甚至寫了一篇文章分析這隻 Greasemonkey script 的程式碼:「OCR and Neural Nets in JavaScript」,從利用 getImageData 取得圖片內容、轉灰階、切字、去雜訊,到最後計算 Megaupload 的 CAPTCHA… 剛好在 Slashdot 上看到「Building … Continue reading
TypePad AntiSpam
在 TechCrunch 上看到他們把本來使用 Akismet 的 Plugin 換成 TypePad 提供的 TypePad AntiSpam,然後發現效果不錯:TypePad AntiSpam, A New Open Source Comment Spam Fighter。 TypePad AntiSpam 使用的 API 與 Akismet 一樣,所以,library 本身如果有可以設定 API url 的地方,就可以直接換到 TypePad AntiSpam,像是 CPAN 的 Net-Akismet。 不過我自己還是用 Spam Karma 好了 :p
