Recent Comments
Archives
- May 2013 (16)
- April 2013 (28)
- March 2013 (37)
- February 2013 (36)
- January 2013 (57)
- December 2012 (44)
- November 2012 (10)
- October 2012 (12)
- September 2012 (21)
- August 2012 (21)
- July 2012 (25)
- June 2012 (8)
- May 2012 (10)
- April 2012 (11)
- March 2012 (10)
- February 2012 (11)
- January 2012 (5)
- December 2011 (13)
- November 2011 (12)
- October 2011 (10)
- September 2011 (7)
- August 2011 (5)
- July 2011 (11)
- June 2011 (21)
- May 2011 (22)
- April 2011 (36)
- March 2011 (43)
- February 2011 (23)
- January 2011 (24)
- December 2010 (34)
- November 2010 (19)
- October 2010 (16)
- September 2010 (15)
- August 2010 (10)
- July 2010 (12)
- June 2010 (3)
- May 2010 (3)
- April 2010 (4)
- March 2010 (8)
- February 2010 (14)
- January 2010 (13)
- December 2009 (16)
- November 2009 (28)
- October 2009 (24)
- September 2009 (12)
- August 2009 (7)
- July 2009 (10)
- June 2009 (11)
- May 2009 (22)
- April 2009 (21)
- March 2009 (18)
- February 2009 (7)
- January 2009 (32)
- December 2008 (19)
- November 2008 (12)
- October 2008 (15)
- September 2008 (14)
- August 2008 (15)
- July 2008 (18)
- June 2008 (20)
- May 2008 (19)
- April 2008 (27)
- March 2008 (22)
- February 2008 (21)
- January 2008 (15)
- December 2007 (22)
- November 2007 (17)
- October 2007 (29)
- September 2007 (31)
- August 2007 (34)
- July 2007 (31)
- June 2007 (36)
- May 2007 (23)
- April 2007 (22)
- March 2007 (30)
- February 2007 (50)
- January 2007 (75)
- December 2006 (48)
- November 2006 (59)
- October 2006 (89)
- September 2006 (29)
- August 2006 (48)
- July 2006 (14)
- June 2006 (35)
- May 2006 (62)
- April 2006 (63)
- March 2006 (72)
- February 2006 (83)
- January 2006 (56)
- December 2005 (46)
- November 2005 (60)
- October 2005 (27)
- September 2005 (54)
- August 2005 (83)
Tags
Categories
- Anime (25)
- AWS (79)
- BBS (18)
- Blog (215)
- Book (22)
- Bridge (1)
- Browser (312)
- CDN (36)
- Cloud (101)
- CMS (37)
- Comic (17)
- Computer (2281)
- Computer and Network Center (32)
- CSS (37)
- Database (191)
- DNS (59)
- Editor (13)
- Financial (41)
- Firefox (157)
- Food (11)
- FreeBSD (127)
- FTP (1)
- Game (31)
- GoogleChrome (40)
- Hardware (187)
- IE (73)
- Joke (143)
- Lab (3)
- Linux (90)
- MacOS (8)
- Mail (73)
- MariaDB (3)
- Movie (20)
- Murmuring (2369)
- Music (38)
- MySQL (144)
- NCTU (63)
- NetBSD (7)
- Network (1691)
- OpenBSD (3)
- Opera (24)
- OS (239)
- P2P (87)
- Photo (59)
- Political (58)
- PostgreSQL (7)
- Programming (368)
- Recreation (407)
- RSS (68)
- Safari (26)
- Science (33)
- Search Engine (131)
- Security (386)
- SMS (7)
- Social (67)
- Software (1244)
- Spam (87)
- Sport (7)
- Telephone (69)
- Television (39)
- Usenet (13)
- Vim (5)
- VPN (1)
- Wiki (29)
- Windows (50)
- WWW (876)
Blogroll
Meta
Category Archives: Spam
AWS SES 支援 DKIM
DKIM 全名 DomainKeys Identified Mail,是透過數位簽名技術確保 E-mail 的寄件人不是被偽造的,對於防止透過電子郵件網路釣魚是個還蠻有效的技術。 本來透過 AWS SES 寄信,要自己處理 DKIM 簽名的部份,不過今天 AWS 宣佈這項功能內建進 AWS SES:「Simple Email Service – Easy DomainKeys Identified Mail (DKIM) Support」。 於是,現在用 AWS SES 的人要 DKIM 只要把 SES 提供的 DNS record 設上去就可以了,比起之前自己得在 Sendmail 或是 Postfix … Continue reading
Google 調整參數處罰 Content Farm 的進度
Slashdot 上有人提到 Google 最近調整的情況,繼續調降 low-quality site (這次是 eHow) 在搜尋的排名:「Google Tweaks Algorithm; EHow Traffic Plummets」。 最近用中文版的 search 發現愈來愈找不到想要的東西了,把語系切到英文版試一陣子看看…
加拿大的反垃圾郵件法案由 Opt-out 改成 Opt-in
在反垃圾郵件法案中提到的 Opt-out 是指「預設寄送,使用者可以選擇退出」,而 Opt-in 則是「預設不可以寄送,必須由使用者選擇加入」。這兩者最大的差異在於,Opt-out 後發信人就會知道這個信箱有人在看信,於是就把名單轉到境外發… 所以加拿大的法律從 Opt-out 改為 Opt-in 是很重要的進展:「Canada has An Opt-in Régime and a new Anti-spam Law」。 隔壁的美國到底要不要改呢…
處處有廣告!
這個 extension 真的會讓人噴飯 XDDD TechCrunch 介紹了「Jimmy Wales」這個 Google Chrome Extension:「Chrome Extension Lets You Just Add Jimmy Wales」。 Wikipedia 一直拒絕放廣告取得收入 (參考:「An appeal from Wikipedia founder Jimmy Wales」),但相當諷刺的是,每年大概這個時候都會有超煩人的橫幅廣告,請你捐錢給 Wikimedia… 我有寫一個 Greasemonkey Script 處理這個:「Wikipedia AD remover」。 這個 Extension 相當機車啊 XDDD (以下是裝上去以後的效果,取自 TechCrunch XDDD)
Bayesian spam filtering
英文版維基百科條目:「Bayesian spam filtering」。 要判斷一個詞 spam 的機率是依照貝式定理: 這之中每個項目都可以先被計算起來,再來是機率的合併: 接下來是罕見字以及其他改善精確度的處理。 其實基本的觀念並不難,當初不知道為什麼一直沒看懂…
Posted in Computer, Mail, Murmuring, Network, Programming, Spam
Tagged bayesian, spam
Leave a comment
Blogger 看不到刪除 comment 按鈕的問題
為了刪除 spam,在 Blogger 的後台找了老半天找不到 (動線不太順暢),用 Google 查到的說明,看起來可以在前台看到「垃圾桶的 icon」,但也看不到,最後只好自己想辦法… 我知道是 Blogger 前後台有很多東西透過 Cross-domain CSS 做,所以我就拉 Firebug 看,發現問題是出在 http://www.blogger.com/dyn-css/ 這個目錄下的回應沒有傳正確的 CSS,看了 header 有一些想法,測試幾次後,發現果然是 Referer 的問題… 解法是在 RefControl 裡面把 www.blogger.com 設成 Normal,用 Block 或是其他的設定都不會動…
Twitter Spam Report
在 Twitter 上遇到 Spam Follower,可以用 direct message 通報給 spam 這個帳號 (不過,你要先 follow 對方,而且對方反過來 follow 你),但手動回報的機制還是太麻煩。 於是有人就在 Greasemonkey 上寫了回報機制:「Twitter Spam Report for Greasemonkey」,裝好後,在每個 Twitter 頁面下面都有 “Report Spam” 的連結… Update:需要改 code,把: var twitterspam_user = $(“h2″).text().replace(/ /g,”); 改成: var twitterspam_user = $(“h2″).eq(0).text().replace(/ /g,”);
Akismet 心得
用 Akismet 一陣子了,其他的語言目前沒有遇到問題,但還蠻常漏 Russian spam 進來,找了一下發現有不少人有這個問題:「Block Russian Comment Spam In WordPress」。 解法是把 .ru 設為黑名單 (我是設成 moderated),再用人工看…
換成 Akismet
用 Spam Karma 很久了,不過最近容易漏 spam 進來,然後發現 Spam Karma GPL 以後就沒有太多進展 (最新一次 commit 是二月),決定換成 Akismet 看看效果如何。 如果誤判太嚴重,或是漏掉的比 Spam Karma 多就會換回來… 要測一陣子才知道。
在 Greasemonkey 裡破 Megaupload 的 CAPTCHA
CAPTCHA 廣泛的被用在阻擋機器人,一般是給你一張圖片,要求你輸入圖片的字。為了避免用 OCR 破解,CAPTCHA 通常會有各種變化,讓程式難以破解。 但 Megaupload 的 CAPTCHA 的變化很簡單,像這樣: 於是就有人用 Firefox + Greasemonkey,在純 JavaScript 的環境下以類神經網路破 Megaupload 的 CAPTCHA:「Megaupload auto-fill captcha」。 John Resig 甚至寫了一篇文章分析這隻 Greasemonkey script 的程式碼:「OCR and Neural Nets in JavaScript」,從利用 getImageData 取得圖片內容、轉灰階、切字、去雜訊,到最後計算 Megaupload 的 CAPTCHA… 剛好在 Slashdot 上看到「Building … Continue reading