Recent Comments
Archives
- February 2012 (2)
- January 2012 (5)
- December 2011 (13)
- November 2011 (12)
- October 2011 (10)
- September 2011 (7)
- August 2011 (5)
- July 2011 (11)
- June 2011 (21)
- May 2011 (22)
- April 2011 (36)
- March 2011 (43)
- February 2011 (23)
- January 2011 (24)
- December 2010 (34)
- November 2010 (19)
- October 2010 (16)
- September 2010 (15)
- August 2010 (10)
- July 2010 (12)
- June 2010 (3)
- May 2010 (3)
- April 2010 (4)
- March 2010 (8)
- February 2010 (14)
- January 2010 (13)
- December 2009 (16)
- November 2009 (28)
- October 2009 (24)
- September 2009 (12)
- August 2009 (7)
- July 2009 (10)
- June 2009 (11)
- May 2009 (22)
- April 2009 (21)
- March 2009 (18)
- February 2009 (7)
- January 2009 (32)
- December 2008 (19)
- November 2008 (12)
- October 2008 (15)
- September 2008 (14)
- August 2008 (15)
- July 2008 (18)
- June 2008 (20)
- May 2008 (19)
- April 2008 (27)
- March 2008 (22)
- February 2008 (21)
- January 2008 (15)
- December 2007 (22)
- November 2007 (17)
- October 2007 (29)
- September 2007 (31)
- August 2007 (34)
- July 2007 (31)
- June 2007 (36)
- May 2007 (23)
- April 2007 (22)
- March 2007 (30)
- February 2007 (50)
- January 2007 (75)
- December 2006 (48)
- November 2006 (59)
- October 2006 (89)
- September 2006 (29)
- August 2006 (48)
- July 2006 (14)
- June 2006 (35)
- May 2006 (62)
- April 2006 (63)
- March 2006 (72)
- February 2006 (83)
- January 2006 (56)
- December 2005 (46)
- November 2005 (60)
- October 2005 (27)
- September 2005 (54)
- August 2005 (83)
Tags
Categories
- Anime (24)
- AWS (46)
- BBS (17)
- Blog (200)
- Book (18)
- Bridge (1)
- Browser (281)
- CDN (19)
- Cloud (61)
- CMS (33)
- Comic (17)
- Computer (1945)
- Computer and Network Center (31)
- CSS (31)
- Database (129)
- DNS (49)
- Editor (11)
- Financial (37)
- Firefox (148)
- Food (10)
- FreeBSD (114)
- Game (21)
- GoogleChrome (23)
- Hardware (137)
- IE (64)
- Joke (131)
- Lab (3)
- Linux (68)
- MacOS (3)
- Mail (68)
- Movie (18)
- Murmuring (2018)
- Music (37)
- MySQL (95)
- NCTU (62)
- NetBSD (7)
- Network (1466)
- OpenBSD (3)
- Opera (21)
- OS (198)
- P2P (85)
- Photo (57)
- Political (46)
- Programming (306)
- Recreation (365)
- RSS (65)
- Safari (22)
- Science (28)
- Search Engine (126)
- Security (333)
- SMS (5)
- Social (59)
- Software (1040)
- Spam (86)
- Sport (4)
- Telephone (61)
- Television (35)
- Usenet (13)
- Vim (3)
- Wiki (25)
- Windows (46)
- WWW (775)
Blogroll
Meta
Category Archives: Spam
Google 調整參數處罰 Content Farm 的進度
Tweet Slashdot 上有人提到 Google 最近調整的情況,繼續調降 low-quality site (這次是 eHow) 在搜尋的排名:「Google Tweaks Algorithm; EHow Traffic Plummets」。 最近用中文版的 search 發現愈來愈找不到想要的東西了,把語系切到英文版試一陣子看看…
加拿大的反垃圾郵件法案由 Opt-out 改成 Opt-in
Tweet 在反垃圾郵件法案中提到的 Opt-out 是指「預設寄送,使用者可以選擇退出」,而 Opt-in 則是「預設不可以寄送,必須由使用者選擇加入」。這兩者最大的差異在於,Opt-out 後發信人就會知道這個信箱有人在看信,於是就把名單轉到境外發… 所以加拿大的法律從 Opt-out 改為 Opt-in 是很重要的進展:「Canada has An Opt-in Régime and a new Anti-spam Law」。 隔壁的美國到底要不要改呢…
處處有廣告!
Tweet 這個 extension 真的會讓人噴飯 XDDD TechCrunch 介紹了「Jimmy Wales」這個 Google Chrome Extension:「Chrome Extension Lets You Just Add Jimmy Wales」。 Wikipedia 一直拒絕放廣告取得收入 (參考:「An appeal from Wikipedia founder Jimmy Wales」),但相當諷刺的是,每年大概這個時候都會有超煩人的橫幅廣告,請你捐錢給 Wikimedia… 我有寫一個 Greasemonkey Script 處理這個:「Wikipedia AD remover」。 這個 Extension 相當機車啊 XDDD (以下是裝上去以後的效果,取自 TechCrunch … Continue reading
Bayesian spam filtering
Tweet 英文版維基百科條目:「Bayesian spam filtering」。 要判斷一個詞 spam 的機率是依照貝式定理: 這之中每個項目都可以先被計算起來,再來是機率的合併: 接下來是罕見字以及其他改善精確度的處理。 其實基本的觀念並不難,當初不知道為什麼一直沒看懂…
Posted in Computer, Mail, Murmuring, Network, Programming, Spam Tagged bayesian, spam Leave a comment
Blogger 看不到刪除 comment 按鈕的問題
Tweet 為了刪除 spam,在 Blogger 的後台找了老半天找不到 (動線不太順暢),用 Google 查到的說明,看起來可以在前台看到「垃圾桶的 icon」,但也看不到,最後只好自己想辦法… 我知道是 Blogger 前後台有很多東西透過 Cross-domain CSS 做,所以我就拉 Firebug 看,發現問題是出在 http://www.blogger.com/dyn-css/ 這個目錄下的回應沒有傳正確的 CSS,看了 header 有一些想法,測試幾次後,發現果然是 Referer 的問題… 解法是在 RefControl 裡面把 www.blogger.com 設成 Normal,用 Block 或是其他的設定都不會動…
Twitter Spam Report
Tweet 在 Twitter 上遇到 Spam Follower,可以用 direct message 通報給 spam 這個帳號 (不過,你要先 follow 對方,而且對方反過來 follow 你),但手動回報的機制還是太麻煩。 於是有人就在 Greasemonkey 上寫了回報機制:「Twitter Spam Report for Greasemonkey」,裝好後,在每個 Twitter 頁面下面都有 “Report Spam” 的連結… Update:需要改 code,把: var twitterspam_user = $(“h2″).text().replace(/ /g,”); 改成: var twitterspam_user = $(“h2″).eq(0).text().replace(/ … Continue reading
Akismet 心得
Tweet 用 Akismet 一陣子了,其他的語言目前沒有遇到問題,但還蠻常漏 Russian spam 進來,找了一下發現有不少人有這個問題:「Block Russian Comment Spam In WordPress」。 解法是把 .ru 設為黑名單 (我是設成 moderated),再用人工看…
換成 Akismet
Tweet 用 Spam Karma 很久了,不過最近容易漏 spam 進來,然後發現 Spam Karma GPL 以後就沒有太多進展 (最新一次 commit 是二月),決定換成 Akismet 看看效果如何。 如果誤判太嚴重,或是漏掉的比 Spam Karma 多就會換回來… 要測一陣子才知道。
在 Greasemonkey 裡破 Megaupload 的 CAPTCHA
Tweet CAPTCHA 廣泛的被用在阻擋機器人,一般是給你一張圖片,要求你輸入圖片的字。為了避免用 OCR 破解,CAPTCHA 通常會有各種變化,讓程式難以破解。 但 Megaupload 的 CAPTCHA 的變化很簡單,像這樣: 於是就有人用 Firefox + Greasemonkey,在純 JavaScript 的環境下以類神經網路破 Megaupload 的 CAPTCHA:「Megaupload auto-fill captcha」。 John Resig 甚至寫了一篇文章分析這隻 Greasemonkey script 的程式碼:「OCR and Neural Nets in JavaScript」,從利用 getImageData 取得圖片內容、轉灰階、切字、去雜訊,到最後計算 Megaupload 的 CAPTCHA… 剛好在 Slashdot … Continue reading
TypePad AntiSpam
Tweet 在 TechCrunch 上看到他們把本來使用 Akismet 的 Plugin 換成 TypePad 提供的 TypePad AntiSpam,然後發現效果不錯:TypePad AntiSpam, A New Open Source Comment Spam Fighter。 TypePad AntiSpam 使用的 API 與 Akismet 一樣,所以,library 本身如果有可以設定 API url 的地方,就可以直接換到 TypePad AntiSpam,像是 CPAN 的 Net-Akismet。 不過我自己還是用 Spam Karma 好了 … Continue reading
