Category Archives: Spam

Google 調整參數處罰 Content Farm 的進度

Tweet Slashdot 上有人提到 Google 最近調整的情況,繼續調降 low-quality site (這次是 eHow) 在搜尋的排名:「Google Tweaks Algorithm; EHow Traffic Plummets」。 最近用中文版的 search 發現愈來愈找不到想要的東西了,把語系切到英文版試一陣子看看…

Posted in Computer, Murmuring, Network, Search Engine, Spam, WWW | Tagged , , , , , | Leave a comment

加拿大的反垃圾郵件法案由 Opt-out 改成 Opt-in

Tweet 在反垃圾郵件法案中提到的 Opt-out 是指「預設寄送,使用者可以選擇退出」,而 Opt-in 則是「預設不可以寄送,必須由使用者選擇加入」。這兩者最大的差異在於,Opt-out 後發信人就會知道這個信箱有人在看信,於是就把名單轉到境外發… 所以加拿大的法律從 Opt-out 改為 Opt-in 是很重要的進展:「Canada has An Opt-in Régime and a new Anti-spam Law」。 隔壁的美國到底要不要改呢…

Posted in Computer, Mail, Murmuring, Network, Political, Spam | Tagged , , , | 1 Comment

處處有廣告!

Tweet 這個 extension 真的會讓人噴飯 XDDD TechCrunch 介紹了「Jimmy Wales」這個 Google Chrome Extension:「Chrome Extension Lets You Just Add Jimmy Wales」。 Wikipedia 一直拒絕放廣告取得收入 (參考:「An appeal from Wikipedia founder Jimmy Wales」),但相當諷刺的是,每年大概這個時候都會有超煩人的橫幅廣告,請你捐錢給 Wikimedia… 我有寫一個 Greasemonkey Script 處理這個:「Wikipedia AD remover」。 這個 Extension 相當機車啊 XDDD (以下是裝上去以後的效果,取自 TechCrunch … Continue reading

Posted in Browser, Computer, GoogleChrome, Murmuring, Network, Software, Spam | Tagged , , , , , , | 2 Comments

Bayesian spam filtering

Tweet 英文版維基百科條目:「Bayesian spam filtering」。 要判斷一個詞 spam 的機率是依照貝式定理: 這之中每個項目都可以先被計算起來,再來是機率的合併: 接下來是罕見字以及其他改善精確度的處理。 其實基本的觀念並不難,當初不知道為什麼一直沒看懂…

Posted in Computer, Mail, Murmuring, Network, Programming, Spam | Tagged , | Leave a comment

Blogger 看不到刪除 comment 按鈕的問題

Tweet 為了刪除 spam,在 Blogger 的後台找了老半天找不到 (動線不太順暢),用 Google 查到的說明,看起來可以在前台看到「垃圾桶的 icon」,但也看不到,最後只好自己想辦法… 我知道是 Blogger 前後台有很多東西透過 Cross-domain CSS 做,所以我就拉 Firebug 看,發現問題是出在 http://www.blogger.com/dyn-css/ 這個目錄下的回應沒有傳正確的 CSS,看了 header 有一些想法,測試幾次後,發現果然是 Referer 的問題… 解法是在 RefControl 裡面把 www.blogger.com 設成 Normal,用 Block 或是其他的設定都不會動…

Posted in Blog, Computer, Murmuring, Network, Security, Spam, WWW | Leave a comment

Twitter Spam Report

Tweet 在 Twitter 上遇到 Spam Follower,可以用 direct message 通報給 spam 這個帳號 (不過,你要先 follow 對方,而且對方反過來 follow 你),但手動回報的機制還是太麻煩。 於是有人就在 Greasemonkey 上寫了回報機制:「Twitter Spam Report for Greasemonkey」,裝好後,在每個 Twitter 頁面下面都有 “Report Spam” 的連結… Update:需要改 code,把: var twitterspam_user = $(“h2″).text().replace(/ /g,”); 改成: var twitterspam_user = $(“h2″).eq(0).text().replace(/ … Continue reading

Posted in Browser, Computer, Firefox, Murmuring, Network, Software, Spam, WWW | Leave a comment

Akismet 心得

Tweet 用 Akismet 一陣子了,其他的語言目前沒有遇到問題,但還蠻常漏 Russian spam 進來,找了一下發現有不少人有這個問題:「Block Russian Comment Spam In WordPress」。 解法是把 .ru 設為黑名單 (我是設成 moderated),再用人工看…

Posted in Blog, Computer, Murmuring, Network, Software, Spam, WWW | Leave a comment

換成 Akismet

Tweet 用 Spam Karma 很久了,不過最近容易漏 spam 進來,然後發現 Spam Karma GPL 以後就沒有太多進展 (最新一次 commit 是二月),決定換成 Akismet 看看效果如何。 如果誤判太嚴重,或是漏掉的比 Spam Karma 多就會換回來… 要測一陣子才知道。

Posted in Blog, Computer, Murmuring, Network, Software, Spam, WWW | Leave a comment

在 Greasemonkey 裡破 Megaupload 的 CAPTCHA

Tweet CAPTCHA 廣泛的被用在阻擋機器人,一般是給你一張圖片,要求你輸入圖片的字。為了避免用 OCR 破解,CAPTCHA 通常會有各種變化,讓程式難以破解。 但 Megaupload 的 CAPTCHA 的變化很簡單,像這樣: 於是就有人用 Firefox + Greasemonkey,在純 JavaScript 的環境下以類神經網路破 Megaupload 的 CAPTCHA:「Megaupload auto-fill captcha」。 John Resig 甚至寫了一篇文章分析這隻 Greasemonkey script 的程式碼:「OCR and Neural Nets in JavaScript」,從利用 getImageData 取得圖片內容、轉灰階、切字、去雜訊,到最後計算 Megaupload 的 CAPTCHA… 剛好在 Slashdot … Continue reading

Posted in Browser, Computer, Firefox, Murmuring, Network, Programming, Security, Software, Spam, WWW | Leave a comment

TypePad AntiSpam

Tweet 在 TechCrunch 上看到他們把本來使用 Akismet 的 Plugin 換成 TypePad 提供的 TypePad AntiSpam,然後發現效果不錯:TypePad AntiSpam, A New Open Source Comment Spam Fighter。 TypePad AntiSpam 使用的 API 與 Akismet 一樣,所以,library 本身如果有可以設定 API url 的地方,就可以直接換到 TypePad AntiSpam,像是 CPAN 的 Net-Akismet。 不過我自己還是用 Spam Karma 好了 … Continue reading

Posted in Blog, Computer, Murmuring, Network, Spam | Leave a comment