Spam – Page 12 – Gea-Suan Lin's BLOG

Technorati 的 Popular Blogs

我在 Technorati 的 Popular Blogs 與 Spam 的關係有提過 blog.yam.com 在 Technorati 的 Popular Blogs 排名第三的事情。

今天再去看的時候，發現 blog.yam.com 已經不在上面了，無名小站還是在 6x 名左右。

So...

Technorati 的 Popular Blogs 與 Spam 的關係

在 Schee 那邊的內引外流這篇文章裡看到 blog.yam.com 在 Technorati 的 Popular Blogs 已經排到第三名的消息，而且快要超越 Boing Boing。

不過，我要用 Google 丟出幾個數據，比較一下無名小站 Blog 與 blog.yam.com 受到 Spam 的情況。

msi 的部分：

msi site:blog.yam.com：991 項。
msi site:www.wretch.cc：213 項。

qstr 的部分：

qstr site:blog.yam.com：641 項。
qstr site:www.wretch.cc：29 項。

這些 Spammer 會到處到其他地方 (各種留言板、討論區、blah blah) 到處貼 link，於是就會有大量來自不同站台的的 Inbound Link。查詢出來的結果發現，Yam 的 Blog 比別人少，但是 Spam 比別人多。

除了 Spam 以外，還有 blog.roodo.com 與 blog.yam.com 的 Redirect 關係，以及各種串連活動 (貼貼紙活動) 造成有不同站台的 Inbound Link。(誰看過 Boing Boing 整天沒事搞串連的？)

比起 Boing Boing，在「量」的方面，也許不久後會超越過去 (我指的是 Technorati Popular Blogs)，但「質」到底怎麼樣，自己想一想會比較清楚。

瘋狂 spam 的 msi-team 與 qstr

剛剛突然興起，想看看還有沒有其他人被 msi-team 與 qstr 這兩個詐騙集團打到，果然馬上就找到了：

其實要找到幹剿文也不好找，因為用 Google 找都是 Spam XD

另外我一直有種感覺，msi-team 與 qstr 這兩個團體背後是同一組人，因為手法、技術都很像。不知道什麼時候會被揭穿...

WordPress.com 開放申請

Matt 在他的 Blog 上說他們決定開放 WordPress.com 給所有人申請：WordPress.com Open。

目前 WordPress.com 雖然是用 WordPress-mu，但可以看出來目前跟的很緊，幾乎所有的 Beta code 都有上去。而且目前穩定性看起來也還可以，不過如果完全開放後不知道會怎樣 :p

不過，可以預期的是上面會有大量的 Spam Blogs 寄生... (Spam Blogs 可以參考 Wikipedia 對於 Splog 的說明)

WordPress 2.0 Beta 1 - Akismet

WordPress 2.0 Beta 1 引入了 Akismet，一個 Antispam Service，這個 Service 需要一個 WordPress.com API key，我剛好有，所以我就裝起來測試看看。不過，即使測試了以後發現效果很好，我還是會換回 Spam Karma 2。

主要的原因在於 Akismet 送出太多資訊了，$_SERVER 所有的東西都會送出去，這包括了 Cookie (Exactly What Data Are You Sending to Akismet?)。當然也就有人跑去 WordPress Support 上質疑 (askimet, wordpress, and cookies)。

另外要補充的一點是，Akismet 是封閉式架構，你不知道這個黑盒子裡面到底再跑什麼... 即使再有效，我也不會想用，如同 Nopam 一樣。

Update：鳥蛋一個，所有的 ping 與 trackback 都被 block，換回 Spam Karma。

bogofilter

看到 clsung 這篇 bogofilter 亂談才發現我好像欠某長輩 bogofilter document 很久了 :p 查了一下，我是從六月中的時候開始用 bogofilter，七月中的時候把 KKcity 的 Mail System 也加上 bogofilter 過濾。

我是裝 mail/bogofilter-qdbm，因為 mail/bogofilter-sqlite 只要 wordlist 超過 1xMB 就會寫不進去，不知道為什麼 :p 而且 qdbm 的速度很快 (只比 cdb 慢：Report of Benchmark Test)，所以就用 bogofilter-qdbm 吧 :p

在 .procmailrc 裡面設定：

# bogofilter :0fw | /usr/local/bin/bogofilter -e -p -l

.muttrc 裡面設定：

macro index X "<pipe-entry>formail -s bogofilter -s\n<delete-message<" "mark as spam" macro index Z "<pipe-entry>formail -s bogofilter -n\n" "mark as non-spam"

配合 postfix 過濾時 master.cf 的部分內容：

smtp inet n - n - - smtpd -o content_filter=bogofilter: bogofilter unix - n n - - pipe flags=FR user=nobody:mail argv=/usr/local/sbin/bogofilter.sh -f ${sender} -- ${recipient}

其中 /usr/local/sbin/bogofilter.sh 是從網路上抄來的，長這樣：

#!/bin/sh /bin/rm /tmp/bogofilter-now echo $$ > /tmp/bogofilter-now CAT=/bin/cat FILTER=/usr/local/bin/bogofilter FILTER_DIR=/var/spool/bogofilter SENDMAIL="/usr/sbin/sendmail -i" # Exit codes from <sysexits.h> EX_TEMPFAIL=75 EX_UNAVAILABLE=69 cd $FILTER_DIR || { echo $FILTER_DIR does not exist; exit $EX_TEMPFAIL; } # Clean up when done or when aborting. trap "rm -f msg.$$" 0 1 2 3 15 # bogofilter returns: 0 for spam; 1 for non-spam; 2 for I/O or other errors. $CAT | $FILTER -d $FILTER_DIR -p -e > msg.$$ $SENDMAIL "$@" < msg.$$

其中 /var/spool/bogofilter 裡必須有 wordlist.qdbm。

詳細的說明晚點再寫。

另外提供我自己的 wordlist.qdbm 讓大家用好了，如果不想自己花兩三天 train 的話：http://files.gslin.org/bogofilter/wordlist.qdbm。

Adblock

這陣子發現 Firefox 看 Wikipedia 的圖片老是出不來，按 Reload 按半天也沒用，本來一直以為是 1.5 Beta 1 的關係，可是到了 Beta 2 還是一樣，我就在想是不是我的問題... 只是想半天也想不出來。

剛剛突然想到是不是在 Adblock 裡不小心設的太寬，於是誤擋了 Wikipedia 的圖片，結果發現某些圖片被擋，像是 Nineteen Eighty-Four 這條裡右邊的圖，因為 url 是：

http://upload.wikimedia.org/wikipedia/en/thumb/e/e9/...

而我擋：

ad.*

okay，找到原因了，是因為 upload.wikimedia.org 炸了 :p 改成 http://ad.* 果然就正常了 XD

信任問題：Yahoo!

Slashdot 上的文章：Is Yahoo Actively Supporting Adware?。

這是一家與 Google 完全不同的哲學：Do no evil，從 Flickr 必須申請 Yahoo! 帳號的事件也可以看的出來。

btw，comment 很有趣，可以看一看。

Spam Prevention

Matt 最近想要發展一種 spam prevention method 取代現有的 Plugins，我猜他應該是想直接牽在 WordPress 裡面：Stop Spam Better。

不過我很好奇的是，目前做得比較好的 Spam Prevention 幾乎是雞尾酒式的方法在抓，WordPress 真的做得過人家嗎 :p

ouiouioui 的 tag spam

我前幾天有講到現有 ouiouioui 模式的不可行性：現有「ouiouioui 共筆書籤」的不可行性，而且我們也可以看到 tag spam 不斷的發生：以道德為最後防線的系統，是擋不住 spammer 的攻擊的。

舉例來說，今天又看到有人在賣瓜了：

道德絕對不能是最後的防線，而應該是輔佐的工具。

舉個例子來說，你不覺得上街頭抗議、或是在 blog 上抱怨 mail spam 很多，「請 Spammer 不要再送」這種事情很鳥嗎？那相反過來，你為什麼要以道德標準來「勸導」Spammer？

tag spammer 一定會愈來愈多，ouiouioui 如果要繼續下去，真正應該要作為最後的防線應該是以技術為底：不論是以評分系統來作為是否刊登的標準，或是以該篇文章被多位 del.icio.us 或 furl 收錄作為標準。

所以我對於 Reder 在 comment 提到的說法不以為然：

我剛剛回頭看了一下Oui-News的網站上都沒有一個聯結是連到當初quawn在Oui-Blog所張貼的那篇文章。而又再次觀察了一下會推薦的人，大致上就是那幾位前輩。我想這個計畫有繼續推展的必要，而不是因為一兩位spammer就宣告實驗失敗。況且有像gslin這樣的前輩會注意到spam的現象。XD