How Spammers Can Abuse Google Pages 講到了一個問題:由於 Google Pages 是使用 username 當作 domain 的一部份,所以以後 Spammer 可以用 site:pagetastic.com | site:googlepages.com
當作搜尋的條件,然後得到 e-mail 的部分...
現在用這個條件搜尋已經可以得到一些資料了,過個幾個禮拜後應該會更明顯...
幹壞事是進步最大的原動力
How Spammers Can Abuse Google Pages 講到了一個問題:由於 Google Pages 是使用 username 當作 domain 的一部份,所以以後 Spammer 可以用 site:pagetastic.com | site:googlepages.com
當作搜尋的條件,然後得到 e-mail 的部分...
現在用這個條件搜尋已經可以得到一些資料了,過個幾個禮拜後應該會更明顯...
我在 Technorati 的 Popular Blogs 與 Spam 的關係 有提過 blog.yam.com 在 Technorati 的 Popular Blogs 排名第三的事情。
今天再去看的時候,發現 blog.yam.com 已經不在上面了,無名小站 還是在 6x 名左右。
So...
在 Schee 那邊的 內引外流 這篇文章裡看到 blog.yam.com 在 Technorati 的 Popular Blogs 已經排到第三名的消息,而且快要超越 Boing Boing。
不過,我要用 Google 丟出幾個數據,比較一下 無名小站 Blog 與 blog.yam.com 受到 Spam 的情況。
msi 的部分:
qstr 的部分:
這些 Spammer 會到處到其他地方 (各種留言板、討論區、blah blah) 到處貼 link,於是就會有大量來自不同站台的的 Inbound Link。查詢出來的結果發現,Yam 的 Blog 比別人少,但是 Spam 比別人多。
除了 Spam 以外,還有 blog.roodo.com 與 blog.yam.com 的 Redirect 關係,以及各種串連活動 (貼貼紙活動) 造成有不同站台的 Inbound Link。(誰看過 Boing Boing 整天沒事搞串連的?)
比起 Boing Boing,在「量」的方面,也許不久後會超越過去 (我指的是 Technorati Popular Blogs),但「質」到底怎麼樣,自己想一想會比較清楚。
Matt 在他的 Blog 上說他們決定開放 WordPress.com 給所有人申請:WordPress.com Open。
目前 WordPress.com 雖然是用 WordPress-mu,但可以看出來目前跟的很緊,幾乎所有的 Beta code 都有上去。而且目前穩定性看起來也還可以,不過如果完全開放後不知道會怎樣 :p
不過,可以預期的是上面會有大量的 Spam Blogs 寄生... (Spam Blogs 可以參考 Wikipedia 對於 Splog 的說明)
WordPress 2.0 Beta 1 引入了 Akismet,一個 Antispam Service,這個 Service 需要一個 WordPress.com API key,我剛好有,所以我就裝起來測試看看。不過,即使測試了以後發現效果很好,我還是會換回 Spam Karma 2。
主要的原因在於 Akismet 送出太多資訊了,$_SERVER
所有的東西都會送出去,這包括了 Cookie (Exactly What Data Are You Sending to Akismet?)。當然也就有人跑去 WordPress Support 上質疑 (askimet, wordpress, and cookies)。
另外要補充的一點是,Akismet 是封閉式架構,你不知道這個黑盒子裡面到底再跑什麼... 即使再有效,我也不會想用,如同 Nopam 一樣。
Update:鳥蛋一個,所有的 ping 與 trackback 都被 block,換回 Spam Karma。
看到 clsung 這篇 bogofilter 亂談 才發現我好像欠某長輩 bogofilter document 很久了 :p 查了一下,我是從六月中的時候開始用 bogofilter,七月中的時候把 KKcity 的 Mail System 也加上 bogofilter 過濾。
我是裝 mail/bogofilter-qdbm,因為 mail/bogofilter-sqlite 只要 wordlist 超過 1xMB 就會寫不進去,不知道為什麼 :p 而且 qdbm 的速度很快 (只比 cdb 慢:Report of Benchmark Test),所以就用 bogofilter-qdbm 吧 :p
在 .procmailrc
裡面設定:
# bogofilter
:0fw
| /usr/local/bin/bogofilter -e -p -l
.muttrc
裡面設定:
macro index X "<pipe-entry>formail -s bogofilter -s\n<delete-message<" "mark as spam"
macro index Z "<pipe-entry>formail -s bogofilter -n\n" "mark as non-spam"
配合 postfix 過濾時 master.cf
的部分內容:
smtp inet n - n - - smtpd -o content_filter=bogofilter:
bogofilter unix - n n - - pipe flags=FR user=nobody:mail
argv=/usr/local/sbin/bogofilter.sh -f ${sender} -- ${recipient}
其中 /usr/local/sbin/bogofilter.sh
是從網路上抄來的,長這樣:
#!/bin/sh
/bin/rm /tmp/bogofilter-now
echo $$ > /tmp/bogofilter-now
CAT=/bin/cat
FILTER=/usr/local/bin/bogofilter
FILTER_DIR=/var/spool/bogofilter
SENDMAIL="/usr/sbin/sendmail -i"
# Exit codes from <sysexits.h>
EX_TEMPFAIL=75
EX_UNAVAILABLE=69
cd $FILTER_DIR || { echo $FILTER_DIR does not exist; exit $EX_TEMPFAIL; }
# Clean up when done or when aborting.
trap "rm -f msg.$$" 0 1 2 3 15
# bogofilter returns: 0 for spam; 1 for non-spam; 2 for I/O or other errors.
$CAT | $FILTER -d $FILTER_DIR -p -e > msg.$$
$SENDMAIL "$@" < msg.$$
其中 /var/spool/bogofilter
裡必須有 wordlist.qdbm
。
詳細的說明晚點再寫。
另外提供我自己的 wordlist.qdbm
讓大家用好了,如果不想自己花兩三天 train 的話:http://files.gslin.org/bogofilter/wordlist.qdbm。
這陣子發現 Firefox 看 Wikipedia 的圖片老是出不來,按 Reload 按半天也沒用,本來一直以為是 1.5 Beta 1 的關係,可是到了 Beta 2 還是一樣,我就在想是不是我的問題... 只是想半天也想不出來。
剛剛突然想到是不是在 Adblock 裡不小心設的太寬,於是誤擋了 Wikipedia 的圖片,結果發現某些圖片被擋,像是 Nineteen Eighty-Four 這條裡右邊的圖,因為 url 是:
http://upload.wikimedia.org/wikipedia/en/thumb/e/e9/...
而我擋:
ad.*
okay,找到原因了,是因為 upload.wikimedia.org
炸了 :p 改成 http://ad.*
果然就正常了 XD
Slashdot 上的文章:Is Yahoo Actively Supporting Adware?。
這是一家與 Google 完全不同的哲學:Do no evil,從 Flickr 必須申請 Yahoo! 帳號的事件也可以看的出來。
btw,comment 很有趣,可以看一看。
Matt 最近想要發展一種 spam prevention method 取代現有的 Plugins,我猜他應該是想直接牽在 WordPress 裡面:Stop Spam Better。
不過我很好奇的是,目前做得比較好的 Spam Prevention 幾乎是雞尾酒式的方法在抓,WordPress 真的做得過人家嗎 :p