Matt 在他的 Blog 上說他們決定開放 WordPress.com 給所有人申請:WordPress.com Open。
目前 WordPress.com 雖然是用 WordPress-mu,但可以看出來目前跟的很緊,幾乎所有的 Beta code 都有上去。而且目前穩定性看起來也還可以,不過如果完全開放後不知道會怎樣 :p
不過,可以預期的是上面會有大量的 Spam Blogs 寄生... (Spam Blogs 可以參考 Wikipedia 對於 Splog 的說明)
幹壞事是進步最大的原動力
Matt 在他的 Blog 上說他們決定開放 WordPress.com 給所有人申請:WordPress.com Open。
目前 WordPress.com 雖然是用 WordPress-mu,但可以看出來目前跟的很緊,幾乎所有的 Beta code 都有上去。而且目前穩定性看起來也還可以,不過如果完全開放後不知道會怎樣 :p
不過,可以預期的是上面會有大量的 Spam Blogs 寄生... (Spam Blogs 可以參考 Wikipedia 對於 Splog 的說明)
WordPress 2.0 Beta 1 引入了 Akismet,一個 Antispam Service,這個 Service 需要一個 WordPress.com API key,我剛好有,所以我就裝起來測試看看。不過,即使測試了以後發現效果很好,我還是會換回 Spam Karma 2。
主要的原因在於 Akismet 送出太多資訊了,$_SERVER
所有的東西都會送出去,這包括了 Cookie (Exactly What Data Are You Sending to Akismet?)。當然也就有人跑去 WordPress Support 上質疑 (askimet, wordpress, and cookies)。
另外要補充的一點是,Akismet 是封閉式架構,你不知道這個黑盒子裡面到底再跑什麼... 即使再有效,我也不會想用,如同 Nopam 一樣。
Update:鳥蛋一個,所有的 ping 與 trackback 都被 block,換回 Spam Karma。
看到 clsung 這篇 bogofilter 亂談 才發現我好像欠某長輩 bogofilter document 很久了 :p 查了一下,我是從六月中的時候開始用 bogofilter,七月中的時候把 KKcity 的 Mail System 也加上 bogofilter 過濾。
我是裝 mail/bogofilter-qdbm,因為 mail/bogofilter-sqlite 只要 wordlist 超過 1xMB 就會寫不進去,不知道為什麼 :p 而且 qdbm 的速度很快 (只比 cdb 慢:Report of Benchmark Test),所以就用 bogofilter-qdbm 吧 :p
在 .procmailrc
裡面設定:
# bogofilter
:0fw
| /usr/local/bin/bogofilter -e -p -l
.muttrc
裡面設定:
macro index X "<pipe-entry>formail -s bogofilter -s\n<delete-message<" "mark as spam"
macro index Z "<pipe-entry>formail -s bogofilter -n\n" "mark as non-spam"
配合 postfix 過濾時 master.cf
的部分內容:
smtp inet n - n - - smtpd -o content_filter=bogofilter:
bogofilter unix - n n - - pipe flags=FR user=nobody:mail
argv=/usr/local/sbin/bogofilter.sh -f ${sender} -- ${recipient}
其中 /usr/local/sbin/bogofilter.sh
是從網路上抄來的,長這樣:
#!/bin/sh
/bin/rm /tmp/bogofilter-now
echo $$ > /tmp/bogofilter-now
CAT=/bin/cat
FILTER=/usr/local/bin/bogofilter
FILTER_DIR=/var/spool/bogofilter
SENDMAIL="/usr/sbin/sendmail -i"
# Exit codes from <sysexits.h>
EX_TEMPFAIL=75
EX_UNAVAILABLE=69
cd $FILTER_DIR || { echo $FILTER_DIR does not exist; exit $EX_TEMPFAIL; }
# Clean up when done or when aborting.
trap "rm -f msg.$$" 0 1 2 3 15
# bogofilter returns: 0 for spam; 1 for non-spam; 2 for I/O or other errors.
$CAT | $FILTER -d $FILTER_DIR -p -e > msg.$$
$SENDMAIL "$@" < msg.$$
其中 /var/spool/bogofilter
裡必須有 wordlist.qdbm
。
詳細的說明晚點再寫。
另外提供我自己的 wordlist.qdbm
讓大家用好了,如果不想自己花兩三天 train 的話:http://files.gslin.org/bogofilter/wordlist.qdbm。
這陣子發現 Firefox 看 Wikipedia 的圖片老是出不來,按 Reload 按半天也沒用,本來一直以為是 1.5 Beta 1 的關係,可是到了 Beta 2 還是一樣,我就在想是不是我的問題... 只是想半天也想不出來。
剛剛突然想到是不是在 Adblock 裡不小心設的太寬,於是誤擋了 Wikipedia 的圖片,結果發現某些圖片被擋,像是 Nineteen Eighty-Four 這條裡右邊的圖,因為 url 是:
http://upload.wikimedia.org/wikipedia/en/thumb/e/e9/...
而我擋:
ad.*
okay,找到原因了,是因為 upload.wikimedia.org
炸了 :p 改成 http://ad.*
果然就正常了 XD
Slashdot 上的文章:Is Yahoo Actively Supporting Adware?。
這是一家與 Google 完全不同的哲學:Do no evil,從 Flickr 必須申請 Yahoo! 帳號的事件也可以看的出來。
btw,comment 很有趣,可以看一看。
Matt 最近想要發展一種 spam prevention method 取代現有的 Plugins,我猜他應該是想直接牽在 WordPress 裡面:Stop Spam Better。
不過我很好奇的是,目前做得比較好的 Spam Prevention 幾乎是雞尾酒式的方法在抓,WordPress 真的做得過人家嗎 :p
我前幾天有講到現有 ouiouioui 模式的不可行性:現有「ouiouioui 共筆書籤」的不可行性,而且我們也可以看到 tag spam 不斷的發生:以道德為最後防線的系統,是擋不住 spammer 的攻擊的。
舉例來說,今天又看到有人在賣瓜了:
道德絕對不能是最後的防線,而應該是輔佐的工具。
舉個例子來說,你不覺得上街頭抗議、或是在 blog 上抱怨 mail spam 很多,「請 Spammer 不要再送」這種事情很鳥嗎?那相反過來,你為什麼要以道德標準來「勸導」Spammer?
tag spammer 一定會愈來愈多,ouiouioui 如果要繼續下去,真正應該要作為最後的防線應該是以技術為底:不論是以評分系統來作為是否刊登的標準,或是以該篇文章被多位 del.icio.us 或 furl 收錄作為標準。
所以我對於 Reder 在 comment 提到的說法不以為然:
我剛剛回頭看了一下Oui-News的網站上都沒有一個聯結是連到當初quawn在Oui-Blog所張貼的那篇文章。而又再次觀察了一下會推薦的人,大致上就是那幾位前輩。我想這個計畫有繼續推展的必要,而不是因為一兩位spammer就宣告實驗失敗。況且有像gslin這樣的前輩會注意到spam的現象。XD
ijliao 在這篇 WordPress Trackback Auto-Discovery 提到了 WordPress 大多數的 Theme 在 Trackback Auto-Discovery 這個問題,我剛剛把他修了一下 (改個 Theme Template 而已),讓 Spam 發的更快更輕鬆。如果有問題的話麻煩再通知?
quawn@Oui-Blog 當初推動「共筆書籤」所擔心的事情已經一而再再而三的發生:
可能會有很大一部份的朋友對於這個想法會存疑,我了解,因為就連我也掙扎了很久。如果有人惡搞?如果有人狂打自家網站的廣告?如果ouiouioui的標籤被SPAM盯上?這些考慮都曾經阻礙了我心中想法的實踐進度,不過,小弟覺得儘管這個計劃有一天失敗了、或是事實證明根本不可行,那至少我們試圖證明過,就像大多數的科學實驗一樣,尤其,特別在這個實驗並沒有明顯的成本時。
先後包括了:
後來我有一陣子沒在注意看 Oui-News,剛剛發現 toaaron 這個傢伙從 9/7 開始,只要是自己的文章就 tag ouiouioui 一下,結果整個版面就通通都是他的東西...
是的,我要說的就是 ouiouioui 已經被 Spammers 盯上,這個實驗已經失敗了。
在寫了 Engadget.Chinese 與 ouiouioui spam? 這篇後,我就在看 engadget.chinese 到底還會不會繼續 tag spam,結果在 8/21 的時候變本加厲,一口氣丟了一卡車進去...
於是我在 8/22 去 Engadget Chinese 網站上找 e-mail 要幹剿:結果我沒找到。甚至在原來的英文站台也都沒找到。(...)
我在同一天 (大約是吃完晚餐後) 透過 Participate: help feed our blog. 寫給 Engadget,留下 gslin @ gslin.org,然後等待他們的 reply:
Hello sir,
Oui-News (http://www.oui-news.com/) is a Chinese article-sharing platform using the advantange of tag in del.icio.us and furl.net.
It's very simple: Use del.icio.us to tag a article with "ouiouioui", then it will appear in Oui-News's board about 1 hour later.
Unfortunely, we found someone register an account called "engadget.chinese" in del.icio.us and he spams Oui-News about two days: tag articles on chinese.engadget.com with "ouiouioui".
I don't know if this person is your employee, but I think it's necessary to let you know that.
Best Regards,
gslin
很巧的是,在同一天下午四點的時候我的 Blog 上收到自稱是 engadget.chinese 本人的留言:(atticus Said)
hi gslin:
在oui-news看到的一系列engadget.chinese文章就是我設的,和oui- news.com沒關係。而且沒錯的,我就是engadget.chinese編輯之一,engadget.chinese現在流量不是很大,所以我也試圖想要找到更多導入流量的機會。然而這種作法並不是spam,我並沒有設軟體拼命在del.icio.us丟tag,第一次我嘗試的時候嚇了一跳,原來 oui-news使用共筆書籤的人這麼少,才導致我一貼上去全都上了同一個版面,如果有許多人使用ouiouioui tag的話,engadget.chinese的書籤應該就會被洗掉或平均分佈的。engadget.chinese這個網站到目前為止都是測試階段,有什麼好的建議歡迎給予意見指教。
“瓦肯人”的翻譯真的沒有那麼好,如果在翻譯上有所錯誤的地方,請盡量指出,我們會馬上改進的。
講明白一點:你們的東西水準差,不求改善水準,卻到處利用 tag spam 想要取得廣告收入,然後怪別人 ouiouioui tag 太少?拜託,ouiouioui 大多都是 tag 中文文章,而中文文章有水準的本來就不多了,每天只有四五篇本來就很合理,這不是給你們 spam 的理由!
再回頭過來看由留言所留下來的 IP address,得知這位先生是從 創市際市場研究顧問 (當然,加上 rel="nofollow") 這家公司連線出來的,我就馬上瞭解為什麼這位先生可以把 Spam 的行為光明正大的拿出來講了。
btw,到發文章前截止,我還沒收到 Engadget 所回的 mail,所以我剛剛直接依照國際上處理 spam 的慣例,把 tag spam 的訊息通知 abuse @ chinese.engadget 與 abuse @ engadget.com 了。
PS:上面那張圖就是剛剛又在 tag spam 的資訊了,不過看起來 quawn 不太想理會?