Home » Computer » Network » Archive by category "WWW" (Page 173)

再用一次 Rojo

Falling in love with Rojo 看到有人說 有改善,就把之前註冊的帳號拿出來測試,發現還是非常不好用。

有很多地方可以用 AJAX 改善的都沒做,造成整個畫面不斷在 refresh,用慣 AJAX Application 後,看起來很痛苦。反倒是沒什麼大改版的 在這點做的就還不錯,相當簡潔,而且沒有廣告...

Social Software

在這篇這樣講:(Web2 Spam)

Nick Bradbury says "Any new Web 2.0 company that hasn’t considered the spam problem automatically isn’t worth my time." I forget who said it, but my favorite definition of social software is "things that get spammed."

不知道 在講什麼...

Social Software 利用 Internet 的 Social Network 產生有用的資訊,再回饋給 Internet。但因為牽扯到「人」,這時候就會有 Spammer 加入,想要透過 Social Network 進行他的廣告。這是 A (social software) => B (spam),不代表 B => A 啊...

Google 搜尋關鍵字列表

有人去用 搜尋關鍵字的排名,發現最近 "Google" 這個關鍵字幹掉 "porn",但是還是輸 "sex",而 "Yahoo" 這個關鍵字比 "porn" 與 "sex" 都高,於是寫了一篇文章:Google beats porn . . . but not sex.,而 的標題下的更好笑 XD Google Users Want Yahoo Even More Than Sex?

搜尋的結果在這:yahoo, sex, porn,我剛剛丟進去找的圖是這樣,藍色是 yahoo,紅色是 sex,橙色是 porn:

yahoo, sex, porn

PPC (Pay Per Click) Botnet

看到第一個 PPC Botnet 被發現的消息:Clickbots vs AdSense and Others,不過目前看起來還是蠻傳統的方法控制 (透過 Web servers 抓資料):

The bots are controlled remotely through several Web servers.

理想中的狀態應該是 Botnet 本身是 P2P Network,再透過數位簽章的方式丟指令叫 Botnet 做,使得整個 Botnet 建立後就沒有 single point of failure,而且這樣會大幅提昇 Spammer 的隱密性...

DreamHost 的 CPU 限制

剛剛看到 The Truth About Overselling! 這篇,突然想起有些積了很久的東西要寫 :p

主要有兩個要注意的:

  1. 我們先計算出來:一天有 1440 minutes,如果有兩顆 CPU 就有 2880 CPU minutes,60 CPU mins 佔了 2%+,換句話說,一台雙 CPU 的機器只夠給五十個用滿 2%+ 的客戶用。
  2. 提供了兩種模式跑 :CGI mode (可以跑 PHP4 或 PHP5) 或 mod_php4,前者是預設值,跑 PHP4。

在 CGI mode 下會以 suexec 轉到 user 的身份跑,當然比較安全:所有的檔案權限都可以設定為 600,但是比較慢:因為要先 fork()execl() 到 suexec,再 execl() 到 php.cgi。

而 mod_php4 當然就快多了,少了 fork() + execl() + execl(),但 就是以 apache 的身份在跑,CPU resource 不會掛在 user 帳上,只要不要吃的太兇,其實都不太管。這時 安全上的問題則是透過 裡設定 safe_mode,在這個模式下無法透過 fopen() 開啟目錄外的檔案或 symbolic link,以及種種限制。

回過頭來說 Blog Software 以及我對於 開發者心態不以為然。

在發展時就都有考慮到 safe_mode 的問題,所以在 上可以直接使用 mod_php4。另外一方面, 在發展新功能的同時,也在控制 CPU resource 與 resource 的消耗量。在 還沒搬家前,就是以這種方式在跑。(在更早之前我也跑過 php.cgi 的模式,後來收到通知 CPU 超量的信,就改到 mod_php4,一直到四月底搬家)

反過來看當年的 pLog (現在叫 ),這是 2005/06 時裝好 pLog 1.0 後覺得很慢,拿出工具追蹤所發現的紀錄:

03:29 <@Ben_> 救命喔...讀取首頁就要用到 272 個 php 檔案...

到了 2006/02/19,DreamHost Sucks! 我的惡夢! 這篇最後面提到:

PS 2:我的 CPU Minuts 是多少? 195 Minutes 而已啦!他們規定只能用 60 Minutes。

用了整台主機 6%+ 的 CPU resource 還可以大喊人家爛,而且是自己在維護的 ... *無言*

SNS 以及各種網路的應用

這篇提到了台灣兩千萬與韓國四千萬的差距:东拉西扯:和徐挺耀聊互联网,實際上... 人數差了一倍,搞起 SNS 以及各種網路的應用本來就有差啊:

但有个问题徐挺耀想不明白,韩国也只有4000多万人口,只是台湾人口的两倍多一点,为什么韩国的互联网产业就完全是另外一个面貌?那里除了大门户网站,还会涌现出OhMyNews和CyWorld这样的让美国人都激动不已的新型社区。所以,过几天他打算去韩国看看。

為什麼要使用 mod_rewrite?

來講什麼是 mod_rewrite (或是其他類似的東西),以 為例,RSS feed 的輸出大致上會長這樣:

http://group.nctu.edu.tw/rss10/darkkiller

我希望把這類的連線要求都交給 rss10.php 處理,變成這樣:

http://group.nctu.edu.tw/rss10.php?g=darkkiller

這就是 mod_rewrite 要做的事情。

那麼用 mod_rewrite 有什麼好處?我可以想到這幾點:

  • 服務的穩定性:對於發展中的平台而言,mod_rewrite 提供了彈性,使得底層的改變 (譬如 rss10.php 變成 rss10-2.php) 不會影響到上層的 URL,對於使用者而言不會有感覺。
  • SEO:Search Engine 會比較偏好沒有 ?& 的 URL。

像無名的 RSS 與文章 (以彎彎的 Blog 為例) 就做的不太好:

  • http://www.wretch.cc/blog/cwwany&rss20=1
  • http://www.wretch.cc/blog/cwwany&article_id=5576574

比較好的作法可能是改成這樣:

  • http://www.wretch.cc/blog/cwwany/rss20
  • http://www.wretch.cc/blog/cwwany/5576574

甚至改成 feed.wretch.cc,一開始先用 VirtualHost 跑在同一台上,以後如果發現 RSS 愈來愈吃重,需要以獨立的機器分出來就更方便了。

Archives