Home » Computer » Network » Archive by category "WWW" (Page 174)

WordPress.org 站上的 Search 又爛了...

站上的 Search 是透過 API 處理,而 發現這幾天的 Search 功能又爛掉了:Yahoo Search Broken (again?),像是在 Search 頁面找 "mysql" 卻什麼都找不到:

WordPress Search

不過文中所提到的 inurl:yahoo.com search 這個 link 在 comments 裡大家都說很正常,可是 說他透過七台機器試,都不正常... XD

大概是 用的量太大,API key 被搞不清楚狀況的工程師給 ban 掉了?XD

再用一次 Rojo

Falling in love with Rojo 看到有人說 有改善,就把之前註冊的帳號拿出來測試,發現還是非常不好用。

有很多地方可以用 AJAX 改善的都沒做,造成整個畫面不斷在 refresh,用慣 AJAX Application 後,看起來很痛苦。反倒是沒什麼大改版的 在這點做的就還不錯,相當簡潔,而且沒有廣告...

Social Software

在這篇這樣講:(Web2 Spam)

Nick Bradbury says "Any new Web 2.0 company that hasn’t considered the spam problem automatically isn’t worth my time." I forget who said it, but my favorite definition of social software is "things that get spammed."

不知道 在講什麼...

Social Software 利用 Internet 的 Social Network 產生有用的資訊,再回饋給 Internet。但因為牽扯到「人」,這時候就會有 Spammer 加入,想要透過 Social Network 進行他的廣告。這是 A (social software) => B (spam),不代表 B => A 啊...

Google 搜尋關鍵字列表

有人去用 搜尋關鍵字的排名,發現最近 "Google" 這個關鍵字幹掉 "porn",但是還是輸 "sex",而 "Yahoo" 這個關鍵字比 "porn" 與 "sex" 都高,於是寫了一篇文章:Google beats porn . . . but not sex.,而 的標題下的更好笑 XD Google Users Want Yahoo Even More Than Sex?

搜尋的結果在這:yahoo, sex, porn,我剛剛丟進去找的圖是這樣,藍色是 yahoo,紅色是 sex,橙色是 porn:

yahoo, sex, porn

PPC (Pay Per Click) Botnet

看到第一個 PPC Botnet 被發現的消息:Clickbots vs AdSense and Others,不過目前看起來還是蠻傳統的方法控制 (透過 Web servers 抓資料):

The bots are controlled remotely through several Web servers.

理想中的狀態應該是 Botnet 本身是 P2P Network,再透過數位簽章的方式丟指令叫 Botnet 做,使得整個 Botnet 建立後就沒有 single point of failure,而且這樣會大幅提昇 Spammer 的隱密性...

DreamHost 的 CPU 限制

剛剛看到 The Truth About Overselling! 這篇,突然想起有些積了很久的東西要寫 :p

主要有兩個要注意的:

  1. 我們先計算出來:一天有 1440 minutes,如果有兩顆 CPU 就有 2880 CPU minutes,60 CPU mins 佔了 2%+,換句話說,一台雙 CPU 的機器只夠給五十個用滿 2%+ 的客戶用。
  2. 提供了兩種模式跑 :CGI mode (可以跑 PHP4 或 PHP5) 或 mod_php4,前者是預設值,跑 PHP4。

在 CGI mode 下會以 suexec 轉到 user 的身份跑,當然比較安全:所有的檔案權限都可以設定為 600,但是比較慢:因為要先 fork()execl() 到 suexec,再 execl() 到 php.cgi。

而 mod_php4 當然就快多了,少了 fork() + execl() + execl(),但 就是以 apache 的身份在跑,CPU resource 不會掛在 user 帳上,只要不要吃的太兇,其實都不太管。這時 安全上的問題則是透過 裡設定 safe_mode,在這個模式下無法透過 fopen() 開啟目錄外的檔案或 symbolic link,以及種種限制。

回過頭來說 Blog Software 以及我對於 開發者心態不以為然。

在發展時就都有考慮到 safe_mode 的問題,所以在 上可以直接使用 mod_php4。另外一方面, 在發展新功能的同時,也在控制 CPU resource 與 resource 的消耗量。在 還沒搬家前,就是以這種方式在跑。(在更早之前我也跑過 php.cgi 的模式,後來收到通知 CPU 超量的信,就改到 mod_php4,一直到四月底搬家)

反過來看當年的 pLog (現在叫 ),這是 2005/06 時裝好 pLog 1.0 後覺得很慢,拿出工具追蹤所發現的紀錄:

03:29 <@Ben_> 救命喔...讀取首頁就要用到 272 個 php 檔案...

到了 2006/02/19,DreamHost Sucks! 我的惡夢! 這篇最後面提到:

PS 2:我的 CPU Minuts 是多少? 195 Minutes 而已啦!他們規定只能用 60 Minutes。

用了整台主機 6%+ 的 CPU resource 還可以大喊人家爛,而且是自己在維護的 ... *無言*

Archives