在找 blog 開起來很慢的原因時發現的,全文在這邊:funp.com 的 DNS 設定。
然後我剛剛才知道原來七月過了啊...
幹壞事是進步最大的原動力
在找 blog 開起來很慢的原因時發現的,全文在這邊:funp.com 的 DNS 設定。
然後我剛剛才知道原來七月過了啊...
PHP Framework 裡會大量使用 require_once()
,由於需要判斷是否載入過檔案,require_once()
會使用 realpath()
取得檔案實際路徑資訊當作判斷條件,而這點會有效能上的問題。
其他人其實也遇過,參考:PHP Performance tip: require versus require_once,其中 comment 的部份也說明了目前 Google 到的方法是沒有用的。
FreeBSD libc 裡的 realpath(3)
會使用 lstat(2)
,而 FreeBSD 的 lstat(2)
因為用到 VFS_LOCK_GIANT(9)
,所以在 FreeBSD 上很多隻 PHP 同時用 realpath()
的時候效能並不好。
在 Linux 的 libc 據說沒這個問題 (我沒有實際去 trace libc code,聽別人轉述的),不過實際灌了一台 Debian 跑 PHP 發現解決了 lstat()
的問題後,require_once()
造成的效能問題還是很嚴重。
目前的解法與 Wikia 類似,想辦法讓 require_once()
能夠很快找到 code,不過還是得想辦法從 PHP 本身下手,改善 require_once()
的效能,讓 PHP Framework 發展的時候不用綁手綁腳。
PS:目前的方法是改掉 Zend Framework 裡面的 require_once()
,由於我們有一個統一的 /pixnet
,把裡面的程式碼全部都用絕對路徑。另外在 Autoload 的部份用 APC cache,避免再到 include_path
內重複尋找。
COSCUP 2008,MySQL and SSD:
回家打開 Slashdot 就看到大爆點:Adi Shamir (RSA 的 S) 與 Itai Dinur 找到方法把一卡車的 Block cipher 與 Cryptographic hash function 給擺平:New Attack Against Multiple Encryption Functions。
點進 Bruce Schneier 的文章後有更新不少資訊,看起來目前在用的 Block cipher 應該都沒事,不過他沒提到 Cryptographic hash function 的部份,看起來還是有機會?
Amazon EC2 一直都沒有保證在上面的磁碟資料不會掉,這使得 MySQL 必須透過定時備份到 S3 以及即時將 binlog 備份到非 Amazon 的站台以確保資料的安全性。
之前的解法是將資料放到 Amazon SimpleDB 上,但 SimpleDB 的空間有限制 (還在 limited beta),而且會有被綁在 Amazon 上,如果想要搬出來會找不到 open source 的替代方案。另外一個問題是熟悉度的問題,大家還是比較偏好用 MySQL 這類的 RDBMS。
這個限制終於在 Amazon 推出 EBS (Elastic Block Store) 解決了:你可以在 EC2 上開一個磁碟空間給 MySQL 用!
這個空間確保資料的持久性外,還可以 snaphost 到 S3 上。第一次 snapshot 會是 full backup,後面都是 incremental backup。單一 EBS 的空間可以從 1GB 到 1TB,而目前 beta 階段一個帳號可以開 20 個 EBS,也就是最多可以吃到 20TB。磁碟會是 block level,也就是說你可以在上面跑任何你想要的 filesystem,或者利用 stripe 提高效率。
目前計費的方式,除了 storage 的費用外,每百萬次 I/O 會收 USD$0.10,snapshot 的費用是依照 S3 使用的量計算。不過這些都有可能會改變,可以參考 EBS 的網頁。
這篇會講怎麼在 FreeBSD 上建立標題所說的環境。
Apache 2.2 的部份,透過 ports 編譯時加上 WITH_MPM=worker
即可:
# cd /usr/ports/www/apache22
# make WITH_MPM=worker install clean
裝好後將 /usr/local/etc/apache22/httpd.conf
裡 httpd-mpm.conf
前面的 #
拿掉,並修改 /usr/local/etc/apache22/extra/httpd-mpm.conf
內 mpm_worker_module 那段:
ThreadLimit 512
StartServers 1
MaxClients 512
MinSpareThreads 1
MaxSpareThreads 512
ThreadsPerChild 512
MaxRequestsPerChild 0
這些數字的設計是故意只跑起一隻 httpd,負責所有的連線。
再來是裝 mod_fastcgi:
# cd /usr/ports/www/mod_fastcgi
# make install clean
到 /usr/local/etc/apache22/httpd.conf
裡把 fastcgi_module
的註解拿掉後,把設定檔放到 /usr/local/etc/apache22/Includes/fastcgi.conf
裡:
# FastCgiConfig -maxClassProcesses 1 ScriptAlias /fcgi-bin/ "/usr/local/www/fcgi-bin/" <Directory /usr/local/www/fcgi-bin/> SetHandler fastcgi-script </Directory> # AddHandler php-fastcgi .php Action php-fastcgi /fcgi-bin/php
這邊數字的設計是故意讓一隻 httpd 只能生出一隻 fastcgi,再加上前面限制只有一隻 httpd,可以確保整個 apache 只會透過這個 fastcgi socket 跑 php。
接著建立 /usr/local/www/fcgi-bin
這個目錄,並把 php
放進去:
#!/bin/sh
PHPRC="/usr/local/etc"
export PHPRC
PHP_FCGI_CHILDREN=128
export PHP_FCGI_CHILDREN
exec /usr/local/bin/php-cgi
然後把有支援 FastCGI 的 PHP 與 APC 裝好 (www/pecl-APC) 就可以了。
這個架構下,httpd 會產生 512 threads 處理連線,並產生一個 fastcgi 的 socket 處理 PHP 程式,這個 socket 會由 128 隻 php-cgi 聽,且這 128 隻的 cache 會共用。
APC cache 預設是 30MB,在 Layeredtech 這台 (也就是 blog.gslin.org 這台) 上面開到 256MB (大約用掉 200MB),不過這是因為上面太多客人了,預設的 30MB 對於一般網站應該是不會滿。在安裝完 APC 後可以拿 /usr/local/share/doc/APC/apc.php
看目前 APC 的使用量。
PHP opcode cache 很重要,很久前 zonble 的「雜誌專訪產生器」造成機器速度很慢的原因,就是因為 APC 的空間滿了,常常需要重新編譯 PHP code。
這樣的設定大約會消耗 1.5GB ~ 2.5GB 的記憶體空間 (大小會依照你的 PHP 有多少模組而定),如果網站沒那麼大,可以把數字調低。
YUI team 終於想開了,不再用像是 YAHOO.util.Event.addListener
這種寫 code 時會一直抱怨的命名方式,而是改用 Y
當作物件,並支援 fluent interface,也就是 Y.foo('blah').bar('blah2')
這種串接的用法:YUI 3.0 Preview Release 1。
但缺點就是因為語法改變,你必須改寫... 不過應該不是大問題,因為 YUI 2 與 YUI 3 不衝突,在過渡期時你可以把兩個 framework 都讀進來。
我們 (PIXNET) 預定在 8/19 凌晨開始,全面停機轉換到新後台,8/20 正式上線:【公告】後台上線停機預告。不過實際上我們待命的時間會比這個久,因為要提早開始準備,上線後還要保留二十四個小時 (預定) 修改問題。
上線後除了開始收 feedback 外,也開始要跑下一波計畫改善整個系統。
我打算實際拿 MogileFS 用,要了解穩定性與效能。MogileFS 是一個分散式的檔案系統,國外有一些站台已經在用,日本似乎也有不少人研究。
用 MogileFS 時前端會放 reverse proxy,目前看起來 Squid 3 與 Varnish 都還可以,只要不要碰到 Disk I/O 就沒問題。而 Cacheboy 是一個 Squid 2 fork 出來的專案,還要再仔細看看。
另外一種方案是不自己搞 reliable storage,除了 local 存一份外,直接丟 Amazon S3,然後買 CDN 服務,省下來的時間用在其他地方...
另外一個要研究的是透過 PF 做 load balancer,用 pfsync 與 CARP 拉高穩定性。
趁著在家養傷 (腳痛) 寫程式的時候,順便把這陣子 PIXNET 在重新改寫的部份紀錄下來,從底層與 OS 比較有關的、PHP 的,以及 Web UI 的部份。
FreeBSD 的 NFS client 的效能並不好,在這次 PIXNET 前後台大改版前,我這幾天重新跑數據看目前舊系統的架構,可以看出來 PHP code 放到 NFS 上面所吃的 system CPU resource 比 userland CPU resource 還多:(這是其中一台 blog 主機的 CPU usage,用 Munin 畫出來的圖,中間斷掉那段是我在改 Munin 的設定...)
從圖上可以看出這台跑 blog 的主機有 4 Logical CPUs,但卻有很多 idle time。這是因為 NFS 量更大時會不穩定,所以我們無法使用更高。這次改版把所有的 code 都放到 local disk 上,應該會有很大的改進。
MySQL 還是用 Linux 比較好,同一台機器 (Xeon E5405 + 16GB RAM + 10KRPM*2) 分別跑過 FreeBSD 7-STABLE、8-CURRENT (20080812)、Linux 2.6。在 FreeBSD 上用 UFS2 (包括 noatime + async 與 noatime + softupdate 都有測試) 一直都是 I/O bound,而在 Linux 上用 XFS 一直都很順。這是用 MySQL slave 跑 real traffic 而非模擬測試。
新的資料庫系統還是用 Linux 平台,然後引入 DRBD 與 InnoDB 達到 High Availibility。不過我想在這陣子忙完後測 MMM,以他的實做方式看起來會比 DRBD 好。(但 DRBD 開發比較久,資料比較豐富,也比較容易找到穩定的設定)
PHP 的部份仍然使用 Apache 2.2 + mod_fastcgi 與 PHP。不過這次不跑 event mode,而是跑 worker (threading mode)。在正確的設定下,APC 的 cache 是整台機器共用,使用的記憶體更省。上面是 blog2 (worker MPM),下面是 blog5 (event MPM) 的記憶體使用量:(附註:我覺得 event 應該也可以做到同樣的事情,這次換 worker 是因為種種機緣 XD)
其中 FreeBSD 上可用記憶體空間的意義可以參考 Inactive memory 這篇,並不是只有 Free 代表可用空間。
靜態檔案在重新建立架構時,儘量拆開到其他 domain 上,除了可以 pipeline download,也可以節省使用者送 cookie 的頻寬,這部份的伺服器改用 nginx,因為要用他的 gzip on the fly 讓下載的量減少。我們用到的 javascript framework 盡量都塞進這個系統裡。
PHP 的部份,這次是賭了一把,選擇 Zend Framework 實做前後台,而且完完全全使用 ORM framework 處理資料。以目前的量去推算,看起來應該是沒問題,不過還沒上線前誰都不敢說,換燈管的 CTO 還為此先準備另外的機器,如果真的不行就用先暫時用機器海換出來...
我們用到的部份包括 Zend_Controller、Zend_View、Zend_Feed。(不,我們沒有用 Zend_Db,而是有個撞到腦袋的人寫了 Pix_Table_Cluster...)
不過 Zend_Controller 並不好用,沒有針對開發者的想法發展 (另外一種說法是,沒有針對 PHP 語言特性實做簡潔有力的語法),所以之後可能會自己開發 Pix_Controller。舉兩個例子說明:
另外一個沒有用的是 Zend_Form,原因在於 Zend_Form 的預設值會使得客製化很困難。所以我們自己開發了 Pix_Form,只產生個別的元件,而不產生整體的 Form,所以你可以拿到一個版面後套版進去用。但仍然可以用 Pix_Form validate。
Deploy PHP code 的事情,目前是用 rsync 做,但 rsync 的效率並不高 (不過目前是夠用了),只能加減請 coder 擔待點。前陣子找了不少這類軟體在測試,像是 csync2,不過他同步的方式與期望了方式有落差,也許改變流程,配合 csync2 的方式做,或者是不改變流程,自己從頭幹一個出來?
Web UI 的部份這次改寫時直接強迫大家裝 Html Validator 直接檢查。我對 XHTML 1.0 沒有什麼好感 (事實上這次改版大多都是用 HTML 4.01),但至少不要有 <div> 不對稱這類 browser 會亂猜一通的問題。這樣才不用在奇怪的 DOM tree 裡面操作。
在政策上,javascript 全部用 jQuery,目前的 javascript code 幾乎都是 jQuery 寫出來的。Unobtrusive Javascript 目前只是個理想,有很多地方還是得直接處理。
另外就是 CDN 的事情,有機會再說 orz
在「Debian会如何处理猴子写的代码的版权」這篇提到的問題讓我想起 Star Trek: Voyager (星艦奇航記:重返地球) 的 Author, Author 這一集,在討論非人類的權利...