Home » Archive by category "Murmuring" (Page 503)

穿越公司的 FireWall

之前都教別人用 設定 tunnel 穿越,剛剛才發現原來同一家的 plink 也很好用 :p

抓下來以後丟到 C:\WINDOWS 裡 (只是因為這樣比較方便),然後在命令提示字元下輸入:

plink -ssh -L 3128:163.28.64.50:3128 -C gslin@ccca.nctu.edu.tw

然後登入進去以後就把視窗最小化,然後 IE 或是 的 Proxy 就設定到 127.0.0.1:3128 即可 :p

其中 3128:163.28.64.50:3128 表示的是 127.0.0.1:3128:163.28.64.50:3128,也就是把 127.0.0.1:3128 導入 163.28.64.50:3128

這台 163.28.64.50:3128 就是我們家的古董 Cacheflow (Proxy),有允許 ccca.nctu.edu.tw 連過去使用 (因為在 140.113.0.0/16 裡面)。如果你要用其他的機器,請找看看其他的 Proxy server 謝謝 :p

新版的 Flickr Uploadr

My Flickr Day 看到新版的 ,抓下來更新以後還沒機會測試,先記錄下來,應該中午就可以測試了 :p (因為會去新竹...)

不過在 的 Screenshot 可以看到多了一些功能,尤其是可以直接加到 Set 裡面了:

虛偽的 Blog 數字

我們可以看到很多報導在報 Blog 成長數量驚人之類的話,但 On the state of the blogosphere 這篇文章裡面直接說:其實大部分都是 Spam、Fake Blog,所以不要再自欺欺人了。而透過 分析可能更少 - 真正有價值的 Blog (這邊「有價值」只是表示是真的有人在寫、有人在讀) 大約在 100k 左右。

最後這句說的很實際:

The real problem of scaling for growth of the blogosphere is not scaling the tools, but scaling the readers.

Yahoo! Search 索引的數量比 Google 少

如果你沒有注意在看最近 Search Engine 的新聞,說起來就有點複雜了。

我們從頭說起好了: 在 8/8 的時候宣稱 索引了兩百億個網頁 (這邊的網頁包括了文件及圖片)。請注意: 並沒有說他們索引的數量比 多,他們只宣稱索引了兩百億個網頁,但大家當然都會很自然的解讀成「 索引的頁面比 多」,因為在 的網頁上就直接寫明了他索引八十億個網頁。

然後這則炫耀文被報導到 上並引起廣泛討論:Yahoo Passes Google in Total Items Searched。(當然,標題的意思就很清楚了)

然後這幾天就吵得頗凶,像是 在 8/9、8/10、8/11 各寫了一篇這件事情的發展,說明 的內部工程師並沒有觀察到 索引的數量有這麼大的變化:How Many Pages Does Yahoo Index?In This Battle, Size Does Matter: Google Responds to Yahoo Index ClaimsMore On Yahoo, Google, Index, Size

不過到了今天, 上報導了 的 Dr. Orville Vernon Burton 以及兩位研究員 Matthew Cheney 與 Mike Perry 利用一些比較公正的方法分析了 索引的數量的相對值 (也就是誰比較多、以及多了多少):NCSA Compares Google and Yahoo Index Numbers

簡單說明一下這個方法:因為你不可能直接取得後端資料庫的資料,所以你沒有辦法直接比較兩個 Search Engine 的情況,所以研究員打算用一些常見的字去找 (但也不能太常用到),然後去確認 Result 真的存在 (換句話說,有被索引) 而估計相對的情況:

Although there is no direct way to verify the size of each search engine's respective index, we developed a technique to approximate the relative size of the both the Yahoo! index and the Google index.

但他們發現這兩個搜尋引擎都無法取得超過一千筆的資訊,所以他們只能利用筆數少於一千筆的 keyword 研究:

Unfortunately, both the Yahoo! and Google search engines truncate results returned to the user after 1,000 results. Thus, for the purposes of this study, we were forced to restrict our searches to those queries that returned less than 1,000 results on both Yahoo! and Google. Any search result found to have more than 1,000 returned results on either search engine was disregarded from our sample. [3]

在經過十八個小時將所需要的數據蒐集出來後,他們發現不管有沒有濾掉重複網頁 (兩個搜尋引擎都有選項可以選擇要不要顯示重複網頁), 所能找到的數量都遠少於 ,實際的數目大約在 1:2.5 左右。

最後他們給了一個很直接的結論:"suspicious"

It is the opinion of this study that Yahoo!'s claim to have a web index of over twice as many documents as Google's index is suspicious. Unless a large number of the documents Yahoo! has indexed are not yet available to its search engine, we find it puzzling that Yahoo!'s search engine consistently returned fewer results than Google.

vanilla UTF-8 修正

那邊看到 這套討論區軟體,目前版本是 0.9.2。畫面很「乾淨」(比起 ...)

我在安裝以後發現中文仍然存在一些問題,看了一下 的 Language Pack,發現他只有翻譯而沒有 patch,只好裝了 看資料庫的情況,發現是 latin1 老毛病 (呃),處理一下再測試就正常了。

測試站台在 http://vanilla.gslin.org/,如果您有興趣可以在上面玩看看。這邊提供 UTF-8 安裝所需要的動作:

  • 先建立資料庫,並將資料庫的預設字元集改成 UTF8:ALTER DATABASE DEFAULT CHARACTER 'utf8';
  • 將官方網站的 vanilla.0.9.2.zip 解到 DocumentRoot 裡。
  • 修改 library/Utility.Database.class.php,尋找 @mysql_connect 這行,在後面加上 @mysql_query('SET NAMES UTF8;', $this->Connection);
  • 提供的 Language Pack 丟進 languages/ 下。
  • 用瀏覽器連到 http://vanilla.site.com/installer.php (當然,記得把 vanilla.site.com 改成你自己的網址),把該填的資訊丟進去。
  • 理論上這樣就做完了。

頗有趣的是 支援的 Atom 是 1.0,而非 0.3,看起來動作很快啊 :p

另外就是效率問題,我不清楚整體效率如何,但是我已經瞄到大量的 Class 殺手... 我猜 (猜錯不負責) 效率可能比 還 XD

系統安全

這幾天剛好有些人跑來問我系統安全的東西 (像是 這次的 bpop3d security issue),說實話,四五年前還有到國外接觸,後來就不想碰了 - 該備份的東西備份好,有公告要 security upgrade 的做一做,其他就隨便了啦...

怎麼說呢?尋找 security hole 需要大量的花時間去看 source code,或是在聽到風聲的時候拿奇怪的 debugger 翻 assembly,甚至有時候還要跟其他的大長輩 pk (oh my god),還要小心會不會被抓到列管... (噗 XD) 那種整天提心吊膽的日子是很刺激,不過久了實在是沒力氣玩 :p

所以到後來就是該做的事情做一做,如果你真的要 root 就給你,資料別亂動就是了 :p 時間拿去看 或是去拐女朋友會比較快樂,真的 :p

強者布丁大長輩 Blog

最好的辦法就是在 title 的地方 bomb (效果比文章內好 XD)

終於把 Blog 弄出來了:,不過網頁居然沒過 XHTML 1.0 Strict :p 經過抱怨以後得到下列意見:

01:56 <@gslin> hlb: 長輩,你的 blog 沒過 XHTML 1.0 Strict XD
01:56 <@hlb> gslin: 隨便啦

既然 都說隨便,那我們小喀也不敢說什麼了 XD

Archives