三個小時前 (美西時間是 1/12 15:00PM) Google 在官方 blog 上宣佈了「A new approach to China」,內容包括了:
- 偵測到有大量試著存取 Gmail 的帳戶,被試著存取的帳戶是與人權團體人物有關的。沒有指明是誰發動的,只說明不只 Google 被攻擊。
- 不打算再繼續過濾 search result,就這點會在接下來幾個禮拜與中國政府商談,是否有辦法在合於中國法令的情況下給予使用者原始 search result。如果不成的話,會考慮關閉 Google.cn,甚至 Google 中國辦公室。(We have decided we are no longer willing to continue censoring our results on Google.cn, and so over the next few weeks we will be discussing with the Chinese government the basis on which we could operate an unfiltered search engine within the law, if at all. We recognize that this may well mean having to shut down Google.cn, and potentially our offices in China.)
這份新聞稿所提到的政策手腕很漂亮,如果以這樣的方式退出中國市場反而不會受到美國責難。
這幾天看到 Google 在中國被罰,看了老半天還是不知道「不雅訊息」在哪裡,本來還猜測是其他的政治力介入造成的 (因為 CCTV 造假,看起來有點像…),剛剛看到 Slashdot 的「Google Suggest Disabled In China Due To Porn」突然笑了出來 XDDD
因為太忠實呈現網路行為而被處罰 XDDD
PS:這不代表沒有政治力量在後面處理,通常只是找個理由…
照慣例還是得先說明,我從去年八月 (還是九月?) 開始就是 PIXNET 的員工,負責處理各種雜事。(不過不包括換燈管,那不是我的工作)
另外說明,我對 Gene 的 OO 沒有信心,所以請不要跟我討論 Gene 為什麼不用 oo 方法或是 xx 方法,我知道 Gene 都知道這些方法,但是這會擋人財路所以不能做 (不要忘記他跟 BloggerAds 的關係)。
下面是星期五在公司發生的鳥事情…
星期五下午被 far 叫進辦公室,與其他同事討論換網址後「部落格觀察」不更新網址造成的影響,有很多 Blogger 很在乎這個分數。討論時覺得奇怪,不是已經換很久了嗎,怎麼又突然拿出來討論?回到家發現原來是「這次 PageRank 變動表現出無名的跌落? 」以及「在 9 月底的 PageRank 變動 (新的 PR6 部落格)」這兩篇文章故意捅 PIXNET 兩刀造成的。
這兩篇文章的敘述故意給人印象「PIXNET 換網址造成 PageRank 變低,所以部落格觀察不列出也不會與現實狀況違背太遠」。但事實上 Gene 早就預測到 PIXNET 這種改版方式反而會讓整個 PIXNET 的排名大幅提昇,所以故意在「這次 Pixnet 改網址的對應」這篇以「技術上做不到」的假理由拒絕…
九月底這一波 Google Dance 不僅將本來舊網址的 PageRank 分數搬過來,更因為個人化網址的關係,讓 PIXNET 許多 Blogger 的 PageRank 提昇的比原來高。
依照 Gene「宣稱」9 月底只有 14 個 PageRank 6 的 Blog,所以我把 Gene 故意漏掉的 PIXNET 個人的 Blog 列出來:(由於只有挑熱門排行榜上的掃,所以除了這 7 個外,可能還會漏掉幾個)
另外還有一些是團體的:(也是挑熱門排行榜上的掃)
各位寫手們,不要再相信那個「觀察」了,那是沒有意義的啊 XD
Update:這個站倒了 XD 只剩下 screenshot 可以看了…
這個實在太讚了 XD
從 Google Blogoscoped 看到「Yuil」這篇,有人用 Google App Engine,拿 Yahoo! Search BOSS 的結果,與 Cuil 的介面的 Mashup !!!
我覺得搜尋的結果比 Cuil 準多了啊 XD

Google 拿美國總統大選的影片,透過語音辨識轉成文字後讓大家搜尋:Google Lets You Search for Text in Some Videos。
如同 Philipp Lenssen 所說的,如果 Google 把這個技術推廣到所有的影片上,就有很多可行性可以做,像是與 Google AdSense 的配合、與 Google Search Quality 的配合。
比起直接對影像處理,對聲音處理似乎是條可以走的路… (就目前的語音辨識)
OSDC.TW 2008 第一天我是中午才到的。在技術方面,大多數的題目都已經在網路上看過資料研究過,沒有什麼特別的感想,不過可以感覺到有些講者可能因為經驗與時間的關係,有些重要的地方都沒講清楚。
先是我們自己家介紹的 Berkeley DB,jnlin 沒有提到為何要避免使用 LEFT JOIN 的原因,然後在測試的部份數據也少說明了很多東西。
另外 Vivek Ratan 講 Hadoop 的部份,有些地方沒有講清楚,像是要怎麼因應 Namenode 故障時的處理 (在「Metadata Disk Failure」這邊的說明可以參考)。另外我回來查了以後發現跑 Hadoop 後,所需要的時間變成原來的 66%,而不是效率變成原來的 66%,所以我在台下問了一個笨問題…
第一天結束後倒是到樓下的咖啡廳聊了很久,儘講些有的沒的…
都是小圖,看不清楚的可以點回 Flickr 的頁面看到大圖。
我不曉得依照這個規則是怎麼算出比彎彎還要高分:(原出處:部落格觀察貼紙各式說明)

下面這張是依照「Page 總分」排序,彎彎在第九名,第七名是 Gene,第八名是 Wildcat,第十三名是 askareiko,剛好是部落格觀察的「GAW」,這個「排行榜」的公信力大家自己心中應該有數。

Google 新的翻譯引擎終於上線了:Google’s New Translations。
李開復在交大時就有提到以網頁的文字提昇翻譯的品質,當時他是以中文作為說明的背景,說明當 Google 網頁所儲存的量愈來愈大的時候,翻譯的準確度會愈來愈高,現在終於看到這個理論的產品上線了。
不過還是有蠻多好笑 (而且奇怪 XD) 的翻譯…