Monthly Archives: September 2009

Google Docs OCR

在「Google Docs OCR」這邊看到 Google Docs 也開始試著提供 OCR 服務了:「Import Scans or Go Multilingual」,不過剛開始還不穩定,傳了兩次都是 error,應該是因為服務很吃資源,而想要測試的人又多。 以文章作者自己上傳文件測試的結果來看 (英文的文件,他拿 RFC 2616 印出來後掃描的圖檔),有些地方有錯字,不過整體的效果還不錯... 等穩定後再來測試中文文件,有沒有支援中文對我們很重要... 如同作者講的,網路上提供免費 OCR 的服務並不多,如果 Google 決定把這項服務併入 Google Docs 裡的話,一定會打亂現在 OCR 付費的生態...

Posted in Computer, Murmuring, Network, Software, WWW | 2 Comments

TI 工程計算機的 RSA private key 被破解

TI 工程機算機的 OS firmware 需要 sign 過才能用,但其中使用的 RSA key 的有效長度只有 512bits,所以被暴力法搞定:「Texas Instruments Signing Keys Broken」。 查了 Wikipedia 上的「RSA Factoring Challenge」,早在 1994 與 1996 年左右,RSA-129 (426bits) 與 RSA-130 (430bits) 就已經被分解成功了,當時比較安全的 RSA 保護會是 1024bits (現在一般都建議 2048bits 了)。 在「Comparison of Texas Instruments graphing … Continue reading

Posted in Computer, Hardware, Murmuring, OS, Security, Software | 1 Comment

FreeBSD 8.0-RC1 釋出

在「FreeBSD 8.0-RC1 available」這邊提到 8.0-RC1 出來了,看起來是第一個 kernel 沒有一堆 debug info 的版本,要測效能這時候跳下去測會比 8.0-BETA4 準確,順便把之前一直在測試的 8.0-BETA4 升級到 8.0-RC1... (測 NFS 的穩定度) 用台灣的前兩個 mirror site 安裝,發現慢到爆炸 (ftp.tw.freebsd.org 與 ftp2.tw.freebsd.org,分別是交大與國高),實在沒時間找原因,暫時先跑去 ftp.jp.freebsd.org 抓... 事後看了 traceroute 與一些紀錄,交大的部份大概沒救,應該是奇怪的 filter 或是 routing 亂跑之類問題造成。國高因為只能看單邊 (TFN 端),看不出原因。 再來就是文章的這段,看了讓人笑得蠻開心的: How many RC's … Continue reading

Posted in Computer, FreeBSD, Murmuring, OS, Software | Leave a comment

Google Chrome Frame - 在 IE 裡面使用 Chrome

在 TechCrunch 看到 Google 推出「Google Chrome Frame」,將 Chrome 嵌到 IE 裡面:「Google Has A Solution For Internet Explorer: Turn It Into Chrome」,這個軟體的作法有種 IETab 的感覺... 使用者裝了 Google Chrome Frame 後,並不會使得所有的頁面都用 Webkit Engine 呈現,而是網頁製作人必須要指定「我的頁面可以用 Google Chrome Frame 顯示」才會執行:(如果是 XHTML 的話要記得加上 slash) <meta http-equiv="X-UA-Compatible" … Continue reading

Posted in Browser, Computer, IE, Murmuring, Network, Software, WWW | 1 Comment

用 Facebook 上的公開資料猜測性向

在 Slashdot 上看到兩位 MIT 的學生發展一套程式 (這個計畫被稱為「Gaydar Project」),試著用 Facebook 上公開的資料來研判「是否為同性戀」:「MIT Project "Gaydar" Shakes Privacy Assumpitons」,除此之外,參與的團體、喜愛的音樂也都能夠拿來分析各種性向。 這個計畫應該會使得網路上的隱私問題又被拿出來批判一番... 一定會有鄉愿的人跳出來批評「不應該做這類研究」。 這類問題在於,資料是公開的,方法也是人發展出來的,就算在全美禁止,也會有學者在其他國家發展出來。真正想要解決問題還是得從根本解決,也就是「個人資料有沒有辦法保護的更好」,現有的保護程度 (更精確的說,至少 Facebook 現有的保護程度) 可以讓研究人員取得足夠資料,表示不夠用。 可以預見之後政府單位 (尤其是教育單位) 會宣導「不要在網路上留下個人資料」試著卸責,但卻沒有成效。

Posted in Computer, Murmuring, Network, Programming, Science, Security, Social, WWW | 1 Comment

磁碟出錯機率與 RAID

在「RAID's Days May Be Numbered」這篇文章裡面提到使用 RAID6 的好處。 不過,比較有趣的地方是在 2009 年現在的「Hard Error Rate in Bits」數據,說明消費性 SATA 硬碟、企業級 SATA 硬碟、SAS/FC 硬碟的差異。這個數字也是在規劃 RAID 時的重要依據。 由於用料與製作過程的差異造成 error rate 不同,在重視資料的場合裡,大檔案會用企業級 SATA 硬碟跑 RAID6,而資料庫會用 SAS/FC 硬碟跑 RAID1+0,而且都不會串太多顆。

Posted in Computer, Hardware, Murmuring | Leave a comment

Microsoft Ajax CDN

微軟放出了 Microsoft Ajax CDN,將 jQuery 1.3.2 與微軟自己發展的 JavaScript library 放上 CDN:「Microsoft Ajax CDN」。 並沒有像 Google 那樣自己在全球建立 CDN,而是採用 Akamai 的服務,所以速度上相當快。不過缺點是不支援 HTTPS,不像 Google 的 https://ajax.googleapis.com/ajax/libs/jquery/1.3.2/jquery.min.js 有合法的 SSL Certification。 ToS 也是相當長,而且是 docx 格式... 大致上都還蠻普通的。

Posted in Computer, Murmuring, Network, Programming, Software, WWW | Leave a comment

中文與英文字型

灌新電腦後要裝的字體。(留給自己之後可以查) 中文: 文泉驛正黑與文泉驛微米黑。 文鼎所捐贈的字體,可以在很多 mirror site 抓到。 英文: Bitstream Vera Fonts,某些網站會用到,像是 Github 提供的 Gist,如果沒有這個字型就會依照 CSS 改用 "Courier, Monospace",看起來就不太舒服了...

Posted in Computer, Murmuring, Software | Leave a comment

MySQL 的調校 (軟硬體、版本、設定)

把一些關於 MySQL 的資料整理一下。 初期的 MySQL 隨便跑沒關係,備份的部份記得要把 binlog 也一起備份起來,用 gzip 壓過後 (不使用 bzip2 或是高壓縮率參數,是因為考量解壓縮速度;另外推薦用 Parallel gzip 壓縮,速度比較快) 再用 openssl 加密丟到 Amazon S3 上。 成長後,買獨立伺服器要一次買兩台跑 HA,每台分別是: CPU 要考量 SQL query 的方式,如果打算在 MySQL 做很多事情 (i.e. JOIN),CPU 要選高階的;如果大多都是 simple query,則以 C/P 值高的 CPU 優先:兩顆四核心 … Continue reading

Posted in Computer, Database, Murmuring, MySQL, Software | 2 Comments

Election Hash

大約是六七月的時候在 F5 的 DevCentral 上面看到 Election Hash 這個分配方法:「Hash Load Balancing and Persistence on BIG-IP LTM」。 演算法的部份在 F5 的文章裡寫得很清楚了,這邊就不重複再說明。 Consistent Hashing 需要一個 shared storage 放 ring 資料,但這個方法不需要,另外一方面,這個方法寫起來比較簡單,而且 query 會打散的很平均,不像 Consistent Hashing 需要用 virtual node 從機率上平均。 會用 Election Hash 一個主要的原因是 iRule 是 … Continue reading

Posted in Computer, Murmuring, Network, Programming, WWW | Leave a comment