Tag Archives: data

Linode 東京第二機房的訪談 (a.k.a. PR 稿)

前幾天提到的「Linode 東京機房擴充的工作...」,這幾天 Linode 就開始發 PR 稿造勢了:「Behind The Scenes: Details About Upcoming Tokyo 2 DC Launch」,把重點拉出來。 新機房在品川 (Shinagawa),原文應該是打錯了 (n 跟 b 差一格而已): Linode will be opening a new datacenter in Shibagawa ward, Tokyo, Japan, this fall and I was able to … Continue reading

Posted in Cloud, Computer, Hardware, Murmuring, Network | Tagged , , , , , , , | Leave a comment

ING Bank 在羅馬尼亞的機房出事...

ING Bank 在羅馬尼亞的機房發生資料損毀:「A Loud Sound Just Shut Down a Bank's Data Center for 10 Hours」。 不過原因是因為火災測試時噴發的音量太大,導致硬碟故障 XDDD ING Bank’s main data center in Bucharest, Romania, was severely damaged over the weekend during a fire extinguishing test. In what is a … Continue reading

Posted in Computer, Financial, Hardware, Murmuring, Network, Security | Tagged , , , , , , , , , , | Leave a comment

Facebook 推出的 Zstandard 壓縮

Facebook 發了一篇出來,講 Zstandard:「Smaller and faster data compression with Zstandard」,可以看到: 如果與 Google 去年 open source 出來的 Brotli 相比,Zstandard 則是著重在速度,想要做出一個比 zlib 快很多但又比 zlib 壓的好的壓縮演算法。

Posted in Computer, Murmuring, Software | Tagged , , , , , , , , | Leave a comment

在核輻射避難所建的資料中心

Nuclear Fallout Shelter 照字面翻是核放射塵碉堡,意思上算是可以對抗輻射塵的防空洞,用 Google Translate 翻出來是「核輻射避難所」,感覺也頗貼切的啦... 而 C14 project 則是 Online.net 在巴黎的核輻射避難所建立 data center 的玩意:「C14 story - Part 1 Meet Our Nuclear Fallout Shelter」 在地下 26 公尺,如果一層樓三米的話,大約是已經是地下八樓到九樓的位置了: Starting in October 2016, you will be able to store all your … Continue reading

Posted in Computer, Hardware, Murmuring, Network, Security | Tagged , , , , , , , , , | Leave a comment

Facebook 用哪些資訊來決定投放給你的廣告

華盛頓郵報整理出來了 Facebook 的廣告所使用的 98 個個人資訊:「98 personal data points that Facebook uses to target ads to you」。 基本的個人資訊 (甚至是朋友的),以及使用什麼瀏覽器都可以預期;而 Like 或是參加的 Group 都會被計算也是意料中的事情,不過連信用卡的種類也都在內就頗特別的... 來檢視一下自己的防禦機制有哪些... 瀏覽器預設擋下第三方 cookie: 用 Ghostery 預設把所有外部元件擋下來,再用白名單開想要看的部份。用 uBlock Origin 擋下所有廣告。 另外用「Force Facebook Most Recent」強制 Facebook 轉到 Most Recent 的 … Continue reading

Posted in Computer, Murmuring, Network, Security, Social, Software, WWW | Tagged , , , , , , , , , , | 1 Comment

設計資料同步問題時一定會遇到的 Conflict 解決方案

在「A Conflict-Free Replicated JSON Datatype」這邊看到有趣的東西。(arXiv 說 2016/08/18 會有一個小時的 downtime,台灣時間剛好是 2016/08/18 的 20:20 開始:「Maintenance scheduled for Aug 18 8:20 a.m. EDT」) 作者們設計這個架構是想要在 JSON 結構上找出一個演算法,在 P2P 架構上 (而不需要靠 server) 可以同步並且產生一致的結果,另外要求當 conflict 時不要掉資料: In this paper we present an algorithm and formal semantics … Continue reading

Posted in Computer, Murmuring, Network, P2P, Programming | Tagged , , , , , , , , | Leave a comment

Cuckoo Filter:比 Bloom Filter 多了 Delete

在「Cuckoo Filter implementation in Go, better than Bloom Filters」這邊看到這個資料結構,有興趣的人也可以看「Cuckoo Filter:设计与实现」這篇介紹,下面是我抓重點整理。 Bloom Filter 支援的操作: Add(element) Query(element) 1970 年提出來的資料結構。優點是空間複雜度是 O(1),Query(element) 會有可接受的 false positive,缺點是不支援 Delete(element)、以及數量變多時誤判率的增加。 Cuckoo Filter 多了一組操作: Delete(element) 2014 年提出來的資料結構。空間複雜度一樣是 O(1),但相同的空間用量下 false positive 變低,然後支援 Delete(element) 了。也因此論文直接寫「Cuckoo Filter: Practically Better Than Bloom」,表示可以直接替代。

Posted in Computer, Murmuring, Programming | Tagged , , , , , , , | Leave a comment

Google Cloud Platform 美西機房

Google Cloud 在七月的時候開放了美西機房:「Introducing Cloud Natural Language API, Speech API open beta and our West Coast region expansion」,而且東京機房也快開了: And as we announced in March, Tokyo will be coming online later this year and we will announce more than 10 additional regions … Continue reading

Posted in Cloud, Computer, Murmuring, Network | Tagged , , , , , , | Leave a comment

看到 zmx 貼了之前的連結,更確信 Uber 的問題不是技術問題了...

在 Twitter 上看到 zmx 提了一個連結,講 Uber 年初時貼的「How We Built Uber Engineering’s Highest Query per Second Service Using Go」這篇文章的問題: TLDR; Uber:傳統方式太複雜了根據我們資料特性自創一套高效能的空間索引服務。前 Bing 員工:買了 Bing 怎麼不問專家啊?Quadtree 降兩個數量級啊,不然你們自創的做了這個小修改也是降兩個數量級啊!https://t.co/nHw1DgmYtU — Bill Zhong (@zmx) August 2, 2016 對照最近的事情還蠻有趣的,尤其是這篇文章後面提到的,酸~爆~了~XDDD: It is clear to me that the … Continue reading

Posted in Computer, Murmuring, Network, Programming, Search Engine, Software | Tagged , , , , , , , , , , | Leave a comment

Humble Bundle 對抗信用卡盜刷的方法

Humble Bundle 說明他們如何對抗信用卡盜刷的方法,主要是不斷的降低風險,然後讓人介入的機會降低 (因為人事成本很高):「How Humble Bundle stops online fraud」。 其中第一點是特別想提的: Our first line of defense is a machine-learning-based anti-abuse startup called Sift Science, which we’ve been training for years across 55,000,000 transactions. Given how many orders we process, Sift Science … Continue reading

Posted in Computer, Financial, Murmuring, Network, Science, Security | Tagged , , , , , , , , , , , , , | Leave a comment