Tag Archives: york

A Billion Taxi Rides 資料分析系列

Mark Litwintschik 最近在連載 A Billion Taxi Rides 的資料分析系列作品: A Billion Taxi Rides in Redshift A Billion Taxi Rides in Hive & Presto A Billion Taxi Rides on Amazon EMR running Presto A Billion Taxi Rides on Amazon EMR running Spark … Continue reading

Posted in AWS, Cloud, Computer, Database, Murmuring, Network, PostgreSQL, Software | Tagged , , , , , , , , , , | Leave a comment

Audi 準備在 New York International Auto Show 上惡搞無線網路

就是車商的那個 Audi 打算在 New York International Auto Show 上惡搞無線網路,推銷自家的 A4:「Audi is trolling the competition with its Wi-Fi at the New York Auto Show」。 據說再過幾天就會知道實際情況了...

Posted in Computer, Murmuring, Network | Tagged , , , , , , , , , | Leave a comment

美國年輕人的理想職業

紐約時報報導 National Society of High School Scholars 問了一萬八千名美國年輕人 (15~29 歲) 理想的職業,也不少出乎意料的結果跑出來:「The New Dream Jobs」。 常見的網路公司在上面,但讓紐約時報感到意外的,FBI、CIA 與 NSA 也在上面: When the National Society of High School Scholars asked 18,000 Americans, ages 15 to 29, to rank their ideal future employers, the … Continue reading

Posted in Murmuring, Social | Tagged , , , , , , , , , , , , , , , , , | Leave a comment

Airbnb 被抓到操作站上資料以美化數據

在「How Airbnb's Data hid the Facts in New York City」這篇文章裡提到了 Airbnb 在去年 (2015 年) 十一月時操作站上資料,美化數據的證據。 Airbnb 在 2015 年 12 月時發表了一篇「Data on the Airbnb Community in NYC」,說明 Airbnb 對紐約地區的貢獻的種種之類的 PR 文章。 Airbnb 的文章裡面提到了資料是取自 2015 年 11 月 17 日的資料: As … Continue reading

Posted in Computer, Murmuring, Network, Social | Tagged , , , , , , , , , | Leave a comment

紐約公共圖書館放出十八萬張數位高畫質的數位資料

紐約公共圖書館這次放出了十八萬張數位資料,包括歷史照片、地圖以及信件:「The New York Public Library Lets You Download 180,000 Images in High Resolution: Historic Photographs, Maps, Letters & More」,圖書館官方的公告在「Free for All: NYPL Enhances Public Domain Collections For Sharing and Reuse」這邊: The release of more than 180,000 digitized items represents both … Continue reading

Posted in Computer, Murmuring, Network, Social, WWW | Tagged , , , , , , , , , , , , , , | Leave a comment

紐約公共圖書館提供的 Library:將地圖 OCR 成向量資料...

紐約公共圖書館 (NYPL) 丟出個有趣的東西:「Map polygon and feature extractor」,敘述的地方就有這樣的說明: Like OCR for maps 可以把這樣的地圖圖檔: 轉成: 這樣子... 也可以 GeoJSON 輸出 :p 這屬於 Open Data 的工作,紐約公共圖書館本身就是全世界第三大圖書館,美國第二大的圖書館 (僅次於第一的國會圖書館與第二的大英圖書館),做完後可以把館內的地圖館藏整個數據化讓人重複使用 (而非僅僅將紙本掃描成圖片資料的「電子化」),這包括了以前的手繪地圖啊... 程式主要是用 Python 寫,另外在 repository 有看到 R 與 Scheme 的存在... (GitHub 的統計)

Posted in Computer, Murmuring, Software | Tagged , , , , , , , , , , , | 1 Comment