Tag Archives: image

Google 的 Guetzli,對 JPEG 的壓縮演算法

Google Research Europe 推出的演算法,在不動 decoder 的情況下,要怎麼樣壓出又小又清晰的 JPEG 圖片:「Announcing Guetzli: A New Open Source JPEG Encoder」,論文可以在「Guetzli: Perceptually Guided JPEG Encoder」這邊下載,程式碼則可以在 GitHub 上的 google/guetzli 取得。 othree 也寫了一篇「Guetzli: A New Open Source JPEG Encoder」介紹 Guetzli。 Guetzli 在同樣的品質下,比現有的壓縮法可以再壓榨出 29%~45% 的空間,這算是非常驚人的數字: We reach a 29-45% … Continue reading

Posted in Computer, Murmuring, Photo, Programming, Recreation, Software | Tagged , , , , , , , , , , | Leave a comment

把才能用在奇怪的地方:老闆偵測器

作者用 OpenCV 學習老闆的臉,然後當老闆走過來的時候把畫面切到努力工作中的 screenshot XDDD:「Deep Learning Enables You to Hide Screen when Your Boss is Approaching」。 “My boss left his seat and he was approaching to my seat.” “OpenCV has detected the face and input the image into the learned … Continue reading

Posted in Computer, Murmuring, Programming, Software | Tagged , , , , , , , , , | 1 Comment

Amazon Rekognition:圖片辨識 API

從 Google 的 Vision API,到 Microsoft 的 Computer Vision API (參考「微軟也推出圖片辨識的 API 了」),AWS 也推出類似的服務了:「Amazon Rekognition – Image Detection and Recognition Powered by Deep Learning」。 與其他兩家都是類似的方式,丟圖進去然後用系統已經 train 好的資料給你分析結果... 然後依照次數算錢。 有種算是補產品線的感覺啦...

Posted in AWS, Cloud, Computer, Murmuring, Network, Programming | Tagged , , , , , , , , , , , | Leave a comment

Yahoo! 也放出了判斷是否為色情圖片的方案

感覺好像是從 AlphaGo 大勝李世乭開始,透過各類 neural network 的技術就一直冒出來... Yahoo! 這次放出來判斷是否為色情圖片的也是同源的技術:「Open Sourcing a Deep Learning Solution for Detecting NSFW Images」。 當年沒辦法做的事情,現在的技術已經成熟到被 open source 出來了...

Posted in Computer, Murmuring, Network, Photo, Programming, Recreation, Software | Tagged , , , , , , , , , , , | Leave a comment

透過 Deep Learning 辨識人臉馬賽克的技術

在某些新聞報導透漏出了受害者的某些背景身份,於是你手上有了這兩個資料: 符合這些背景身份的四十個人的照片。 人臉被馬賽克後的新聞照片。 現在的問題是,要怎麼判斷出新聞照片裡是哪個人:「Defeating Image Obfuscation with Deep Learning」。 類似這樣的實驗,從 40 個人中找出正確的人,有 50% 的正確率: 也許 50% 不算到能用的程度,但這代表老大哥的技術已經在發展了...

Posted in Computer, Murmuring, Programming, Security | Tagged , , , , , , , , , | Leave a comment

OpenStreetMap 推出 OpenStreetView

OpenStreetMap 也開始嘗試街景圖了:「Introducing OpenStreetView」。 資料愈來愈豐富了...

Posted in Computer, Murmuring, Network, Photo, Recreation, Social | Tagged , , , , , , , | Leave a comment

另外一篇講文件掃描的...

在「Page dewarping」這篇看到講文件掃描的技術,以及 open source 的程式,對比之前提到的「Dropbox 的文件掃描功能」與「Dropbox 的 Document Detecting」的時間點,有種淡淡的惡意 XD 這篇作者是為了未婚妻的需求而寫出來的,本來是作者收到學生的作業時手動在跑,後來未婚妻也拿去用,但量愈來愈大,決定自動化處理: A while back, I wrote a script to create PDFs from photos of hand-written text. It was nothing special – just adaptive thresholding and combining multiple images into a … Continue reading

Posted in Computer, Murmuring, Programming, Science, Software | Tagged , , , , , , , , , | Leave a comment

Dropbox 的文件掃描功能

算是講 Dropbox 的「Dropbox 的 Document Detecting」這篇的續集,在抓出文件位置後講顏色的校準:「Fast Document Rectification and Enhancement」。 要怎麼把左邊的原始圖轉換成右邊的圖,包括了座標轉換以及顏色校準: 顏色校準的部份講到了這張很有名的圖。在圖片上,A 與 B 的區塊顏色是相同的,但你校準出來的時候必須跟人腦的感覺相同: Here’s a great illustration of this “illusion,” in which the two tiles marked A and B have the same pixel values, but appear to be … Continue reading

Posted in Computer, Murmuring, Programming, Science, Software | Tagged , , , | 1 Comment

微軟也推出圖片辨識的 API 了

微軟也推出類似於 Google Cloud 的 Vision API 的服務了:「Microsoft Cognitive Services - Computer Vision API」。 微軟這次推出了三個功能,Analyze an image (類似於 Google Cloud 這邊的 Label Detection)、Generate a thumbnail (Google Cloud 沒有對應的功能) 與 OCR (對應到 Google Cloud 的 OCR)。 微軟的每千次都是 USD$1.5,而 Google 的 Label Detection … Continue reading

Posted in Cloud, Computer, Murmuring, Network, Science | Tagged , , , , , , , , | 1 Comment

Dropbox 的 Document Detecting

Dropbox 發表了他們所研究的 Document Detecting 技術:「Fast and Accurate Document Detection for Scanning」。 他們希望抓出這張圖裡面「文件」的「邊緣」: 用 Canny edge detector 會跑出這樣,很明顯多了很多不太正確的邊線,對於後續判斷上會困難不少: 剛好也是最近看到的另外一篇文章「Image Kernels Explained Visually」在講 Image Kernel,有些地方有點類似的東西,交叉看頗有感覺的... Anyway,Dropbox 最後的成果很不錯啊,可以看示範:

Posted in Computer, Murmuring, Programming | Tagged , , , , , , , , | 1 Comment