Amazon Transcribe 可以吃其他格式了

Amazon TranscribeAWS 推出語音轉文字的服務,先前只有提供 WAVFLACMP3MP4 格式,現在則是多支援不少格式:

Today, we are excited to announce native support for media files in AMR, AMR-WB, Ogg and WebM format by Amazon Transcribe.

AMRAMR-WB 以前還蠻常看到的,最近比較少看到了,可能是專利加上選擇性多之後用的人就變少了。

再來是 OggWebM 兩個都是開放格式。

上次拿 Amazon Transcribe 測日文的影片,先用 FFmpeg 把 MP4 檔內的 audio track 抽出來再丟上去轉,轉完後用 andyhopp/aws-transcribe-to-srt 把 Amazon Transcribe 輸出的 JSON 再轉成 SRT 檔,就辨識正確度測起來算是堪用,但專有名詞 (像是人名) 就得另外處理,不過比什麼都沒有好不少...

遊戲捲頁的理論與實作

文章的標題「Scroll Back: The Theory and Practice of Cameras in Side-Scrollers」,裡面圖又大又多,20Mbps 的光世代全速下載要跑滿一分鐘才能抓完。


順便測一下 Imgur 的 mp4,以及 HTML5 的 video tag。

裡面考了不少古啊,把捲頁的方式分成許多類別...

Imgur 的 GIFV (GIF 轉 MP4)

Imgur 宣佈 GIFV 計畫:「Introducing GIFV」。

上面這個影片是 Imgur 的範例影片,將 50MB 的 GIF 轉成 3.4MB 的 MP4。

之前在今年年初的「用 HTML5 video 取代動態 GIF 的 Hosting 服務...」這篇寫過類似的服務,Imgur 也跳進來玩了...

可以省很多頻寬 :p

用 HTML5 video 取代動態 GIF 的 Hosting 服務...

拿「F6F — 井口裕香 @ たまゆらじお~もあぐれっしぶ~特別編 (2013-12-21) ↙:かわいい...」這篇的第一張圖來當範例。

這是原始的 GIF 版本:

這是 gfycat 的版本:

GIF 的原始大小是 1487KB (1522894 bytes),而 WebM 的大小是 151KB (154735 bytes),MP4 的大小是 147KB (151274 bytes),大約是十倍的差距?

about 頁有說明想法,可以看到檔案大小的差距。不過 GIF 已經是上個世紀發明的東西了,而且當初也不是預期現在這種用法 :p