Amazon Transcribe 可以吃其他格式了

Amazon TranscribeAWS 推出語音轉文字的服務,先前只有提供 WAVFLACMP3MP4 格式,現在則是多支援不少格式:

Today, we are excited to announce native support for media files in AMR, AMR-WB, Ogg and WebM format by Amazon Transcribe.

AMRAMR-WB 以前還蠻常看到的,最近比較少看到了,可能是專利加上選擇性多之後用的人就變少了。

再來是 OggWebM 兩個都是開放格式。

上次拿 Amazon Transcribe 測日文的影片,先用 FFmpeg 把 MP4 檔內的 audio track 抽出來再丟上去轉,轉完後用 andyhopp/aws-transcribe-to-srt 把 Amazon Transcribe 輸出的 JSON 再轉成 SRT 檔,就辨識正確度測起來算是堪用,但專有名詞 (像是人名) 就得另外處理,不過比什麼都沒有好不少...

4chan 支援 WebM...

在「WebM support on 4chan」這篇公告裡 4chan 宣佈支援 WebM 格式。

由於目標是提供 GIF 的替代方案,所以目前開放的 WebM 內容有限制:

we only accept WebM files with one video stream and no audio streams, that are shorter than 120 seconds long, no larger than 2048x2048 pixels, and less than 3 MB in size.

讓我另外注意到的是:

however 86% of 4chan’s visits come from browsers that include full or partial support for WebM

依照「Can I use the WebM/VP8 video format」,這代表大多數 4chan 的使用者都是用 FirefoxChrome

用 HTML5 video 取代動態 GIF 的 Hosting 服務...

拿「F6F — 井口裕香 @ たまゆらじお~もあぐれっしぶ~特別編 (2013-12-21) ↙:かわいい...」這篇的第一張圖來當範例。

這是原始的 GIF 版本:

這是 gfycat 的版本:

GIF 的原始大小是 1487KB (1522894 bytes),而 WebM 的大小是 151KB (154735 bytes),MP4 的大小是 147KB (151274 bytes),大約是十倍的差距?

about 頁有說明想法,可以看到檔案大小的差距。不過 GIF 已經是上個世紀發明的東西了,而且當初也不是預期現在這種用法 :p

VP8 將可以無償使用 MPEG LA 重要的專利...

Slashdot 上看到 VP8 可以使用 MPEG LA「重要的」專利:「Google and MPEG LA Reach VP8 Patent Agreement」,這次授權不僅限於 Google,還包括讓 Google 可以免費授權其他人使用。

官方公告包括了 WebM 網站上「VP8 and MPEG LA」,MPEG LA 的「Google and MPEG LA Announce Agreement Covering VP8 Video Format」... (話說 MPEG LA 的聯絡窗口叫做 Tom O'Reilly,跟那位有關嗎?:p)

TechCrunch 也給了一篇分析「Google And MPEG LA Sign Licensing Agreement Covering Google’s VP8 Video Codec, Clearing The Way For Wider Adoption」。

YouTube 將 99% PV 影片加上 WebM 支援

YouTube 發了一篇公告,將站上約 30% 的影片另外壓一份 WebM 格式,而這 30% 佔全站 99% pageview:「Mmm mmm good - YouTube videos now served in WebM」。

目前在 Firefox 4+、Opera 10.6+、Google Chrome 支援 WebM 格式,手機平台則是 Android 2.3 (Gingerbread) 支援。

希望有一天可以完全取代 H.264...