雖然這篇用的方法很簡單,但因為太符合本 blog 的副標,所以還是寫下來介紹:「Extracting Chinese Hard Subs from a Video, Part 1」。
作者想要把字幕拉出來,他直接把這張圖丟進 OCR,然後失敗 XDDD:
他決定拉出下半段:
再做 thresholding:
最後再 OCR 取得文字:
′…′二′′′'′ 怎么去逯么远的地方 '/′
雖然很粗糙,但已經可以感覺到「幹壞事是進步最大的原動力」的感覺了 XDDD 而且看起來會有續集,會用比較精緻的技巧來處理?