用google文件抓出圖片中的文字,文字歪3度都還抓的到。

雖然用google文件來翻譯英文的效果不太好,
詳見:用google文件,將英文pdf翻譯成中文,不推薦~
但是用來抓圖片中的文字的效果,確是出奇的好,很值得一試。


STEP.1                    
首先,我們要把圖片給上傳到google雲端硬碟。這裡用3張圖做演示。
這三張圖片由左至右,是旋轉5度、旋轉3度和正常版。

STEP.2                    
在圖片上頭,按滑鼠左鍵,選擇開啟工具,用GOOGLE文件開啟這張圖片。

STEP.3                    
依照圖片的大小,打開時間有長有短。

STEP.4                    
打開的GOOGLE文件中,會看到我們的圖片會放在最上頭,
下面的地方,就是從這一張圖片裡頭抓出來的文字。
大家可以對對看,很神奇的,幾乎都是對。

STEP.5                    
接下來試試看打開旋轉3度的圖片,會這樣做的原因,
主要是因為圖片不太可能全部都是正的,所以就來試試GOOGLE文件的極限在那裡。
同樣是用GOOGLE文件開啟圖片,請參考STEP.2

這樣做的結果,上半區的大字體部份,還是很好的變成文字。
下半部字比較小的部份,
就會開始有漏字,或是錯別字的產生。但是大部份都是對的。
這個部份大家可以試試。

STEP.6                    
最後我試到完全分辨不出結果的角度是5度。
GOOGLE文件打開之後,圖片的下面乾脆的連字的都沒有。


結論是:
如果圖片裡頭的字是又大又正又清楚的話,
用GOOGLE文件來做OCR,抓取圖片裡頭的字,準確性是非常的高

如果圖片裡的字是歪斜,而且字體又小的話,旋轉的角度又不大的話,
還是可以用GOOGLE文件來做OCR,
但是如果解析出來的文字,已經誤差變大的話,
個人覺得就不要用了,有的時候訂正這件事情,反而比全部手打來的更累人。

建議的角度在3度以下的話,還是可以先用GOOGLE文件來做OCR。

發表迴響