ocr傳統識別流程

1、影象輸入、預處理：

影象輸入：對於不同的影象格式，有著不同的儲存格式，不同的壓縮方式。預處理：主要包括二值化，噪聲去除，傾斜較正等

2、二值化：

對攝像頭拍攝的圖片，大多數是彩色影象，彩色影象所含資訊量巨大，對於圖片的內容，我們可以簡單的分為前景與背景，為了讓計算機更快的，更好的識別文字，我們需要先對彩色圖進行處理，使圖片只前景資訊與背景資訊，可以簡單的定義前景資訊為黑色，背景資訊為白色，這就是二值化圖了。

3、噪聲去除：

對於不同的文件，我們對燥聲的定義可以不同，根據燥聲的特徵進行去燥，就叫做噪聲去除

4、傾斜較正：

由於一般使用者，在拍照文件時，都比較隨意，因此拍照出來的圖片不可避免的產生傾斜，這就需要文字識別軟體進行較正。

5、版面分析：將文件圖片分段落，分行的過程就叫做版面分析，由於實際文件的多樣性，複雜性，因此，目前還沒有一個固定的，最優的切割模型。

6、字元切割：

由於拍照條件的限制，經常造成字元粘連，斷筆，因此極大限制了識別系統的效能，這就需要文字識別軟體有字元切割功能。

7、字元識別：

這一研究，已經是很早的事情了，比較早有模板匹配，後來以特徵提取為主，由於文字的位移，筆畫的粗細，斷筆，粘連，旋轉等因素的影響，極大影響特徵的提取的難度。

8、版面恢復：

人們希望識別後的文字，仍然像原文件圖片那樣排列著，段落不變，位置不變，順序不變，的輸出到word文件，pdf文件等，這一過程就叫做版面恢復。

9、後處理、校對：

根據特定的語言上下文的關係，對識別結果進行較正，就是後處理。

開發一個OCR文字識別軟體[2]系統，其目的很簡單，只是要把影像作一個轉換，使影像內的圖形繼續儲存、有表格則表格內資料及影像內的文字，一律變成計算機文字，使能達到影像資料的儲存量減少、識別出的文字可再使用及分析，當然也可節省因鍵盤輸入的人力與時間。從影像到結果輸出，須經過影像輸入、影像前處理、文字特徵抽取、比對識別、最後經人工校正將認錯的文字更正，將結果輸出

靚麗時尚館

ocr傳統識別流程

花溪高坡滑雪場開放時間

卡羅拉和蘋果為啥藍芽連不上

七年級的手工製作，立體的

岩石和牛的品質

相關文章