隨著智能機(jī)器人、無(wú)人駕駛、醫(yī)療診斷的飛速發(fā)展,文本的檢測(cè)與識(shí)別已經(jīng)成為定位和理解物體信息的重要途徑 [28]。現(xiàn)實(shí)當(dāng)中,許多跟文本識(shí)別相關(guān)的應(yīng)用極大地方便了我們的生活,如車(chē)牌識(shí)別, 發(fā)票識(shí)別, 拍圖識(shí)字等等. 提到文本檢測(cè)識(shí)別,我們會(huì)聯(lián)想到的一個(gè)詞就是 OCR,OCR 是光學(xué)字符識(shí)別 Optical Character Recognition的簡(jiǎn)稱,是指對(duì)文本資料的圖像文件進(jìn)行分析識(shí)別處理,獲取文字的過(guò)程 [19]。 現(xiàn)在所說(shuō)的OCR 通常也指場(chǎng)景文字識(shí)別,根據(jù)識(shí)別場(chǎng)景,可大致將 OCR 分為識(shí)別特定場(chǎng)景的專用 OCR 和識(shí)別多種場(chǎng)景的通用 OCR。