丹青中英日文文件辨識系統是一款用于中英文辨識的
OCR文字識別軟件,可以快速讀取OCR格式的文檔資源,支持文檔重新編輯、保存操作,軟件可識別繁體中文、簡體中文、英文、日文及阿拉伯數字。
丹青中英文文件辨識系統能辨識的范圍包括各式彩色、黑白、表格及非表格文件;能辨識的內容包括繁體中文、簡體中文、英文、日文及阿拉伯數字。辨識后的文本文件所占的內存空間遠較未辨識前的影像檔案小。在經過校對后即可儲存成TXT、RTF、DOC、XLS、SLK、 CSV等各種檔案格式,并且可以在一般的文字處理軟件中被開啟和編輯。除此之外還可直接傳送成電子郵件,或將檔案以HTML格式,透過網絡瀏覽器直接開啟。
【功能特點】
1、輸出檔案
傳送至其他應用軟件:可將辨識結果直接傳送至您所指定的應用軟件中再處理,例如可設定辨識結果自動儲存成HTML檔案并直接傳送至網絡瀏覽器中。
可儲存多種檔案格式:辨識后的結果可儲存成不同之檔案格式,如TXT、RTF、DOC、XLS、SLK、CSV、HTML等,方便您做不同的應用與處理。
2、影像掃描
可處理彩色、灰階或黑白的文件影像。
傾斜校正:自動偵測文件影像傾斜角度,并提供旋轉影像之功能。
3、辨識文件< 文件分析及辨識 >
自動辨識:輕按一鈕,即可自動分析、辨識、校對影像文件,圖文分離,并轉換成可編輯的文件檔案。
設定辨識字集:不需切換語文環境,即可辨識繁中、簡中、純英文及日文四種文件。
高辨識速率:在Pentium III 667MHz個人電腦環境下,每秒鐘能辨識高達150個中文字。
多種字體辨識及重現:能夠辨識多種印刷字體,如明體、黑體、仿宋體、楷書、圓體、隸書等,并在辨識后還原成原稿的字體。
原文重現編輯環境:可辨識各種表格及影像,辨識結果依照原文件的圖文版面格式呈現,方便您校對、編輯,節省重新排版的時間。
4、自動校對與學習
再辨識功能:提供合/分字、合/分行、合/分區塊、變更區塊屬性等再辨識功能,讓您能夠修正錯誤的辨識結果。
學習新字功能:可將易辨識錯誤的字元輸入到學習資料庫中,提高下次辨識之正確率。
候選字功能:提供原文影像供辨識后圖文作校對,且針對型態相近之文字及語意上前后相連的字詞提供候選字輕松更正辨識錯誤的文字。
自動校對:利用內建的常用詞庫自動校對辨識出的文字,并標示出辨識時所碰到的疑問字,節省您校對的時間。
【軟件特色】
可辨識繁中、簡中、英文及日文四種文件
提供繁中、簡中和日文三種操作介面
辨識后的文件可儲存成各種常用檔案格式再編輯
超高辨識速率及辨識率再提升,快速原文重現各式文件