文通综合文字识别系统软件提供文字识别功能,可以帮助用户在软件上快速识别您需要的文字内容,软件支持添加TIFF文件、标记图像文件格式BMP文件、Windows位图PCX文件、PC画笔传真文件、传真格式JPG文件,将图像添加到软件就可以点击识别按钮,从而得到文字内容,对于需要快速识别图像的朋友很适合,软件识别以后可以导出为新的文件,例如导出为rtf、HTML、TXT,从而可以将这些文件加载到你需要的地方使用!
软件功能
文通综合文字识别系统软件 V9.0特有的编辑功能
文通综合文字识别系统软件 V9.0特有的编辑功能主要包括【前向词汇[O]】、【逆向词汇[B]】、【相似字[S]】和【常用符号[M]】,此外还包括虽不太常用但却很有用的【行逆序[V]】。在 文通综合文字识别系统软件 V9.0的编辑环境中,屏幕上既有识别结果文本,又有与之相对应的原始扫描图像,对应于识别结果文本中当前光标所在位置的汉字,图像中相应的字用一个蓝色方框包围。用户不必查阅原稿,就可进行全部的编辑校对和修改工作。
在【前向词汇[O]】、【逆向词汇[B]】、【相似字[S]】和【常用符号[M]】的编辑方式中,系统处理的都是当前光标所在位置的字符,以下各种描述也都对当前光标所在位置而言。
a)前向词汇[O]
前向词汇,就是根据光标所在位置的前一个汉字,以词汇联想的方式,提供出光标所在位置可能的汉字。采用前向词汇的编辑方法, 是非常方便而有效的。比如文件材料中本来应是"我们",而其中的"们"字由于种种原因,被计算机识别错了,在【前向词汇[O]】的方式下,系统会由于其前一个字是"我"而自动列出"校"、"爱"、"国"和"们"等一系列可以和"我"字组成词汇的汉字,只要简单地在其中选择"们"字即可完成编辑改错。
b)逆向词汇[B]
与前向词汇非常相似的另一种编辑修改方式,叫【逆向词汇[B]】。逆向词汇,就是根据光标所在位置的后一个汉字,以词汇联想的方式,提供出光标所在位置可能的汉字。这也是非常方便而有效的。例如,文件材料中本来应是"清华",而其中的"清"字,被计算机识别错了,在【逆向词汇[B]】的方式下,系统会由于其后一个字是"华"而自动列出"升"、"荣"、"清"和"年"等一系列可以和"华"字组成词汇的汉字,只要简单地在其中选择"清"字即可完成编辑改错。
软件特色
文通综合文字识别系统能够适应超过一百种Windows字体。
对于每个区域可以设定不同的字体,例如一篇文档中的大段英文可以设为英文识别,以提高识别率。
版面分析前根据实际情况选择“报纸版面”或“杂志版面”可以提高版面分析正确性。
对一般文本识别扫描分辨率用300DPI比较合适,识别小于5号的字可选400DPI。
选择“简体全字集”或“繁体全字集”,能够识别更多的字体和全部字符集,但识别速度较慢。
安装方法
1、打开setup.exe直接安装,点击下一步
2、软件的协议内容,点击接受
3、软件默认安装在C:Program Files (x86)WintoneWintone Words Recoginzing System
4、软件的安装进度条在这里显示,等待几秒钟
5、文通综合文字识别系统软件已经安装结束,点击完成
使用说明
1、打开文通综合文字识别系统软件,将您需要识别的图像打开
2、这里是图像格式选择功能,在软件找到你需要识别的图像,可以选择多个图像打开
3、您也可以通过扫描的方式获取来源,如果你的电脑已经连接扫描设备就可以在这里选择
4、打开图像以后显示当前的界面,可以在这里查看图像上的内容
5、鼠标选择你需要识别的地方,在命令界面点击识别就可以读取文字
6、识别的内容不会在软件界面显示,你只需要在图像保存的文件夹就可以查看识别结果
7、版面分析前根据实际情况选择“报纸版面”或“杂志版面”可以提高版面分析正确性。
官方教程
设置 [S]
打开【命令[C]】菜单,选择【设置[S]】后,屏幕上显示【设置】对话框。如图所示,它包括了对系统、识别、后编改及其它等项设置的选择。
上图还表示了选择【系统】设置时的情况。【系统】设置包括【英文提示[E]】、【自动进行版面分析[A]】、【自动进行识别[R]】、【显示全局窗口[G]】、【显示跟踪窗口[T]】等项。注意:当选择【英文提示[E]】时,系统全部菜单均用英文表示;当选择【自动进行版面分析[A]】、【自动进行识别[R]】时,只要装入图像,系统就自动完成整个识别过程。建议对于复杂版面不选用此项。
【识别】设置中包括【输出全角字符[F]】、【汉字后加空格[N]】、【输出文本式框线[O]】、【后处理[P]】。用户可以根据自己的需要自行选择。
【后编改】设置中包括【浮动跟踪窗】与文本的位置关系、前景色、背景色及可疑字颜色,建议全部选用。
【其它】设置中包括【表格[F]】中的【快速框线检测[Q]】选项,还包括【版面分析[A]】中的【杂志[M]】与【报纸[N]】选项,用户可以根据自己的需要自行选择。
版面分析[L]
版面分析是将扫描得到的图像,划分出每一个区域块。对于各个不同的区域块,不仅给出其自身的属性(如横排的文字、竖排的文字、图形图像以及表格等等),而且标明不同区域块之间的顺序,以便系统进行识别处理。在 文通综合文字识别系统软件 V9.0(浙江省高考技术科目计算机上机考试项目专用版)【命令[C]】菜单中,选【版面分析[L]】项(也可以直接按【F6】键),或用鼠标按工具条中快捷键,图像自动分为若干个属性不同的区域(图形图像、竖排文字、横排文字、表格等)。对于特别复杂的图像版面,自动分析后,须人工手动来辅助调整。
建立一个新的区域:在未被选定的区域,按住鼠标左键从鼠标所在位置(图中"+"符号处)拖画出一个方框将所需要的区域围住。
框线检测[F]、虚拟框线检测[I]
文通综合文字识别系统软件 V9.0(浙江省高考技术科目计算机上机考试项目专用版)无法识别未进行框线检测的表格图像,也无法识别框线不全的表格图像。因此如果要识别的图像中含有表格,必须先对它进行框线检测。
a) 框线检测[F]
图像内如含表格,应先将表格建为独立的区域,然后确定其表格属性。这时系统即自动进行框线检测并将检出的框线(包括内部的表格线)用粉红色线表示。
b) 虚拟框线检测[I]
当要识别的图像表格框线不全时,必须进行虚拟框线检测。选择【命令[C]】菜单的【 虚拟框线检测[I] 】,系统会将框线自动修补好。
注意:虚拟框线检测必须在框线检测完成后才能进行。
识别[R]
图像文件根据各自情况经过倾斜校正、版面分析、框线检测及虚拟框线检测等处理后,即可进入识别程序(图像中只含有单栏的横排文字,没有其它复杂的内容,可以不进行版面分析,就能够识别)。这是 文通综合文字识别系统软件 V9.0(浙江省高考技术科目计算机上机考试项目专用版)的核心。为了保证正确的识别,用户应按以下步骤进行:
a)选择正确的识别字体
用鼠标打开工具条上的字体选择键
,文通综合文字识别系统软件 V9.0(浙江省高考技术科目计算机上机考试项目专用版)能识别的字体呈现在屏幕上,请用户根据被识别图像的具体情况选择字体:
简体多体(印刷体)── 常见的宋体、仿宋体、黑体、楷体、圆体
和魏碑等等。
繁体多体(印刷体)── 常见的宋体、仿宋体、黑体、楷体、圆体
和魏碑等等
纯 英 文(印刷体)── 常见的多体纯英文。
简 体 全 字 集 ── 国标一二级全部字符集,魏碑、隶书等更多的字体。
繁 体 全 字 集 ── 繁体一二级全部字符集。
b)识别[R]
在【命令[C]】菜单中,选【识别[R]】项(也可以直接按键盘上的【F2】键),或用鼠标按工具条的
,系统即进入识别程序。识别过程中在识别输出窗口将出现一活动蓝条以报告识别完成的进度。
如果对已经识别处理过的图像再次选择识别命令,系统会显示出【覆盖】对话框,提示是否覆盖已有的识别结果。用户可以根据需要自行选择。
c)识别所有页[A]
当大量文稿需要录入时,可以把稿件逐页扫描,系统将在工程管理窗口内自动编入页码。在对每页文稿进行版面分析后,选【全部识别[A]】项(也可以直接按键盘上的【Ctrl +F2】), 或用鼠标按工具条中的多页识别按键
。系统即进入批量识别程序。批量识别时的图像与识别时相似,此时右下角将报告已完成识别的图像的序号。
注意:使用批量识别功能时,必须保证每页图像都完成了倾斜校正、版面分析、框线检测等,同时每次页数不宜太多。
∨ 展开