
【基本介绍】
汉王ocr文字识别软件是一款精确的文字识别工具。汉王ocr文字识别软件可以帮助你从电子文档或者纸质上识别出文字,输出到为其他格式文本,能够精确地识别图文混杂中的文字,提供办公效率。【软件特点】
1、图像输入、预处理图像输入:对于不同的图像格式,有着不同的存储格式,不同的压缩方式。预处理:主要包括二值化,噪声去除,倾斜较正等
2、字符识别
这一研究,已经是很早的事情了,比较早有模板匹配,后来以特征提取为主,由于文字的位移,笔画的粗细,断笔,粘连,旋转等因素的影响,极大影响特征的提取的难度。
3、倾斜较正
由于一般用户,在拍照文档时,都比较随意,因此拍照出来的图片不可避免的产生倾斜,这就需要文字识别软件进行较正。
4、二值化
对摄像头拍摄的图片,大多数是彩色图像,彩色图像所含信息量巨大,对于图片的内容,我们可以简单的分为前景与背景,为了让计算机更快的,更好的识别文字,我们需要先对彩色图进行处理,使图片只前景信息与背景信息,可以简单的定义前景信息为黑色,背景信息为白色,这就是二值化图了。

5、噪声去除
对于不同的文档,我们对燥声的定义可以不同,根据燥声的特征进行去燥,就叫做噪声去除
6、版面分析
将文档图片分段落,分行的过程就叫做版面分析,由于实际文档的多样性,复杂性,因此,目前还没有一个固定的,最优的切割模型。
7、字符切割
由于拍照条件的限制,经常造成字符粘连,断笔,因此极大限制了识别系统的性能,这就需要文字识别软件有字符切割功能。
8、版面恢复
人们希望识别后的文字,仍然像原文档图片那样排列着,段落不变,位置不变,顺序不变,的输出到word文档,pdf文档等,这一过程就叫做版面恢复。
9、后处理、校对
根据特定的语言上下文的关系,对识别结果进行较正,就是后处理。

【使用教程】
1、首先我们通过各种方法来获取此工具,通过安装完成并打开,如下图所示。
2、通过点击菜单栏打开按钮,选择打开图像,如下所示。

3、在弹出子框中通过选择图片源路径将其打开,如下图所示。

4、上图中我们需要注意图片格式,当前支持格式才能够打开,打开后如下图所示。

5、可以通过功能去放大缩小来查看全部内容,如下图所示。

6、上述工作完成后,通过菜单栏选择识别-开始识别,快捷键为F8,版本之间不同可以通过菜单栏进行查看即可,如下图所示。

7、接着我们来看识别结果。

8、通过在识别后的区域内通过鼠标方向键来进行查看识别文字结果是否正确,如果不正确可以通过给出选项进行调整修改,如下图所示。

9、全部检查完成后我们进行输出操作,点击菜单栏输出-到指定格式文件,如下图所示。

10、根据提示输入文件名称,选择输出格式类型及保存路径即可,如下图所示。

【安装教程】

2、输入用户名和公司名称以及序列号,点击下一步。

3、选好安装目录,软件即会默认不会生成桌面快捷方式。

4、安装完成。
