当前位置:首页 > 心得体会 > [PDF图像识别助推电子政务]电子政务论文
 

[PDF图像识别助推电子政务]电子政务论文

发布时间:2019-03-15 04:01:56 影响了:

  一种名叫“PDF图像OCR识别系统”的软件已经进入到了我们的视野,它正在致力于改善政府部门大量PDF文档很难转换为文本文档的困境。事实上,这个系统正是由于政府办公信息化建设中的需求而为其量身打造的。
  办公自动化(OA)、办公“无纸化”已经成为了电子政务的重要目标之一,这就要将大量的“文山案牍”从有型的“纸纤维”变成无型的“Bit流”,从而实现文档电子化和处理自动化。
  在全面电子政务化的过程中,让政府信息主管头痛的一大难题就是,之前存储的海量资料很多都是PDF格式的。PDF固然有许多其他文档格式无法相比的优点,但从本质上讲,作为一种“图像”格式,它的“只读”特性却成为了“致命死穴”:只能“看”,却无法进行文本的编辑和拷贝,更重要的是PDF文档之间无法相互检索。这就给政府部门带来了很大的难题,使得文件无法很好统一整理和归类。
  其实这样的问题可能在我们每个人的工作中都出现过,而汉王的“PDF图像OCR识别系统”软件就让PDF格式文档不能进行编辑、拷贝和检索的难题迎刃而解。特别要强调的是,该软件可以处理目前PDF文档中的全部11种图片存储格式。另外,一直让大家很头疼的公式识别也已经得到了很好的解决。
  具体来说,“PDF图像OCR识别系统”是一种“双层PDF”,当你打开PDF文档后,看到的是完整的图片形式,但就在它的下面却还隐藏着一个文本形式的“PDF”,你可以对这个隐藏的“文本PDF”进行编辑和检索。编辑的文字可以很容易地导入到Word、TXT或者其他的文本格式中; 而对于电子政务来说可能检索的功能是重点。
  但是,到这里,我们不禁也会产生一些疑问,PDF格式本来就是为了保护其文本不被修改,拷贝的功能会不会造成被任意篡改或者是版权的问题。对于在电子政务中的应用来说,可能因为管理上的机制和OA系统的帮助使得这个问题还不是很明显,但是一旦这样的软件在更大的范围内普及,这样的问题就不可避免了。而对于这个问题,汉王科技李志峰副总裁的解释是,“只要你公开了,就难免会被引用或者说是拷贝,因为还有一个最基础的方法就是一字一句的用键盘录入”。(文/田梦)

猜你想看
相关文章

Copyright © 2008 - 2022 版权所有 职场范文网

工业和信息化部 备案号:沪ICP备18009755号-3