首页 > IT业界 > 正文

谷歌文件新推OCR功能:图像和PDF可抓取文字

2010-06-22 13:56 来源:cnBeta

  OCR(光学字符识别)粉丝们,如果你对现在使用的在线转换感到沮丧,现在福音降临了,谷歌文件现在可以从图像和PDF文件抓取文本,速度奇快而且免费。据谷歌操作系统的博客介绍,经过几个月的开发和实验,谷歌悄悄的推出这个新功能。但是它否会取代目前的商业软件或在线解决方案呢?

 

  上传文件到帐户时,用户将看到一个运行OCR扫描的选项,这个选项将提取文件中的字符置于一个新的文本文档中。至于准确性去,公平的说PDF比图片好的多,特别是白纸黑字的文件。

谷歌文件新推OCR功能:图像和PDF可抓取文字

   

  我上传了我的名片尝试,认识卡片上最大字体和清晰的文字是谷歌文档都有点问题,但令人惊讶的是小字体的文件反而效果更好。PDF文件测试的识别结果则近乎完美,但谷歌文件几乎去除了所有的格式(排版),只是简单的输出文本和空格。谷歌操作系统博客给的其他例子的效果不错,但还不够完善或好用。

 

  此外,扫描PDF时谷歌文档不保存PDF副本,所以扫描文本和原始文件需要单独的上传两次。对于偶然使用OCR的用户来说是一个很不错的功能,用户可以迅速从PDF,图像或名片中抓取文字。但对那些严重依赖OCR的用户可能会失望,可能使用商业软件的解决方案结果更好。

   

文章内容来源于网络,不代表本站立场,若侵犯到您的权益,可联系多特删除。(联系邮箱:[email protected]