如何将图像/ PDF文本使用光学字符识别

阅读时间:4分钟。

通常很难输入,格式,重新设计的文档只能扫描图片或文件。这是更容易使用光学字符识别(OCR)

光学字符识别 光学字符识别

通常很难输入,格式,重新设计的文档只能扫描图片或文件。这是更容易使用光学字符识别(OCR)技术,将图像或PDF文件转换成可编辑的文件。

如果你想将一个图像文件,PDF,手写文档或扫描文件,这不是可编辑使用本机工具在Windows上,您可以使用在线服务自动为你工作。雷竞技下载iOS地址这样就可以节省你的时间和麻烦的手动改写整个文本编辑器。

继续阅读这篇文章,学习如何一个uneditable文档转换为一个可编辑的文件。

光学字符识别(OCR)是什么

光学字符识别,也被称为光学字符阅读器,或是image-to-text转换器,是硬件和软件的结合技术,扫描文档,然后分配字符匹配的源文档中可用。

OCR扫描文档时,文档将被转换成机器语言,使用OCR识别和指定字符从文档中扫描形状。

如今,OCR技术有不同的形式。一些在线资源上传文件转换成纯文本或下载文本文件,虽然也有各种可用硬件购买扫描文本复印件以及将它们转换成数字内容。

互联网
一个OCR笔在纸上文字转换为数字文本

OCR是如何工作的

OCR执行一系列不同的任务将数据从一种形式转换成文本。下面的步骤描述了工作流的OCR技术:

  1. OCR首先扫描文档和光明与黑暗之间的区别对比。
  2. 相关文档的深色区域然后字母表字符使用下列2算法之一:
    • 模式识别:扫描字符、字或块文本相比,现有的文本数据库中各种语言和字体匹配模式。
    • 扫描的功能检测:一个特定的特征性格,词或块文本比较数据库中列出的现有功能。例如,一个特定的字符的一个特征可能的数量成角的线条,线条之间的角度等。
  3. 一旦字符和单词匹配,他们处理和转换为ASCII代码。一个ASCII代码是一种国际公认的编码标准,并分配一个惟一的代码到一个特定的角色。电脑可以使用这个来执行任何任务。

我们正在讨论,OCR使用生成的ASCII代码将光明与黑暗的模式转换成纯文本,以便它可以被编辑。

现在让我们向您展示如何将一个图像或一个PDF文件中提取它的文本,然后你如何使用它。

在线OCR服务雷竞技下载iOS地址

OnlineOCR.Net

OnlineOCR.net是一个免费的、基于web的OCR,你可以上传你的文档作为一个图像或PDF文件,然后将它转换成一个Word文档(文档/多克斯文件),纯文本,或者一个Excel表(xlsx)。

遵循下面的步骤来将文档转换为一个可编辑的文件:

  1. 开放onlineocr.net使用任何网络浏览器。
  2. 点击选择文件然后浏览到你想要的文档转换和选择它。
    选择3
  3. 现在你选择的语言文件上传从下拉菜单。请注意,这也将输出文本的语言,既不能是不同的。
    朗
  4. 现在选择的输出格式转换后的文件从下拉菜单。你可以选择从Microsoft Word,纯文本,Microsoft Excel。
    输出
  5. 当被选中,点击转换
    转换1

要时刻把文档的工具。输出文件时,您可以下载点击链接,或复制下面的纯文本的文本字段。

下载6
文档转换使用onlineocr.net

下载后,您将看到该工具转换大部分的上传的文本文档转换为一个可编辑的。下面是一个文件的一个例子,我们转换。

比较
转换后的文档(左)与上传扫描文件(右)

从上面的例子可以看出,大多数文本的转换。然而,由于输出文件不是百分之一百,我们仍需仔细检查错误。

此外,onlineocr.net还维护当一个JPG文件的格式转换为一个多克斯文件。

NewOCR.Com

NewOCR.com是另一个免费的基于web的工具,可以将扫描文档和图像转换成数字的文本。但是,与OnlineOCR.net, NewOCR.com不维护文件格式,但只提供转换文本。

这个过程将一个文件几乎是一样的:

  1. 打开NewOCR.com网站在任何web浏览器。
  2. 点击选择文件并选择你要转换的文件。
    选择3
  3. 现在点击预览
    预览
  4. 点击光学字符识别开始转换过程。
    光学字符识别
  5. 向下滚动并下载转换后的文本下载下拉菜单,或者只是复制在下面的文本框中纯文本。
    下载2 1

你现在有image-to-text。你也可以使用这个文本翻译成其他语言谷歌翻译选项卡可直接从NewOCR.com网站。

封闭的思想

使用OCR技术目前可用,您可以转换您的扫描图像和文本和编辑其他文件请您。你不再需要从头重写冗长的文档。

网上还有其他OCR工具,我们没有清单。这是因为OnlineOCR和NewOCR目前最好的正确可用的最大数据转换为文本。一些工具只是上传文档粘贴到Word / Excel文件,这是对我们没有好处。

推荐给你

留下一个回复

Baidu
map