macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序

文本和位图图像是两种不同的动物。可以键入、编辑、复制、粘贴、删除和处理文本。然而,图像是网格中的一堆像素,它们以正确的方式组合以传达某种信息:它们类似于照片、插图或渲染的文本。那么两人可以在哪里相遇呢?

光学字符识别 (OCR) 是我们从图像中提取文本的名称。但随着软件越来越多地自动尝试识别图像中的文本并使其可搜索并通常可用于复制,该术语已经失宠。

如果您尝试访问您拥有的图像中的文本,无论是文档、照片还是表格,您有许多可用的选项。这些类型还包括带有未插入或提取文本层的扫描图像的 PDF。您可能已经拥有以下服务之一的免费帐户或付费订阅或拥有该软件。

在研究本文时,我测试了一系列图像和文档,证明它们在每个服务或应用程序中都相当一致。为了清楚地展示我的结果的并排比较,我从 1920 年代的大众机械文章(关于连环画制作)中复制了识别结果与同一份清晰排版的杂志副本。您可以在下面看到每个应用程序或服务的数字。您可能不会对 1920 年代的杂志文章执行文本提取——也许是,如果您像我一样!——但源文本的轻微退化性质和扫描质量使服务和软件经受了比原始渲染排版。

我的测试涉及使用 macOS Monterey 的公开测试版。此外,Apple 在 macOS Monterey 预览网站上以脚注形式指出需要 M1。在 macOS Monterey beta 4 中,Apple 在 Intel Mac 上启用了实时文本功能。

PDFpen 和 macOS Monterey 的实时文本表现得非常准确。OneNote,一旦微软执行了它的延迟识别,也非常接近这两个。Evernote 会在您键入时在文本中显示匹配项,并且看起来可以与 Monterey 和 PDFpen 相媲美。这四个都比 Acrobat 和 Google Docs 要好得多,后者的结果令人尴尬。

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序
我针对 1920 年代 Popular Mechanics 文章中页面扫描的第二列测试了所有这些应用程序和服务。

Safari 和照片中的 macOS Monterey 实时文本

在即将发布的 macOS 12 Monterey(以及 iOS 15 和 iPadOS 15)中,Safari 会在您查看图像时自动识别网页和“照片”应用中图像中的文本。您可以选择并复制该文本。该功能需要 Apple 的神经引擎,可用于 M1 Apple silicon Mac 和配备 A12 Bionic 芯片或更高版本的手机,该引擎于 2018 年开始出现在部分 iPhone 和 2019 年的部分 iPad 中。您可以使用公开测试版对此进行测试。它做得很好。

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序
Monterey 让您可以将鼠标悬停在 Safari、照片和快速查看中的图像上,并在插入光标出现的任何地方选择文本。结果近乎完美。

Adobe Acrobat Pro DC

在 Acrobat Pro DC 中打开 PDF 通常会自动启动文本识别。完成后,您可以选择要复制的任何文本范围。Acrobat 中的 OCR 是完整 Creative Cloud 订阅的一部分(每月 52.59 美元至 79.49 美元),Adobe 也提供特定于 Acrobat 的计划(每月 14.99 美元至 24.99 美元)。然而,结果并不好。

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序
尽管经过数十年的发展,Acrobat 的 OCR 产生的结果仍低于可接受水平,并且比本次测试中的四个更好的选项差得多。

印象笔记

Evernote 对导入到服务中或通过移动设备的相机捕获的嵌入图像的任何图像或 PDF 执行 OCR。这使得文本完全可搜索,但莫名其妙地不允许您复制已识别的文本。(但是,导出的 PDF 需要添加文本层。)免费层允许在图像中搜索文本;使用 PDF 进行搜索需要付费层级(每月 7.99 美元),无论它们包含文本还是由 OCR 提取的文本。

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序
Evernote 不允许提取,但你可以在图像内搜索并查看有助于估计准确性的结果。

Google 云端硬盘和 Google 文档

提供免费层和付费层,您可以通过桌面上的 Google 云端硬盘或网络浏览器将 PDF 或图像上传到 Google 云端硬盘。然后在 Google 文档中打开该文件。此操作导入图像或 PDF 并粘贴提取的文本,格式如下。如您所见,该服务的性能根本不佳。

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序
Google Docs 没有捕捉到很多单词。

微软 OneNote

OneNote 会自动检查粘贴到 OneNote 页面的任何图像中的文本。按住 Control 键并单击图像,然后选择从图片中复制文本。然而,Microsoft 指出,“OCR 文本识别过程是一个非常复杂的过程,它使用 Microsoft 在线服务,因此在您控制- 点击图片。”考虑到苹果、谷歌和第三方应用程序可以即时执行 OCR,也许 OneNote 是滞后的,但结果非常好。OneNote 是 Microsoft 365 订阅的一部分。

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序
从 OneNote 复制的文本不会在应用程序中显示结果,但显示出近乎完美的识别。

PDF笔

PDFpen 是一款出色的 PDF 应用程序。要在 PDFpen 中隐藏文本,请选择“编辑”>“OCR 页面”或按住 Option 并选择“编辑”>“OCR 文档”。如果存在现有的 OCR 文本图层,您必须先通过页面/文档中的编辑 > 清除 OCR 图层来清除它们。PDFpen 有普通版(79.95 美元)和专业版(129.95 美元)。它在我的测试中所做的工作令人印象深刻。

macOS Monterey 中的实时文本破坏了这些付费文本提取应用程序
PDFpen 产生了近乎精确的转换,对于由一家比这些竞争对手中的任何一家都小得多的公司开发的产品来说令人印象深刻,除了 Evernote。
THE END