如果要将图片文字转为可复制、翻译的状态,通常会透过 OCR(光学字元辨识技术)进行处理,不过现在手机、平板电脑相簿都有内建 OCR 功能,例如 iPhone 可以直接选取相片上的文字、快速复制内文或翻译为其他语言,非常好用!甚至连去背都能在相簿上以拖曳方式做到,若使用者依然需要对图片或 PDF 进行文字识别,也有免费的线上工具或浏览器扩充功能可用。
本文要介绍「OLOCR」是一个免费的 OCR 文字识别工具,主要功能是让使用者将图片、PDF 传到浏览器进行辨识,也可快速汇出辨识後的结果,OLOCR 提供批次对图片或 PDF 进行文字识别转换为可选取、复制或汇出的格式,没有档案数量、大小、PDF 页数等限制,操作上也很简单,具备中文介面。
OLOCR 支援的语言包括英文、繁体中文、简体中文等各种常见语言(超过 70 种),也有历史记录功能随时可以回去查看辨识过的图片或文件,OLOCR 所有辨识过程都会在浏览器中进行,不会传输、保存任何图片和 PDF 文件,因此在隐私及安全性方面都不用担心。
依据最新的更新纪录显示,OLOCR 已经可以在 iOS 和 Android 浏览器使用,也针对较大的 PDF 或批次图片处理最佳化,以确保使用者获得更好的效果,另外,我也介绍过其他 OCR 工具,有需要也可试试看:
OLOCR
https://olocr.com/
使用教学
STEP 1
开启 OLOCR 网站後从侧边选取要使用的语言,支援的选项相当多,如果要识别繁体中文图片或 PDF 就选择「Chinese Traditional」、简体中文「Chinese Simplified」,以此类推。
STEP 2
接着点选图片、PDF 後找到要加入识别的图片文件,随即就会在 OLOCR 显示各个识别结果和精准度,依照不同的颜色、解析度或字型可能会有不同的识别结果(很多字以人眼看得出来,但是机器不一定会显示正确结果),使用者还是需要自行检查。
STEP 3
稍微测试了一下不同的中文图片和文件,OLOCR 确实能够在短时间内快速识别、将图片内容转为可复制的纯文字格式,但繁体中文的精确度好像就没有太高,或许英文、日文或其他语言的表现上会更好?使用者可自行测试看看。
在图片上点选右键就有复制文本或是复制全部选中的文本选项,也有将文字辨识结果汇出为 .txt 或 .json 格式功能。
值得一试的三个理由:
- 允许用户上传任意大小、数量的图片或 PDF,没有文件数量、大小等限制
- 支援超过 70 种常见语言的文字识别,包括英文、繁体中文、简体中文
- 所有辨识过程都在使用者的浏览器中完成,不会传输任何图片和 PDF 文件
分享本文FacebookTwitterPinterestLineCopy