V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
quietjosen
V2EX  ›  分享创造

有了 iText:你截图,腾讯、Google OCR 帮你识别文字 [送码]

  •  1
     
  •   quietjosen ·
    atjason · 2017-11-30 07:32:21 +08:00 · 15749 次点击
    这是一个创建于 1830 天前的主题,其中的信息可能已经有所发展或是发生改变。

    比如,在看类似上面的扫描版 PDF 时,想要复制其中的文字,怎么办?手打?太累。试试我新开发的工具 iText 吧。

    iText 是 macOS 平台的 OCR 工具,自带截图功能,选择屏幕任意区域,即可识别其中的文字,又爽又酷。

    识别后的文字已经复制到系统剪贴板,直接粘贴即可。

    配合 ⇧⌘1 快捷键,使用体验更佳。当然,你也可以选择图片文件,或者将图片拖拽至 iText 的菜单栏图标进行识别。

    文字识别精准

    你有没有这种印象:OCR 识别出来的文字有很多问题,还不如自己打字来得快。可见,识别的准确性非常重要,也是我非常在意的一点。

    2.1. 腾讯、Google 双引擎

    首先,我排除了离线的识别库,因为离线注定了这些库的识别能力是死的,不会自己增强。接下来,在一票在线 OCR 服务中,我对比了百度、腾讯、微软、Google 等大厂的产品,最后选择了国内使用腾讯、国外使用 Google 的组合。判断依据是什么?少量测试 + 主观倾向,比如不测我就觉得 Google 比微软牛。

    那么,到底识别准不准呢?这么说吧:

    • 对于一般的自然语言,比如书中的一段话、新闻稿,识别效果是惊人的准确,甚至可以达到 100%
    • 对于排版复杂、尤其有特殊字符的文字,比如程序代码、选择题,识别效果就不太理想,需要手动对识别后的结果进行修正
      • 比如,单纯地给一个竖线,机器是无法区分到底是小写的 l、还是大写的 I (顺便问一下,你看出二者的区别了吗?);与之相对,机器是需要根据上下文进行判断和优化的。而像程序代码这种非自然语言,机器目前是很难进行语义识别的

    到底准不准?你不妨一试。

    2.2. 独创算法,进一步优化识别结果

    OCR 服务还有一些欠缺,iText 针对性地做了这些优化:

    • 自动识别段落
    • 中文环境使用全角标点符号
    • 中文与英文字母、数字间增加空格
    • 删除中文字符间、英文字符与标点符号间的多余空格
    • 英文首字母大写

    如果你发现识别不好的地方,欢迎把图发给我,我会相应地优化算法,毕竟算法是需要数据喂养的,先谢。

    2.2. 预览原图,方便校对

    在目前 OCR 技术不能始终达到 100% 的情况下,预览原图、并进行修正,还是有必要的。在 iText 中,你可以这样:

    • 将识别后的窗口拖到图片附近
    • 调用 iText 识别结果的 双栏模式:左侧展示图片、右侧展示识别后的文字

    这样,就可以很方便地对照原图进行手动优化识别后的文字。

    3. 下载与付费

    其实,很多场景都会用到 iText,比如 识别快递单上的号码、图片中的联系人信息、需要登录才能复制的网页 等等,欢迎下载 iText 试试。

    每月可免费识别 20 次,订阅 iText 高级版即可无限次识别。首发期间,高级版限时 6 折优惠:¥ 3/月、¥ 30/年。关于收费模式,我很是纠结了一番。如果你准备吐槽,请先看下这篇文章再次纠结付费模式,这次是 iText

    V 友专属福利:iText Pro 一年期兑换码:

    JAY9T73KR4TP
    TFA6KWKTRW4E
    KY639HYMWMPH
    T6LRJ77HR7JT
    HFJMKT39J6F7
    

    手慢无;兑换后,最好在这里留言说明哪个已经用了,节约其他 V 友时间。


    如果你觉得 iText 还不错,还请帮忙 在 App Store 评论;如果你觉得 iText 还可以改进,欢迎:

    82 条回复    2017-12-08 08:44:38 +08:00
    liz2nku
        1
    liz2nku  
       2017-11-30 07:35:35 +08:00 via iPhone
    好顶赞,感觉近期用不上所以码就不领了,留给后来的同学
    quietjosen
        2
    quietjosen  
    OP
       2017-11-30 07:43:10 +08:00
    @liz2nku 大气👍
    chenxu
        3
    chenxu  
       2017-11-30 07:50:11 +08:00 via Android
    路过帮顶,这软件看着很牛逼,不过我暂时用不上。兑换码就留给楼下吧。
    Jobin0528
        4
    Jobin0528  
       2017-11-30 07:57:55 +08:00
    感谢分享!
    HFJMKT39J6F7
    已用。
    wweih
        5
    wweih  
       2017-11-30 08:01:18 +08:00 via Android
    没有 window 版本
    dickmrbean
        6
    dickmrbean  
       2017-11-30 08:02:34 +08:00
    T6LRJ77HR7JT 已用,感谢!
    Jobin0528
        7
    Jobin0528  
       2017-11-30 08:09:26 +08:00
    为什么美区价格依然 0.99/m;9.99/y.
    zhang1215
        8
    zhang1215  
       2017-11-30 08:17:16 +08:00
    这款软件看起来很棒,留给急需的同学
    7gong
        9
    7gong  
       2017-11-30 08:18:45 +08:00 via iPhone
    码不领了,帮赞
    aksoft
        10
    aksoft  
       2017-11-30 08:25:29 +08:00   ❤️ 1
    不支持 windows 就是耍流氓。。。
    xingwing
        11
    xingwing  
       2017-11-30 08:26:35 +08:00
    JAY9T73KR4TP,已用,感谢
    miniers
        12
    miniers  
       2017-11-30 08:30:50 +08:00
    TFA6KWKTRW4E 已用。感谢楼主😍
    quietjosen
        13
    quietjosen  
    OP
       2017-11-30 08:30:52 +08:00
    @Jobin0528 咦,奇怪,我 28 小时前就在 iTunes 后台改过价格了,现在还没更新?可能是时差问题,美国时间还没到 30 号,可以再等等。
    dongming83
        14
    dongming83  
       2017-11-30 08:31:04 +08:00
    JAY9T73KR4TP 已用,谢谢
    xingwing
        15
    xingwing  
       2017-11-30 08:41:14 +08:00
    naiba
        16
    naiba  
       2017-11-30 08:42:31 +08:00 via Android
    真的是优化了算法吗,还是对 ocr 接口返回的结果简单的进行了中文版式优化。要我都不敢把这种小儿科的东西发出来😁
    caidaoli
        17
    caidaoli  
       2017-11-30 08:50:16 +08:00
    试了一下确实很不错
    quietjosen
        18
    quietjosen  
    OP
       2017-11-30 08:51:51 +08:00
    @naiba 没事,你发出来吧。
    quietjosen
        19
    quietjosen  
    OP
       2017-11-30 08:52:16 +08:00
    @caidaoli 谢谢肯定 🤝
    douglas1997
        20
    douglas1997  
       2017-11-30 09:07:06 +08:00
    已买,感觉是不错的软件。谢谢作者。价格已经很便宜了,给你点赞。希望开发出更好的工具。
    记得好像把 iPic, iPaste 都买了。
    quietjosen
        21
    quietjosen  
    OP
       2017-11-30 09:18:40 +08:00
    @douglas1997 谢谢肯定,我一直在坚持,iText 已经是第 7 款 macOS App 了😀
    zjia8765
        22
    zjia8765  
       2017-11-30 09:24:27 +08:00
    试用了下,不错,赞一个
    quietjosen
        23
    quietjosen  
    OP
       2017-11-30 09:26:24 +08:00
    @zjia8765 谢谢,努力得到肯定,开心 😀
    WhiteSJ
        24
    WhiteSJ  
       2017-11-30 09:31:03 +08:00
    很不错, 赞一个
    newbieo0O
        25
    newbieo0O  
       2017-11-30 09:31:59 +08:00
    挺方便的。
    seasstyle
        26
    seasstyle  
       2017-11-30 09:33:01 +08:00 via iPhone
    谷歌大法好!
    上次用谷歌的翻译 api 翻译了一个 5400 行 9 列的表格,那速度和质量灰常好!
    January
        27
    January  
       2017-11-30 09:46:39 +08:00
    赞,试用一段时间看看。
    isCyan
        28
    isCyan  
       2017-11-30 09:53:13 +08:00 via Android
    能对比下 Google 和微软的识别效果吗。微软必应的翻译 API 质量是显然高于谷歌的。不知道 OCR 是否也是如此。
    Humorce
        29
    Humorce  
       2017-11-30 10:08:10 +08:00 via iPhone
    建议是可以采用多种付费方式,
    一天用 100 次,包月不亏,
    装上去留着备用,一个月都不见得能用几次。
    chinajik
        30
    chinajik  
       2017-11-30 10:13:23 +08:00
    KY639HYMWMPH 已用
    quietjosen
        31
    quietjosen  
    OP
       2017-11-30 10:17:30 +08:00
    quietjosen
        32
    quietjosen  
    OP
       2017-11-30 10:17:49 +08:00
    @WhiteSJ
    @newbieo0O
    @January 谢谢支持。
    joe1213
        33
    joe1213  
       2017-11-30 10:19:01 +08:00
    iText 跟那个处理 pdf 的软件不是重名了吗
    quietjosen
        34
    quietjosen  
    OP
       2017-11-30 10:19:51 +08:00
    @isCyan 并不能。因为如果提供客观公正的结论,要做大量的测试,我做不到,不能随便下结论;并且,云服务是在不断变化的。

    不过,你提供一张具体的图,我是可以给出二者的识别结果的。
    LarryDev
        35
    LarryDev  
       2017-11-30 10:20:17 +08:00
    已设为开机启动
    quietjosen
        36
    quietjosen  
    OP
       2017-11-30 10:20:32 +08:00
    @humorce 「装上去留着备用,一个月都不见得能用几次。」 iText 默认每月可免费识别 20 次,像你说的够用了。
    quietjosen
        37
    quietjosen  
    OP
       2017-11-30 10:21:12 +08:00
    @joe1213 不管,我就喜欢 😂 主要是跟我 i 系列的名字一致。要起个好的、又全球唯一的名字,几乎不可能。
    quietjosen
        38
    quietjosen  
    OP
       2017-11-30 10:21:30 +08:00
    @LarryDev 最实在的支持 👍
    rexer
        39
    rexer  
       2017-11-30 10:24:19 +08:00 via Android
    想入手 可惜没有 mac
    newbieo0O
        40
    newbieo0O  
       2017-11-30 11:12:07 +08:00
    wri t e

    wh i 1 e

    a, b=0,1

    -----------

    逗号会识别成中文全角的情况
    quietjosen
        41
    quietjosen  
    OP
       2017-11-30 11:37:46 +08:00
    @newbieo0O 你是尝试识别程序代码吗?文中有提,这种情况识别不好。对于自然语言比较好些。
    linKnowEasy
        42
    linKnowEasy  
       2017-11-30 11:48:16 +08:00
    支持楼主, 现在 Mac 开发人员感觉还是很少啊
    quietjosen
        43
    quietjosen  
    OP
       2017-11-30 12:00:55 +08:00
    @linKnowEasy 跟 iOS 没法比,目测 1% 不到。
    sangmong
        44
    sangmong  
       2017-11-30 13:31:05 +08:00
    有没有 iOS 版
    quietjosen
        45
    quietjosen  
    OP
       2017-11-30 13:37:18 +08:00
    @sangmong 没; iOS 其实有很多选择,比如「白描」
    FaiChou
        46
    FaiChou  
       2017-11-30 13:43:39 +08:00
    老哥 稳
    suliuyes
        47
    suliuyes  
       2017-11-30 14:26:19 +08:00
    支持独立开发者。话说,老哥你除了 v 站,在别的地方有推你的应用吗?只靠 v 站网友应该养不活自己吧?
    quietjosen
        48
    quietjosen  
    OP
       2017-11-30 14:39:50 +08:00
    @suliuyes 微博、知乎等等吧,你觉得还在哪推荐比较好呢?
    ayconanw
        49
    ayconanw  
       2017-11-30 16:09:23 +08:00
    什么时候出 windows 版
    tianyuhong
        50
    tianyuhong  
       2017-11-30 16:29:56 +08:00
    订阅支持下你
    quietjosen
        51
    quietjosen  
    OP
       2017-11-30 16:39:01 +08:00
    @ayconanw 抱歉,短期无计划。
    hester
        52
    hester  
       2017-11-30 16:39:07 +08:00
    iText 名字也忒不符了。。。还不如叫 iOCR。。。
    既然使用了第三方库,很好奇这些库的授权协议是什么。。。
    在线上传的话,隐私性会很有问题。。。
    都是公司文件截图、发票截图之类的。。。基本上不敢这么用。
    另外,我个人觉得一个 chrome extension 就能搞定的事情,非要弄个订阅。。。这种小型工具就应该一次性付费。。。

    最后的最后,兑换码也忒抠了,虽然我不用,但是你可以看看其它 在这里发布 app 的作者,他们的兑换码有多少个。。。
    quietjosen
        53
    quietjosen  
    OP
       2017-11-30 16:39:18 +08:00
    @tianyuhong 谢谢老铁 🙏
    quietjosen
        54
    quietjosen  
    OP
       2017-11-30 16:51:33 +08:00
    @hester 名字偏好各有所好。隐私协议可见于腾讯和 Google 的声明。关于付费,请参见文末的介绍及链接。期待你的
    Chrome Extension。对,我很抠。
    hanzichi
        55
    hanzichi  
       2017-11-30 17:44:42 +08:00
    顶一个,用过楼主的 iPic,很好用

    能否借地问楼主一个问题,macOS 开发零基础,我想做个工具自己用,具体只有两个需求(都是 BetterTouchTool 里的功能)

    1. 三个手指 click trackpads,触发 win+w (也就是关闭)
    2. 两个手指,一个手指按住,另一个轻点,触发另一个快捷键

    先谢过了
    iyaozhen
        56
    iyaozhen  
       2017-11-30 17:48:41 +08:00 via Android   ❤️ 2
    @hester 楼主调用识别接口也是要付费的。

    公司业务肯定不方便使用,楼主这个主要也是 to C 的吧
    linxijun
        57
    linxijun  
       2017-11-30 18:16:42 +08:00
    @quietjosen 兑换码用完了??
    quietjosen
        58
    quietjosen  
    OP
       2017-11-30 18:27:16 +08:00
    @hanzichi 我没有这部分直接的开发经验哎,看看 NSEvent 相关的介绍吧。
    quietjosen
        59
    quietjosen  
    OP
       2017-11-30 18:28:15 +08:00
    @iyaozhen 感谢,你说了公道话。
    quietjosen
        60
    quietjosen  
    OP
       2017-11-30 18:28:34 +08:00
    @linxijun 上面的回复一看便知。
    dai269619118
        61
    dai269619118  
       2017-11-30 18:31:43 +08:00
    良心楼主 工具非常好用 价格还这么低
    Kei
        62
    Kei  
       2017-11-30 18:40:48 +08:00
    識別不了日語呢 = =
    提供例子: ありがとう
    hester
        63
    hester  
       2017-11-30 18:49:27 +08:00
    @iyaozhen
    原来如此,感谢告知~

    @quietjosen
    我不会 chrome extension,我只是认为没必要单独做一个 app,正如你认为有必要做一样。
    只是很反感还是订阅,尤其是纯工具类的。。。
    话说,从你的文章就能看出‘‘我是独立开发者,我很不容易,所以花你点钱用订阅制,能支撑我继续独立开发者’’这种味道。。。独立开发者做的 app 就应该是订阅制吗?这跟创业型公司 = 加班 岂不是一个道理?

    说话直,别见怪,只是看不惯这些乱七八糟的怪现象。。。
    quietjosen
        64
    quietjosen  
    OP
       2017-11-30 18:53:54 +08:00   ❤️ 1
    @Kei 终端运行下面的命令,强制使用 Google ;之后会在菜单中提供入口。

    defaults write ~/Library/Containers/net.toolinbox.iText/Data/Library/Preferences/net.toolinbox.iText.plist OCRService "Google"
    quietjosen
        65
    quietjosen  
    OP
       2017-11-30 18:56:22 +08:00
    @hester 还是先看下我文末关于付费模式的思考吧。「从你的文章就能看出」,我并不能理解你推理的逻辑;你得到的苦情结论,是你想得出的结论。比如,你看看#61 楼的回复,并不是每个人都有相同的理解。
    linxijun
        66
    linxijun  
       2017-11-30 19:02:02 +08:00
    @quietjosen 懂了。。。。。
    hanzichi
        67
    hanzichi  
       2017-11-30 19:03:30 +08:00
    @quietjosen 🙏谢谢
    Kei
        68
    Kei  
       2017-11-30 19:12:57 +08:00
    SquirrelMAN
        69
    SquirrelMAN  
       2017-11-30 19:35:28 +08:00
    作者的各种作品,需求把握得都很到位。
    quietjosen
        70
    quietjosen  
    OP
       2017-11-30 19:37:22 +08:00
    @SquirrelMAN 其实也有无心插柳的成分;我正在写 iText 从头开始的完整经历,下周会在 GitChat 上发。
    SNOOPY963
        71
    SNOOPY963  
       2017-11-30 20:45:45 +08:00
    艺高心细

    日常帮顶
    quietjosen
        72
    quietjosen  
    OP
       2017-11-30 21:15:37 +08:00
    @SNOOPY963 谢谢支持 😀
    syhily
        73
    syhily  
       2017-11-30 22:54:30 +08:00
    iPic 一年后的续费价格让我离开。这次目测也是。
    puritania
        74
    puritania  
       2017-12-02 17:11:47 +08:00
    菜单栏图标太丑
    nine99
        75
    nine99  
       2017-12-03 16:45:36 +08:00
    支持
    jaylong
        76
    jaylong  
       2017-12-05 10:46:03 +08:00   ❤️ 1
    quietjosen
        77
    quietjosen  
    OP
       2017-12-05 13:30:50 +08:00
    @jaylong 既然你提了,我扔 2 张图,你试试段落识别吧。其他的细节和优化,我就不提了。




    以及我在做段落识别时的一些素材:

    luokr
        78
    luokr  
       2017-12-06 10:43:05 +08:00
    @syhily 哈哈楼主自己说了他是奸商
    hanzichi
        79
    hanzichi  
       2017-12-07 11:01:28 +08:00
    楼主,我又来请教了 ... 想入门 macOS 开发,网上搜了下资料好少,有没有推荐的网站或者书籍或者简单的 demo ? swift 语言

    楼主能不能分享下自己的入门经验呢 ... 跪谢
    quietjosen
        80
    quietjosen  
    OP
       2017-12-07 19:50:35 +08:00   ❤️ 1
    @hanzichi 我之前写过这篇文章:

    Mac 开发的神秘面纱:后娘养的嫡长子
    https://atjason.com/IndieDev/2017-07-18.html
    hanzichi
        81
    hanzichi  
       2017-12-07 20:45:35 +08:00
    @quietjosen 您推荐的那本书是只有英文版的嘛?
    quietjosen
        82
    quietjosen  
    OP
       2017-12-08 08:44:38 +08:00
    @hanzichi 我看的是英文版,中文版没了解过。
    关于   ·   帮助文档   ·   API   ·   FAQ   ·   我们的愿景   ·   广告投放   ·   感谢   ·   实用小工具   ·   2820 人在线   最高记录 5497   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 59ms · UTC 15:08 · PVG 23:08 · LAX 07:08 · JFK 10:08
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.