V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
areless
V2EX  ›  程序员

有没有什么办法识别上面图片的文字,并且贴出实现方法

  •  
  •   areless · 2019-10-13 10:46:55 +08:00 · 3402 次点击
    这是一个创建于 1650 天前的主题,其中的信息可能已经有所发展或是发生改变。

    图片地址: https://s2.ax1x.com/2019/10/13/ujoBp4.jpg

    我测试了一些 OCR 都是下面这样的: 对 这 K 柃 式 的 资 料 进 行 編 辑 蚜 ; 读 笮 ® ,看句不错的文章级落想、令做书摘雯记,©

    第 1 条附言  ·  2019-10-13 11:57:21 +08:00
    第 2 条附言  ·  2019-10-13 16:24:23 +08:00
    22 条回复    2019-10-14 11:35:18 +08:00
    zushi000
        1
    zushi000  
       2019-10-13 10:57:05 +08:00
    qq 自带得截图就能识别 我试了正确率非常高
    silencefent
        2
    silencefent  
       2019-10-13 11:00:04 +08:00
    有办法,给出你能给的价格
    areless
        3
    areless  
    OP
       2019-10-13 11:06:07 +08:00
    @zushi000 真的吗?截图过来瞧瞧
    fredcc
        4
    fredcc  
       2019-10-13 11:09:11 +08:00 via Android
    aitaii
        5
    aitaii  
       2019-10-13 11:09:15 +08:00 via iPhone
    -
    0
    X
    V Document
    <>C
    ①127.0.0.1/ab/test.html
    Q★■|日|
    意思,例如在工作中,要应对大量的纸质文
    件.书刊杂志、PDF 格式的电器识别文字的
    意思,例如在工作中. 要应对大量的纸质文
    件、书刊杂志 PDF 格式的电器识别文字的
    意思,例如在工作中,要应对大量的纸质文
    件、书刊杂志、PDF 格式的电子资料,很难
    对这些格式的资料进行编辑和整理;读书时
    看到不错的文章段落想要做书摘笔记,但
    又懒得去打字或是手抄整理,手 动转录图片
    或者 PDF 上的文字既耗时又耗力,这些难题,
    通过 OCR 就可以解决。中常出现的问题,希
    望大家能小意一些,另外我们没有办法在购
    买所有字体,就算你实力雄厚,那也没有办
    法在-台服务器主於上放置你所有项月需更
    员 D | Elements
    Console
    Sources
    Network

    A4
    日 0|top
    Filter
    Default levels▼
    doss()
    whyou126
        6
    whyou126  
       2019-10-13 11:11:46 +08:00 via Android
    Google Lens
    areless
        7
    areless  
    OP
       2019-10-13 11:15:33 +08:00
    @zushi000 QQ 的确能识别部分。升级
    @fredcc @whyou126 难度加一
    图片地址
    https://s2.ax1x.com/2019/10/13/ujqowR.jpg
    zushi000
        8
    zushi000  
       2019-10-13 11:23:13 +08:00   ❤️ 1
    最新版 qq pc 版 自己试一下就晓得了 的确很高的识别率
    areless
        9
    areless  
    OP
       2019-10-13 11:48:32 +08:00
    @zushi000
    谢谢,识别率的确很高

    简单的加了一个杂色背景:
    https://s2.ax1x.com/2019/10/13/ujjKAA.jpg

    测试结果如下:
    https://s2.ax1x.com/2019/10/13/ujvyGt.jpg

    想看看 Google len 的情况
    @fredcc
    图片地址:
    https://s2.ax1x.com/2019/10/13/ujjKAA.jpg
    fredcc
        10
    fredcc  
       2019-10-13 12:00:39 +08:00 via Android   ❤️ 1
    qcgzxw
        11
    qcgzxw  
       2019-10-13 12:24:02 +08:00
    腾讯云 OCR 手写体识别

    [

    y

    V Document

    X

    +

    <>

    C

    0127.0.0.1/ab/test.htmI

    @你

    o

    意思,例如在工作中,要应对六量的纸质文

    件、书刊杂志、pDF 格式的电器识别文字的

    意思,例如在工作中,要应对大量的纸质文

    件、书刊杂志 PDF 格式的电器识别文字的

    意恶,例如在工作中,要应对大量的纸赁文

    件、书刊杂志、PDF 格式的电子资料,很难

    对这些格式的资料进行编辑和整理;读书时

    看到不错的文章段落想要做书摘笔记,但

    又懒得去打字或是手抄整理,手动转录图片

    或者 PDF 上的文字既耗时又耗力,这些难题

    通过 0CR 就可以解)决。中常出现的问题,希

    望大家能小意一些,另外我们没有办法在购

    买所有字体,就算你实力雄厚,那也没有办

    头在一台服务器卞上於置你所有项日雲更



    Elements

    ( onsole

    Sources

    Network



    A4



    top

    0

    Filter

    Default levels y

    doss()

    362

    test. html : 79
    miaomiao888
        12
    miaomiao888  
       2019-10-13 13:16:44 +08:00
    20015jjw
        13
    20015jjw  
       2019-10-13 14:19:24 +08:00
    Lens 直接对着屏幕拍都能识别大部分...
    chinvo
        14
    chinvo  
       2019-10-13 14:23:13 +08:00
    你这样搞,都已经影响正常阅读了
    areless
        15
    areless  
    OP
       2019-10-13 14:25:14 +08:00 via Android
    @miaomiao888
    @20015jjw
    @qcgzxw
    第二张啊,识别新地址那张。第一张 qq google 都能识别啊。

    第二张 google.qq 都不行了。搜狗 ocr 试试第二张
    miaomiao888
        16
    miaomiao888  
       2019-10-13 14:39:26 +08:00
    @areless 第二张人眼都不好辨别了,试了七八个 OCR,只有网易的还能看
    i.loli.net/2019/10/13/XwG6MUtQrop7EHj.jpg
    20015jjw
        17
    20015jjw  
       2019-10-13 14:41:53 +08:00
    @areless 我就是用的绿底那张,基本全对.. Google Lens
    reus
        18
    reus  
       2019-10-13 15:58:26 +08:00
    这下你知道人工智能的厉害了吧
    什么人类能识别机器不能识别
    做梦!
    areless
        19
    areless  
    OP
       2019-10-13 16:13:58 +08:00
    @miaomiao888
    前一前二我没扭曲文字,这样定位到的字还是准确的。小参数扭曲文字这一步之后,OCR 基本都没用了。
    https://s2.ax1x.com/2019/10/13/uv6Ow4.jpg

    @reus 仔细研究研究
    @20015jjw 上面也有人用 google lens 已经,从第二张图就开始错了啊。扫下来截图瞧瞧,我有新版的。
    https://s2.ax1x.com/2019/10/13/uv6DJI.jpg
    hafuhafu
        20
    hafuhafu  
       2019-10-14 08:18:03 +08:00
    意思,例如在工作中,要应对大量的纸质文
    件、书刊杂志、pDF 格式的电器识别文字的
    意思,例如在工作中,要应对大量的纸质文
    件、书刊杂志、PDF 格式的电器识别文字的
    意思,例如在工作中,要应对大量的纸员文
    件、书刑杂志、PDF 格式的电子资料,很难
    对这些格式的资料进行编辑和整理;读书时
    看到不错的文章段落想要做书摘笔记,但
    又懒得去打字或是手抄整理,手动转录图片
    或者 PDF 上的文字既耗时又耗力,这些难题
    通过 OCR 就可以解决。中常出现的问题,希
    望大家能小意一些,另外我们没有办法在购
    买所有字体,就算你实力雄厚,那也没有办:
    決在一台服务器主析上放置你所有项日雲更

    QQ 自带的识别还是可以的。
    areless
        21
    areless  
    OP
       2019-10-14 08:49:00 +08:00 via Android
    @hafuhafu 附言里最后一张试一下。杂点让行判断失效,简单的扭曲字体让单体字识别失效。然后再用捕获到的行车记录仪 mjpg 拆帧 lsb 隐写,账号就是隐写的 key,mod key 等于 0 就是非隐写位~~~完美
    qcgzxw
        22
    qcgzxw  
       2019-10-14 11:35:18 +08:00
    目测卤煮要做防图片识别......
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5299 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 62ms · UTC 07:59 · PVG 15:59 · LAX 00:59 · JFK 03:59
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.