V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
maitiantuzi
V2EX  ›  问与答

不懂就问:垂直领域小词汇量(纯数字)离线语音识别用什么技术

  •  1
     
  •   maitiantuzi · 2020-07-23 22:10:38 +08:00 · 1443 次点击
    这是一个创建于 1362 天前的主题,其中的信息可能已经有所发展或是发生改变。

    主要是整数和小数的识别,用什么开源框架训练,如何训练,准确率相对较高? 用过各大平台的离线识别,纯数字的识别率较低。

    8 条回复    2020-07-26 08:42:17 +08:00
    NullPoint
        1
    NullPoint  
       2020-07-23 23:31:08 +08:00 via Android
    同问文字方面的,中文书写,例如十一点三,这种,如何识别
    ooh
        2
    ooh  
       2020-07-23 23:42:03 +08:00
    离线识别估计有点难,刚刚试了试三爽录音机里面的语音转写,它有动态修正我试了下正常语速识别率 100%
    ooh
        3
    ooh  
       2020-07-23 23:56:28 +08:00
    @ooh 看了看离线识别里面的命令词好像也不适合你,查了下有个叫 https://github.com/kaldi-asr/kaldi 的项目可以看看,感觉可以满足你的需求
    gargar
        4
    gargar  
       2020-07-24 00:18:15 +08:00
    什么是“垂直领域”?
    fishCatcher
        5
    fishCatcher  
       2020-07-24 00:33:35 +08:00 via iPhone
    各大云平台的自学习模型服务可以自己训练?
    Coast
        6
    Coast  
       2020-07-24 08:49:55 +08:00 via iPhone
    在第一家公司就负责纯数字串的识别,因为是纯数字识别,语言模型可以固定,相对很小。识别准确率很高。通用的模型识别结果当然不如定制的
    maitiantuzi
        7
    maitiantuzi  
    OP
       2020-07-24 13:08:10 +08:00
    @Coast 请问主要用的什么框架呢
    Coast
        8
    Coast  
       2020-07-26 08:42:17 +08:00
    @maitiantuzi 基于 Kaldi 做的。不过其他的也都可以
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5422 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 30ms · UTC 07:16 · PVG 15:16 · LAX 00:16 · JFK 03:16
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.