V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
WhoCanBeRich
V2EX  ›  问与答

请教一下做音视频的老哥们关于一些业务上的问题

  •  
  •   WhoCanBeRich · 2023-03-25 22:06:18 +08:00 · 790 次点击
    这是一个创建于 399 天前的主题,其中的信息可能已经有所发展或是发生改变。

    老铁们好,iOS 开发工作 1.5 年了,想额外做一些更有深度的事情, 最近和组里的前辈们聊天,他们大致给我选出了可以钻研 [音视频合成压缩] 合成这块领域。

    针对这块领域,我有如下几个问题,想问问 V 友们:

    1. 音视频合成压缩这块可以从哪里开始学习呢?我看好像很少有系统的资料,基本都是介绍 ffmpeg api 的
    2. 自己研究出一套压缩算法,相比系统提供的压缩 api 可以更快的压缩是有可能实现的吗?
    4 条回复    2023-03-26 16:07:52 +08:00
    Aloento
        1
    Aloento  
       2023-03-25 22:09:06 +08:00   ❤️ 1
    1 ,音视频压缩直接去看各种算法的实现就行了
    2 ,悬,要快还得硬件加速,还得看压缩质量和执行效率,FB 去年开发了一个用 AI 压缩音频的算法,可以把音频压缩到 8kbps 但依旧保留能挺得过去的质量。
    WhoCanBeRich
        2
    WhoCanBeRich  
    OP
       2023-03-25 22:16:42 +08:00   ❤️ 1
    @Aloento 多谢老哥回复(已感谢)。
    和组内前辈聊天的时候他们也有说过把 AI 和压缩算法合并的方案,但一旦引入 AI 总感觉会出现各种不确定性。
    另外请教一下您认为音视频这块还有哪些领域可以进一步深入呢?
    Aloento
        3
    Aloento  
       2023-03-26 03:29:58 +08:00
    @WhoCanBeRich #2 现在能玩的编码方式都基本快到头了
    而且吧,FB 那个 AI 效果其实很好的,你可以去看看
    https://github.com/facebookresearch/encodec
    我个人感觉这个是趋势,AV1 + OPUS ,或者 AI
    WhoCanBeRich
        4
    WhoCanBeRich  
    OP
       2023-03-26 16:07:52 +08:00
    @Aloento 好的 谢谢
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5304 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 09:35 · PVG 17:35 · LAX 02:35 · JFK 05:35
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.