发布时间: 2024-02-23 16:30:00
-
过去一周,OpenAI 的首个文生视频模型 Sora 占据了各大媒体的头条,特别是他们号称是物理世界模拟器,让许多人惊掉下巴。本期节目,我们邀请到了在 Diffusion 模型领域有多年研究经验的中国人民大学副教授李崇轩、AI 连续创业者和成,从学界和业界的角度聊聊 Sora 背后硬核的技术原理、他们的瓶颈、商业化的想象空间,以及这是否是代表着人类离 AGI 又进了一大步。
短短一年时间内,Sora 为什么能在视频生成效果上实现质的飞跃?Sora 所采取的技术路线,其背后的原理是什么?和其他文生视频模型相比,Sora 的模型又有哪些优势和劣势?未来,Sora 的落地应用场景可能会有哪些?Sora 会继续沿用 ChatGPT 的商业模式吗?OpenAI 对 Sora「物理世界模拟器」的定位是否准确? Sora 横空出世后,我们距离 AGI 还有多远?
这期节目我们聊了很多技术,在所难免很多的专业术语都是英文的表达,如果有没有听清楚的术语或者词汇可以在评论区和我们讨论。
全新付费播客「不止金钱」早鸟优惠价截止到元宵节!
我们在春节前推出的全新付费播客「不止金钱」上线仅四周就收获了相当多听友的认可,销量也大大超出了我们的预期,感谢大家!
新年新气象,我们也将原计划到 2 月 18 日结束的早鸟优惠价 99 元延长到元宵节,2 月 26 日再恢复到原价 129 元。希望「不止金钱」在新年的一年里也能帮助大家更好的应对工作和学习中的变化,让钱包和生活都变得确定。
点击链接 (https://sourl.cn/Jqx8TY)查看「不止金钱」的节目简介、收听节目预告。
本期人物
李崇轩,中国人民大学高瓴人工智能学院副教授、博士生导师
和成,AI 连续创业者,Newcast.ai 创始人、YC Alumni
主要话题
[02:23] 聊聊看到 Demo 视频后的意料之外与情理之中
[03:58] Diffusion 和 Transformer 大家都在用,为什么只有 Sora 能生成 60s 的视频?
[10:53] Sora 训练用的数据可能部分来自游戏引擎生成?
[15:08] Sora 训练参数大猜测
[16:33] 文生视频领域不同技术路线的优劣对比
[20:41] 国内外大厂想要追赶 Sora,有哪些壁垒需要突破?
[24:18] Sora 模型的无奈:原理局限与数据瓶颈
[32:56] 对话生成还是新的 UI 界面: Sora 可能的商业化模式
[34:24] 文生视频消灭中间环节,渲染引擎结合 Sora 的想象空间?
[36:34] 距离用户端大规模用上 Sora 还有多久?
[39:03] 为什么说「Sora 是世界模拟器」不够准确?
[41:38] 融入传感器和检索,畅想「世界模拟器」的其他可能性
[44:13] Sora 让我们与 AGI 的距离更近一步?
关联阅读
- 通用人工智能离我们多远,大模型专家访谈 |S7E11 硅谷徐老师 x OnBoard! (https://guiguzaozhidao.fireside.fm/20220162)
- Sora 的演示视频和技术报告 (https://openai.com/sora)
- 被认为是 Sora 技术基础的一篇论文,由谢赛宁与 Sora 研发负责人合著 (https://arxiv.org/abs/2212.09748)
- Patch 的技术论文 (https://arxiv.org/abs/2307.06304)
- Pika 创始人回应 Sora 发布 (https://www.tmtpost.com/6902885.html)
- 彭博对 Sora 如何改变未来的猜想 (https://www.bloomberg.com/opinion/articles/2024-02-21/how-sora-will-transform-technology-the-media-and-planet-earth)
幕后制作
监制:丁教、糕糕
后期:迪卡普里鑫
运营:瑞涵
设计:饭团
商务合作
声动活泼商务合作咨询 (https://sourl.cn/6vdmQT)
支持我们,加入新一年的播客创新
2021 年我们发起了「声动胡同会员计划」,这是一个纯支持项目,支持「声动活泼」在播客内容上不断探索和创新。回顾 2023 年,得益于这些支持,「声动活泼」的每档节目都不断突破,不仅荣登苹果中国的年度热门节目榜单,还在 CPA 和喜马拉雅等平台都榜上有名。2024 年,我们也会继续创新,一档全新的投资类节目即将和大家见面,同时也会用更加创新的方式制作新一季「声音特稿」节目。
欢迎点击链接 (https://sourl.cn/r3qwTP)查看我们 2023 年收获和 2024 年内容计划。如果你认同或喜欢我们做的事情,也期待我们不断尝试并产生好内容,欢迎付费支持。
胡同 https://files.fireside.fm/file/fireside-uploads/images/4/4931937e-0184-4c61-a658-6b03c254754d/Z0YbNKpo.png
加入我们
声动活泼正在招聘全职「节目监制」、「节目营销」、「商业化项目管理」,查看详细讯息请 点击链接 (https://sourl.cn/j8tk2g)。如果你已准备好简历,欢迎发送至 [email protected], 标题请用:姓名+岗位名称。
关于声动活泼
「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。
我们还有这些播客:声动早咖啡 (https://www.xiaoyuzhoufm.com/podcast/60de7c003dd577b40d5a40f3)、声东击西 (https://etw.fm/episodes)、吃喝玩乐了不起 (https://www.xiaoyuzhoufm.com/podcast/644b94c494d78eb3f7ae8640)、反潮流俱乐部 (https://www.xiaoyuzhoufm.com/podcast/5e284c37418a84a0462634a4)、泡腾 VC (https://www.xiaoyuzhoufm.com/podcast/5f445cdb9504bbdb77f092e9)、商业WHY酱 (https://www.xiaoyuzhoufm.com/podcast/61315abc73105e8f15080b8a)、跳进兔子洞 (https://therabbithole.fireside.fm/)
欢迎在即刻 (https://okjk.co/Qd43ia)、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。
期待你给我们写邮件,邮箱地址是:[email protected]
声小音 https://files.fireside.fm/file/fireside-uploads/images/4/4931937e-0184-4c61-a658-6b03c254754d/gK0pledC.png
欢迎扫码添加声小音,在节目之外和我们保持联系。
-
提个小建议。节目中如果嘉宾说了一些英语专业词汇,是不是可以在show notes 里面做个备注说明。这样也不会影响节目的连贯性,还能更便于听众理解。
小白乌鸦啊@小宇宙 (24-02-23
20:13,山东)
-
新年第一期!
Dicaprixin@小宇宙 (24-02-23
17:50,北京)
-
作为一个视频创作者非常期待sora
之前用runway,好用的点是支持图生视频,且能用工具将图分层并给到精确的运动指令
渲染时间都是3/5分钟 ,且可以用慢动作将生成的4s无限延长
但是如果SORA渲染一期60s是runway的10几倍,所以假如需要20mins也已经很短了
但是不知道能不能支持图片中指定物体的运动
另外希望SORA有个功能就是视频能同时自动生成音频,这样就真正的约等于实拍了!
3
Dicaprixin@小宇宙 (24-02-23
17:44,北京)
-
Sora官网的解读也不错。清楚明了 https://openai.com/research/video-generation-models-as-world-simulators
Ming_Stacey@小宇宙 (24-02-23
17:31,美国)
-
说到scaling up…… 另一个消息就是sam seeks for trillions of dollars to reshape business of chips and AI .. 期待看硬件的突破
1
Ming_Stacey@小宇宙 (24-02-23
17:31,美国)
-
打卡
桃奈小安@小宇宙 (24-02-23
17:04,福建)
-
小板凳坐好了!
独步91@小宇宙 (24-02-23
16:59,浙江)
-
没有文字有的英文单词听不懂,伤心😭
聪_UMki@小宇宙 (24-02-23
16:56,安徽)
-
龙年第一期,终于等到了!!
Oops-Jecci@小宇宙 (24-02-23
16:53,广东)
-
现在有请反方辩手:
5
momo_inorg@小宇宙 (24-02-23
16:44,上海)
-
💰 这个春节你买黄金了吗?过年前后,金店总是格外热闹。很多人喜欢在春节买黄金,一是为了讨个好彩头,二也是希望可以投资保值。但你可能不知道,买金投资也是有风险的。
🎙 播客「不止金钱」在本周更新的番外节目中就聊了聊买金投资避险可能遇到的风险,感兴趣的朋友可以免费收听 👉🏻 https://www.xiaoyuzhoufm.com/episode/65d2fbfb0847349e0c5dea2d 。
声动活泼的声小音@小宇宙 (24-02-23
16:39,北京)
-
第一,哈哈
1
momomoss@小宇宙 (24-02-23
16:37,辽宁)