发布时间: 2024-02-24 08:30:00
-
在我们录制的当天,恰逢OpenAI发布其视频生成产品Sora。本期节目,我们将结合硅谷101播客与视频的日常工作流,来聊一聊那些在我们工作中会用到的各类AI工具,为何Sora会让人觉得惊艳?
我们试用了Runway、PikaLabs、Gemini、Midjourney、Adobe Premiere、Eleven Labs、OpenVoice、Music FX、ChatGPT、Claude.ai等至少十款产品,但最后的核心结论是,相比于现阶段的生成式AI产品,我们更愿意用版权库素材。具体发生了什么,来听一听我们的讨论吧。
当然,本期节目也只是我们自己在工作中的一些感受。如果大家还有哪些好玩的工具或者用法,欢迎在评论区跟我们留言。
《硅谷101》正在招聘播客监制、视频创意策划总监、视频后期以及运营,欢迎感兴趣的小伙伴来给我们投放简历,详细情况请在硅谷101公众号上查看 (https://mp.weixin.qq.com/s/i8UNdI08nFCe5uTsJQ1GEQ)。
【主播】
泓君,硅谷101创始人,播客主理人
【嘉宾】
陈茜,硅谷101联合创始人,视频主理人
Jacob,硅谷101视频后期
Junwu Zhang,硅谷101研究员
【你将听到】
视频生成
03:06 比较Sora、Pika Labs、Runway的视频生成效果:时间越长一致性越差
08:14 Sora解析:东京街头背景保持高度一致有多难?
09:51 硅谷101视频的三类素材:历史素材、图表、动画,AI都很难生成
12:40 仅用语言描述生成视频很难,输入也需要多模态
16:44 AI是创作者还是剪辑师的工具?很难被打败的顶级作品
23:09 算法瓶颈:天马行空式生成反而落入俗套?
平面设计
24:39 为什么说Midjourney还没有颠覆素材库?
26:17 附产品:让人惊艳的AI扩图
声音克隆
30:32 比真人替换效果更好的11Labs:音频替换与复原罗斯福总统的声音
35:06 OpenVoice精准还原普通话音调
37:39 真实录音被当作配音:AI克隆声音界限越来越难区分
AI作曲
39:02 谷歌Music FX作曲 PK 素材库音乐,三曲Demo你更喜欢谁?
45:05 创作者的最大痛点:当音乐长度可以自动调整适配片头
50:17 当小工具遇到大公司:软件学习门槛高,更倾向于做大公司的小插件
内容生成
55:05 ChatGPT如何帮助我们快速查资料:在一本400页的小说中找到代糖的初代焦虑
57:13 溯源ChatGPT的知识性硬伤——令人哭笑不得的关联
59:50 我们的内容制作步骤拆解:ChatGPT并不是一个好的提纲撰写者
68:54 写Shownotes的三个要点,GPT只进化到了第一层
【后期】
Amei
【BGM】
Sushi Master - Sight of Wonders
On a Boat to China - Sight of Wonders
【在这里找到我们】
公众号:硅谷101
收听渠道:苹果|小宇宙|喜马拉雅|蜻蜓FM|网易云音乐|QQ音乐|荔枝播客
海外用户:Apple Podcast|Spotify|TuneIn|Youtube|Amazon Music
联系我们:[email protected]
-
厉害炸了
极客_MjlG@小宇宙 (24-02-25
00:06,陕西)
-
哈哈哈哈哈哈 这个女嘉宾讲话好“婊里婊气”哦……不动声色透露男嘉宾在广州不是很好沟通 ,说英文必加翻译
Cissyyoo@小宇宙 (24-02-24
23:59,美国)
-
[email protected]
HD140587r@小宇宙 (24-02-24
18:57,湖南)
-
苹果耳机的那个变形房间广告。这种空间构造变化是不被人类所允许的,也是ai最擅长的。如何合理的在空间前后进行变化才能出乎意料?而不是随意的不符合常理逻辑的变化。
留线请离言@小宇宙 (24-02-24
16:43,广东)
-
1:11:18 笑死了 听到狗叫声了 可爱
配枪莎莉鸭@小宇宙 (24-02-24
15:56,广东)
-
哎,是个话唠🐶
硅谷101陈茜@小宇宙 (24-02-24
16:08,美国)
-
希望能讲讲技术细节
HD658937n@小宇宙 (24-02-24
12:27,山西)
-
57:09 不知道OpenAI的GPTs表现如何。从国内平台的主观使用经验看,拥有GPU最多的字节的大模型豆包做的最好,字节在其上做了仿制GPTs的“扣子”Coze,海外叫Cici。我用其生成的智能体,致敬我母校的“汇文高中直通车”,虽然灌进去大量内容,但其并没有产生独特性,和相对其他智能体的门槛,还是靠大模型平台的通用性,特别是出那种融合地理历史生物语文道法在一起的题目时,完全与现在国内教育系统里已有的题库无关
晨萱I语迟者说@小宇宙 (24-02-24
11:57,北京)
-
你说的这个东西,还是 gpt 的基本能力,这些产品并未有根本的改进
1
bheeee@小宇宙 (24-02-24
12:48,浙江)
-
的确,由浅入深:prompt engineering -> embedding -> fine tuning GPTs和Coze都只能算embedding,而且大平台放权不多
晨萱I语迟者说@小宇宙 (24-02-24
19:01,北京)
-
小板凳坐好了!
独步91@小宇宙 (24-02-24
11:29,江苏)
-
用样片音乐生产音乐,样片音乐应该也要买版权吧。这个和在app里听音乐只付会员费性质还是不一样吧。
1
红房子粉刷匠@小宇宙 (24-02-24
11:03,广东)
-
商业长视频一般会先制作分镜头,给AI工具输入分镜头,应该可以产生精确的内容吧
MrOr@小宇宙 (24-02-24
10:45,上海)
-
23:27 没有创造性的独立说法,其实就是选择性。创造性,只是选择性大概念的一个子集。人类的创造性其实也只是众多的选择性之一,是绝大多数人类都屈服于一定规则而生活,然后受限与某种思维,所形成的想法就是选择。而极少数人不合时宜,格格不入,表达出来的就是创造性
1
晨萱I语迟者说@小宇宙 (24-02-24
10:00,北京)
-
这期节目在我家录制,家里有只很调皮的萨摩耶一直在叫,偶尔背景声会听到,已经扣了狗罐头,还请大家多多谅解🐶🐶
16
硅谷101陈茜@小宇宙 (24-02-24
09:42,美国)
-
狗叫,狗好
人扣罐头,人坏
2
小宋喜欢爬山@小宇宙 (24-02-24
11:20,山东)
-
我比较好奇现在的AI硬件何时才能达到Moss那种级别的智能
首席大熊猫@小宇宙 (24-02-24
08:49,广东)
-
有线下活动吗
Yvaine_Pan@小宇宙 (24-02-24
08:47,美国)
-
很快搞起来
泓君Jane@小宇宙 (24-02-24
08:51,美国)
-
在硅谷吗
1
Yvaine_Pan@小宇宙 (24-02-24
08:46,美国)
-
在
泓君Jane@小宇宙 (24-02-24
08:52,美国)
-
沙发
2
桃奈小安@小宇宙 (24-02-24
08:45,福建)