人工智能:ChatGPT和AI正如何改变播客行业?

2023年随着人工智能采用的快速发展而迅速启动,从ChatGPT的推出到AIDJ,这项技术正在彻底改变常规做法,影响着消费者、创作者和行业领导者。

同样,人工智能技术也在彻底改变娱乐业,包括播客。也许这场革命中最具争议的部分是人工智能语音生成,这引起了创作者的合理担忧,他们担心自己的声音会在未经许可的情况下被使用。

然而,播客创作者却有一个特别的机会来将他们的声音变现。新的工具允许他们根据文本生成主持人阅读的广告、介绍,甚至整个剧集,从而减少在演播室花费的时间和对昂贵录音设备的需求。但人工智能语音生成是一把双刃剑,它既给创作者带来了便利,也给他们带来了风险,因为他们的声音可能被未经授权的使用者滥用,从而造成错误信息的传播。

新机遇:音频广告中的AI

广告商已经在使用人工智能技术微调播客广告。今年2月,美国最大的音频媒体公司iHeartMedia宣布与音频智能平台Sounder合作,为播客广告客户提供新的品牌安全技术,允许在广告投放前评估和解释播客内容的含义和背景,从而帮助品牌做出品牌安全和适合性的判断。

据报道,iHeartMedia利用Sounder的音频数据云技术,为其旗下超过750个原创播客节目提供这项服务,其中包括一些世界上最大的播客和创作者。这些节目每月有超过3.92亿次下载和收听,比排名第二至第四的播客版权商加起来还多。

此外,播客平台Acast利用人工智能技术推出了一种新的对话式定位工具,可以根据剧集的内容,将广告放置在最合适的位置,从而提升广告的效果和品牌安全性。

如果一个品牌想要宣传其环保理念,那么对话式定位工具就可以将其广告放置在播客中讨论环境问题或可持续发展的部分。这样可以增加广告的相关性和吸引力,同时避免与不符合品牌价值或敏感话题的内容相冲突。

现在,一些公司正在探索如何使用人工智能技术来制作完整的音频广告。

譬如,音频广告技术公司Adswizz正在开发一项基于人工智能的语音生成工具,旨在帮助播客广告客户更精准地投放广告。这些工具由Adswizz的技术创新实验室开发,利用AI和机器学习算法来解释播客内容,并根据品牌的要求和目标来定位广告,从而消除雇佣配音演员的成本。

然而,播客主持人朗读的广告被认为更有效,因为播客听众信任他们的主持人,对广告的相关性比一般消费者更敏感。这为主持人自己利用人工智能语音模型提供了机会。

据TechCrunch报道,Spotify已经在其AIDJ功能中使用了AI技术制作播客广告的方法,通过训练一个AI模型来模仿其文化合作部门主管兼播客主持人Xavier“X”Jernigan的声音。现在,Spotify可能将这种技术应用到广告领域。

Spotify高管兼播客主持人BillSimmons透露,Spotify正在测试人工智能技术,将使播客能够即时生成用自己声音朗读的广告。这样,创作者可以在更短的时间内制作出听起来像是主持人亲自朗读的广告,从而增加广告数量和收入。

除此之外,这项技术还可以帮助定位听众,并翻译成各种语言的广告,前提是主持人允许复制他们的声音。这种工具可能会吸引更多的广告商和创作者加入Spotify,这与Spotify最近转向为独立创作者服务的方向一致。

然而,Spotify并不是唯一一个致力于这类功能的平台。例如,Podcastle推出的一款名为Revoice的AI语音克隆工具,可以用AI技术创建一个与真实主持人相似的数字声音。

Revoice的使用方法很简单,用户只需录制自己朗读70个不同的句子,以及一个法律免责声明,以保护用户的声音安全和隐私。然后,Podcastle的AI算法会在24小时内处理并生成用户的数字声音。用户可以在Podcastle平台上输入任何内容,让AI用数字声音生成高质量的音频文件。

新风险:错误信息的传播

播客的声音可能是他们最宝贵的资源之一。对于许多创作者来说,他们的声音是他们唯一的标识,尤其是那些不制作播客视频的人。

JoeRogan是一位著名的播客主持人,他的节目《TheJoeRoganExperience》邀请了各行各业的嘉宾,进行了深入的对话。但在今年5月,有人用人工智能技术创造了一个虚构的播客,模仿了JoeRogan和一些从未上过他节目的嘉宾的对话。

这个播客叫做《JoeRoganAIExperience》,由一位澳大利亚的创意总监Hugo制作,他用了一个可以克隆任何声音的文本转语音平台,和一个基于ChatGPT的对话生成器。Hugo说,他只是出于好玩而做了这个项目,并没有想要威胁真正的JoeRogan或其他播客主持人。

Hugo发布了第一集播客一个月前,其中模拟了JoeRogan和OpenAI创始人SamAltman的对话。这个对话很诡异地涉及了人工智能制造虚假内容的风险,而这正是这个播客所做的。

此外,Hugo还制作了其他几集播客,模仿了JoeRogan和AndrewTate、SteveJobs等嘉宾的对话。这些对话虽然有时候有点荒谬或无聊,但也有时候听起来很逼真或有趣。Hugo说,他希望通过这个项目展示人工智能技术的发展和潜力,也提醒人们要警惕虚假内容的危害。

与此同时,TikTok还删除了一个用JoeRogan的声音制作的虚假病广告。

事实上,新闻是播客的主要类型,这意味着错误的内容可能会带来严重的后果,导致错误信息大规模传播。人工智能语音生成工具正在以闪电般的速度发展,但围绕保护其声音的监管将需要时间来发展。不过,如果平台能够制定有效的措施,防止滥用和标记未授权的作品,播客甚至可以借助人工智能技术将他们的声音拓展到其他娱乐形式。

比如,播客主持人可以将自己的声音授权给电影和电视。在《星球大战》系列电影中,黑武士DarthVader的声音一直由演员JamesEarlJones来配音,他的声音深沉而威严,给观众留下了深刻的印象。然而,现年91岁的琼斯表示,他想要放下这个角色,让人工智能来接替他。

据《VanityFair》报道,Jones已经将他过去的声音作品的权利转让给了迪士尼,允许乌克兰的初创公司Respeecher利用人工智能技术,在迪士尼+的《Obi-WanKenobi》中重现他的声音。

Respeecher使用声音片段来“克隆”一个演员的声音,让制作方可以在没有演员在场的情况下录制新的台词。SkywalkerSound的监督音效编辑MatthewWood告诉《VanityFair》,当Jones“提到他想要放弃”DarthVader的角色时,他就向Jones提出了这个选项。

在Jones同意让卢卡斯影业使用人工智能生成的声音后,《VanityFair》称,制作方委托Respeecher让DarthVader听起来像45年前的Jones,在迪士尼+的《Obi-WanKenobi》中呈现出那种“黑暗面”的恶棍气质。这也是为什么你可能会注意到,在《Obi-WanKenobi》中,DarthVader听起来很像他在早期电影中的样子,而不是Jones在2019年的《星球大战:天行者崛起》中的实际声音。

与艺术家、演员和其他娱乐创作者不同,播客最具价值的资产是他们的语音——这意味着他们更有动机去探索如何与AI语音技术合作,而不是抵制它。

郑重声明: 本文版权归原作者所有, 转载文章仅为传播更多信息之目的, 如作者信息标记有误, 请第一时间联系我们修改或删除, 多谢。

链链资讯

FTTWEB:NFT生态面临的巨大挑战

北京时间6月28日凌晨,红豆发起了新一轮NFT的销售。然而这场预售迎来的却是整个社区劈天盖地的谴责:预售时间过短、体验卡顿、价格偏高,更糟糕的是销售的NFT竟然是红豆的仿版,有些图甚至就是红豆的.

[0:31ms0-3:781ms