10_千呼万唤,Sora终于来了!深度解读OpenAI发布会Day2&Day3


Day2发布会:o1微调

发布会day2简述

在发布会上,他们展示了一项罕见疾病研究。通过向o1模型输入少量科研数据并进行调整,o1-mini模型的得分从17分提升到了31分,超过了正式版o1的25分。当然,这样的例子,普通人,还是难以理解。我就打个比方。

什么是模型微调。举例:一个刚毕业大学生通过一些案列学习来获得专业领域的知识

可以把o1-mini比作刚毕业的大学生:虽然理论知识丰富,但专业领域的实践能力相对较弱。如果硬要让他们谈论某些深奥的内容,可能会答非所问。而如果给他们一些具体的例子,他们马上就能学会,并用更专业的方式表达出来。

只是预告,承诺2025年初发布

目前,这项功能还没正式发布,只是在预告阶段,可以说是在“画大饼”。不过他们承诺会在2025的年初发布。

让“一个人的公司”真正变得可能

这个功能对个人开发者或企业,尤其在 AI 时代,意义非常重大。随着“一个人的公司”越来越普及,通过少量的数据快速训练出个性化的模型。具体通过几十到几千条样本数据,就能完成训练,这大大降低了使用成本。

从整体来看,这比后面会提到的 Sora 更有意义。以“一个人的公司”为例,Sora 主要帮助处理品牌营销事务,但模型微调则不同。微调后的模型可以成为拥有专家能力的助手,胜任财务、人事、市场等多个角色。这样一来,多个智能代理Agent可以协作配合,让“一个人的公司”真正变得可能。

day3发布会重磅发布:Sora

3个核心功能

  • 浏览/发现

  • 素材库

  • 故事序列

仍然存在2个问题

两个核心问题仍然没有得到解决:

首先是主体一致性的问题,这属于大模型本身的局限性,短期内恐怕难以突破。

其次是生成内容的时长,依然相对较短,仅为20秒左右。不过,我相信 OpenAI 之所以做出这样的设计,是出于用户体验的考虑。若允许更长时长,则需要更高的算力支持,这不仅会增加资源消耗,还可能导致用户排队等待的时间更长。

首创模拟世界

以往的 AI 主要擅长理解图像内容,例如识别物体或场景,但它并不能真正理解图像在空间中的存在形式,或者文字与物理事件之间的可能关联。而这一次的发布,可以说正式开启了模拟世界的全新篇章。它不仅能“看懂”图片,还能“思考”图像在三维空间中的存在方式,甚至模拟文字描述所对应的现实可能性,这无疑是一次具有首创意义的突破。

一些应用

纵然它仍有许多不完美之处,但我们更应该主动探索其潜在的应用场景,并尽可能在这些场景中找到最佳的应用方式。我相信,它的应用前景是广阔且多元的,而我们可以重点关注以下三种最为普遍的应用方向。

教育和培训

增强教育体验:通过生成视频,使教育更加直观和有趣,提升学习效果。

娱乐和媒体

创作新形式:电影、电视和游戏行业使用 Sora Turbo 生成独特的视频效果,普通用户也能创作高质量内容,丰富社交媒体平台。

营销和广告

定制化广告:企业通过 Sora Turbo 生成个性化广告,可以更精准地吸引并服务于不同的受众群体,从而大幅提升宣传效果。这种技术的应用,与我们创办一人公司、实现高效推广产品的目标不谋而合。拥有强大的营销和推广能力,我们就能用更接地气、更具吸引力的方式,将产品呈现给目标用户,为小型创业者提供了一个前所未有的机会。

费用

plus会员(20美元/月),每月50次次极速生成

720p视频

pro会员(200美元/月),每月500次极速生成,无限慢速生成

1080p视频