10_千呼万唤,Sora终于来了！深度解读OpenAI发布会Day2&Day3

Day2发布会：o1微调

发布会day2简述

在发布会上，他们展示了一项罕见疾病研究。通过向o1模型输入少量科研数据并进行调整，o1-mini模型的得分从17分提升到了31分，超过了正式版o1的25分。当然，这样的例子，普通人，还是难以理解。我就打个比方。

什么是模型微调。举例：一个刚毕业大学生通过一些案列学习来获得专业领域的知识

可以把o1-mini比作刚毕业的大学生：虽然理论知识丰富，但专业领域的实践能力相对较弱。如果硬要让他们谈论某些深奥的内容，可能会答非所问。而如果给他们一些具体的例子，他们马上就能学会，并用更专业的方式表达出来。

只是预告，承诺2025年初发布

目前，这项功能还没正式发布，只是在预告阶段，可以说是在“画大饼”。不过他们承诺会在2025的年初发布。

让“一个人的公司”真正变得可能

这个功能对个人开发者或企业，尤其在 AI 时代，意义非常重大。随着“一个人的公司”越来越普及，通过少量的数据快速训练出个性化的模型。具体通过几十到几千条样本数据，就能完成训练，这大大降低了使用成本。

从整体来看，这比后面会提到的 Sora 更有意义。以“一个人的公司”为例，Sora 主要帮助处理品牌营销事务，但模型微调则不同。微调后的模型可以成为拥有专家能力的助手，胜任财务、人事、市场等多个角色。这样一来，多个智能代理Agent可以协作配合，让“一个人的公司”真正变得可能。

day3发布会重磅发布：Sora

3个核心功能

浏览/发现
素材库
故事序列

仍然存在2个问题

两个核心问题仍然没有得到解决：

首先是主体一致性的问题，这属于大模型本身的局限性，短期内恐怕难以突破。

其次是生成内容的时长，依然相对较短，仅为20秒左右。不过，我相信 OpenAI 之所以做出这样的设计，是出于用户体验的考虑。若允许更长时长，则需要更高的算力支持，这不仅会增加资源消耗，还可能导致用户排队等待的时间更长。

首创模拟世界

以往的 AI 主要擅长理解图像内容，例如识别物体或场景，但它并不能真正理解图像在空间中的存在形式，或者文字与物理事件之间的可能关联。而这一次的发布，可以说正式开启了模拟世界的全新篇章。它不仅能“看懂”图片，还能“思考”图像在三维空间中的存在方式，甚至模拟文字描述所对应的现实可能性，这无疑是一次具有首创意义的突破。

一些应用

纵然它仍有许多不完美之处，但我们更应该主动探索其潜在的应用场景，并尽可能在这些场景中找到最佳的应用方式。我相信，它的应用前景是广阔且多元的，而我们可以重点关注以下三种最为普遍的应用方向。

教育和培训

增强教育体验：通过生成视频，使教育更加直观和有趣，提升学习效果。

娱乐和媒体

创作新形式：电影、电视和游戏行业使用 Sora Turbo 生成独特的视频效果，普通用户也能创作高质量内容，丰富社交媒体平台。

营销和广告

定制化广告：企业通过 Sora Turbo 生成个性化广告，可以更精准地吸引并服务于不同的受众群体，从而大幅提升宣传效果。这种技术的应用，与我们创办一人公司、实现高效推广产品的目标不谋而合。拥有强大的营销和推广能力，我们就能用更接地气、更具吸引力的方式，将产品呈现给目标用户，为小型创业者提供了一个前所未有的机会。

灵智宝盒QBox