12月初,OpenAI 发布了一个王炸的预告:从 12 月 5 日开始,每个工作日,OpenAI 都会有一场直播,展示新的产品或演示。

【汇总省流版】OpenAI连续12天的发布会,都发布了些什么?

day1:期待已久的 o1 完全体(Full Version)、200 刀一个月的 ChatGPT Pro。

o1 完全体,也放出了新的 o1 System Card:https://cdn.openai.com/o1-system-card-20241205.pdf
整体而言,o1 完全体是一款更擅长编程、数学和写作的更快且更强大的推理模型,并且现在也增加了对图像上传的支持,这让 o1 可以使用视觉数据来生成更详细和更有用的响应。
day2:强化微调,少量样本就能训练自己的专家模型
去年,OpenAI 就已经为自家产品推出了监督式微调 API。简单来说,监督式微调要做的是让模型模仿它在输入文本或图像中找到的特征。这种强大的技术可用于修改模型的语气、样式或响应格式等等。
强化微调(RFT)则是一种更进一步模型定制技术,可让开发者使用强化学习针对具体任务对模型进行进一步的微调,并根据提供的参考答案对模型的响应进行评分。也就是说,强化微调不仅会教模型模仿其输入,更是会让其学会在特定领域以新的方式进行推理。
day3:Sora正式发布!独立产品、完整视频工作流
于 2024 年 2 月首次亮相的 Sora,经过近 10 个月的迭代后, 正式上线。引领了视频生成风潮的Sora,在今天要面对国内外各种视频模型的竞争,比如可灵、即梦、Vidu 等。
在文、图生视频的基础功能之上,它加入了故事板(相当于通过分镜创作自己的故事)、用文本调整原视频、不同场景视频的融合等功能(相当于给视频直接加特效),整个产品功能设计似乎都在让视频更接近创作者的自我表达、帮助他们完成一个理想的镜头故事。
美国、以及大多数其他国家的用户,可以访问官网体验 Sora。它被包含在 ChatGPT Plus、ChatGPT Pro 的会员订阅中,无需额外付费。其中,Plus 能生成最多 50 个高级视频、视频分辨率最高达 720p、时长为 5 秒,而 Pro 则能生成最多 500 个高级视频、分辨率高达 1080p、时长为 20 秒、还能去水印。
day4:Canvas全量开放,集成Python、支持在线改代码

OpenAI 发布了三个重要更新:

  • Canvas 向所有用户开放并集成到主要模型中,用户无需额外操作即可使用。

  • Canvas 现在支持直接运行 Python 代码,用户可以看到代码生成的文本或图形结果。

  • Canvas 集成到自定义 GPT 中,使其具备 Canvas 的强大功能。

day5:Apple Intelligence正式发布,深度集成ChatGPT
通过这次合作,ChatGPT 将无缝接入 iPhone、iPad 和 Mac 用户的日常场景,并与 Siri 和 Apple Intelligence 展开智能协同,为苹果设备带来全新体验。但,与国区的设备无缘。
day6:GPT-4o 实时视频通话、屏幕共享、圣诞老人限定语音
5 月份预告的语音和视觉功能(Advanced Voice with Vision)终于发布。这意味着ChatGPT现在能够通过视觉和听觉与用户互动,提供实时的视觉互动体验,就像与真人视频聊天一样自在。    
day7:ChatGPT上线Projects功能,还有一个AGI的彩蛋
推出了名为“Projects In ChatGPT”的新功能,与竞争对手Anthropic于今年6月份在Claude中推出的功能有异曲同工之妙,但OpenAI称其为今年发布的最重要的AI功能之一。该服务可以将ChatGPT的各种功能整合至一处,便于用户创建并管理各类项目,它不仅支持Canvas界面,还能通过ChatGPT Search轻松接入互联网资源。
day8:ChatGPT搜索功能全面开放、新增语音搜索服务
ChatGPT搜索功能将从即日起向全体用户免费开放。
ChatGPT搜索功能基于OpenAI的GPT-4o模型构建,于今年10月底正式发布,能让使用聊天机器人的用户像在网络上进行常规搜索一样获取即时信息,但当时仅向ChatGPT Plus和Team用户开放移动及网络端的付费搜索服务。
OpenAI正在将ChatGPT搜索功能与高级语音模式相结合。这意味着,ChatGPT现在能够以语音形式搜索网络,并以自然、流畅的对话方式回应用户的问题。例如,如果用户即将前往另一个城市度假,只需询问ChatGPT当地的天气情况,内置的搜索功能便能提供最新的天气信息。
为了增强这一功能,OpenAI已经与多家顶级新闻和数据提供商建立了合作关系。因此,用户还将能够直接在ChatGPT中查看股票行情、体育赛事得分、天气预报等信息。可以说,ChatGPT搜索正逐步发展成为谷歌等搜索引擎的有力竞争者。
day9:o1模型开放API使用,实时语音API大降价
  • OpenAI o1 模型:API 现已支持功能调用、开发者消息、Structured Outputs 以及视觉识别等功能。

  • 实时 API 升级:集成简单的 WebRTC 功能,GPT-4o 音频价格下调 60%,同时推出 GPT-4o mini,音频费用仅为原来的十分之一。

  • 偏好微调 (Preference Fine-Tuning):新一代模型定制技术,帮助开发者更轻松地根据用户需求和偏好优化模型。

  • Go 和 Java SDK:现已开放测试版,开发者可快速上手集成。

这些进步意味着什么呢?简单来说,就是 AI 应用的开发变得更简单、更便宜,也更容易根据具体需求进行定制了。不管是想开发智能客服、自动翻译,还是其他创新应用,开发者们都能以更低的成本实现自己的想法。

day10:ChatGPT登陆电话、WhatsApp,你可以给ChatGPT真正打电话了
美国用户每月可拨打该号码享受 15 分钟的免费通话。同时上线的还有 WhatsApp 联系人,全球任何用户均可通过 WhatsApp 向该号码发送消息,目前只限文字信息。诺基亚功能机、座机都能跟 ChatGPT 沟通
day11:ChatGPT深度集成Mac应用,从Chatbot变身AI Agent

此次带来编程和写作两方面的更新。

  • 桌面版ChatGPT能够和Warp(文件共享应用)、XCode编辑器等应用一起使用了。
  • OpenAI也支持在语音模式下与其他应用程序协同工作了,包括Notion、Apple Notes等。
day12:终极王炸OPEN AI o3模型预览版发布

o3在多项基准测试中,o3再次刷新SOTA,就数学、代码、软件工程等领域。在AIME 2024数学竞赛评测中,o3取得了96.7%的准确率,性能直接飙升13.4%;在博士级科学问答基准GPQA Diamond上,o3准确率为87.7%,相较于上一代o1提升9.7%。

o3-mini作为o3系列的新成员,在编程能力评测中有着惊人的实力,通过自适应思考时间机制,o3能够根据任务难度自动调整推理深度。o3-mini引入了三档推理级别——低强度推理、中等强度推理、高强度推理,可以根据具体需求去调整模型的推理深度。

【汇总省流版】OpenAI连续12天的发布会,都发布了些什么?


宸翊互联2003年由一批IDC行业沉淀多年的精干团队创立前身,建立了具有自身特色的运维服务管理体系,逐步从一家单纯提供设备托管与专线接入服务的资源依赖型IDC服务商,升级为一家集
安全组网、政府项目运维、系统集成、数据中心等业务于一体的综合性技术服务提供商先后承接超150万多件的实施工单,累积服务客户300多家,遍布上海15处IDC数据中心,共代运维15000+机柜数。作为浦东新区城运中心的总运维服务商,维护单位超1000个,曾获得上级视察和嘉奖。作为上海联通的长期合作伙伴,得到“特殊贡献奖”的肯定。2023年获得国家级“科技型中小企业”、“高新技术企业”资质评定。
 

【汇总省流版】OpenAI连续12天的发布会,都发布了些什么?

【汇总省流版】OpenAI连续12天的发布会,都发布了些什么?

【汇总省流版】OpenAI连续12天的发布会,都发布了些什么?

相关推荐: 突发!英伟达被立案调查

12月9日,据国家市场监督管理总局消息,因英伟达公司涉嫌违反《中华人民共和国反垄断法》及《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有限公司股权案反垄断审查决定的公告》(市场监管总局公告〔2020〕第16号),市场监管总局依法对英伟达公司开展立…

最新动态