每周AI新闻:OpenAI推出Codex
腾讯
OpenAI
DeepMind
苹果
ChatGPT
Gemini
大模型
AI NEWS: 2025.05.12-05.18
OpenAI推出Codex
- OpenAI推出AI编程Agent——Codex。该Agent基于强化学习训练的codex-1模型开发,专为软件工程任务优化设计,涵盖功能构建、代码库答疑、漏洞修复等全流程。
- 目前Codex已向ChatGPT Pro、Team和Enterprise用户开放,Plus和Edu用户也将很快获得访问权限。
MiniMax发布Speech-02
- MiniMax发布语音大模型Speech-02。该模型同时斩获Artificial Analysis Speech Arena和Hugging Face TTS Arena双料冠军,成为榜单前十中唯一的中国模型。
- Speech-02的核心突破体现在超拟人化、个性定制和多语言支持三大维度。该模型仅需10秒语音样本即可精准复刻音色,支持32种语言的跨语种切换。
腾讯将发布微信生态Agent
- 腾讯公布了2025年第一季度财报。在回答分析师提问时,马化腾表示,每个人都可以做通用Agent,但与此同时,也有一种Agent可以存在于微信内部以及微信独特的生态系统中。
- 马化腾认为,在微信生态系统内,腾讯有机会创建一个非常独特的Agent。它与微信生态系统的独特组成部分相连接,包括社交图谱、通信和社区能力、内容生态系统,以及数百万个小程序。这些小程序实际上涉及各种信息,以及跨越众多垂直应用的交易和操作能力。
DeepMind发布AlphaEvolve
- DeepMind发布用于设计高级算法的编程Agent——AlphaEvolve。AlphaEvolve与Gemini深度集成,用于自动评估通用算法的发现与优化,可以帮助开发人员快速设计出最好、高效的矩阵算法。
苹果开源FastVLM
- 苹果开源视觉语言模型FastVLM。该模型可在iPhone等设备上直接运行,显著提升移动端AI的图像理解能力。
- 研究团队基于MLX框架开发了iOS/macOS演示应用,通过新型混合视觉编码器FastViTHD实现85倍的首token输出速度提升。