每周AI新闻:OpenAI发布GPT-image-1
OpenAI
微软
大模型
ChatGPT
AI NEWS: 2025.04.21-04.27
OpenAI发布GPT-image-1
- OpenAI发布全新图像模型GPT-image-1,已通过API向开发者开放。
- GPT-image-1与ChatGPT版本有较大不同。该版本可控制生成图像的敏感度、生成效率、背景、输出格式、渲染质量、压缩质量等。
- 目前,Adobe、Figma、HeyGen、Wix等公司已经将GPT-image-1集成至产品中。
Sand AI 开源全球首个自回归视频生成大模型
- 由马尔奖、清华特奖得主曹越领衔的创业公司Sand AI宣布开源全球首个自回归视频生成大模型MAGI-1。
- MAGI-1采用自回归预测视频块序列架构,具备流畅的无限续写能力,可生成电影级连贯长视频。此外,该模型支持以1秒为单位精细化调整,以及显著提升运动自然度,解决了传统AI视频动作僵硬的问题。
- Sandy AI成立于2024年1月,核心团队包括微软亚洲研究院前研究员张拯等顶尖人才,已获得近六千万美元融资。
微软升级AgentUFO
- 微软对AgentUFO进行升级,发布UFO²版本,新增操作系统功能。UFO²与Windows系统深度集成,可直接调用原生API、COM等接口,比传统RPA在执行复杂自动化业务时更加高效、精准。
- 测试数据显示,UFO²的自动化任务成功率远超OpenAI的Operator。执行效率上,UFO²在OSWorld-W平均完成步骤仅5.5步,Operator则需更多。