每周AI新闻:Anthropic发布Claude 4
Claude
OpenAI
Google
大模型
Anthropic
Gemini
o3
AI NEWS: 2025.05.18-05.25
Anthropic发布Claude 4
- Anthropic发布下一代大模型Claude 4系列,包括Claude Opus 4和Claude Sonnet 4两款型号。
- Claude Opus 4在SWE-bench基准测试中达到72.5%准确率,可连续工作7小时保持稳定性能。Claude Sonnet 4性能稍逊,但更具性价比。
Google升级Gemini 2.5系列大模型
- Google在开发者大会上推出升级版Gemini 2.5系列大模型。其中,Pro版本以1448分ELO评分领先行业,其深度思考功能在USAMO数学奥赛和编程基准测试中分别提升10%和80.4%准确率。Flash版本则通过20%token优化实现性价比突破。
Google发布视频生成模型Veo 3
- Google发布新一代视频生成模型Veo 3。该模型通过整合此前研发的V2A(Video-to-Audio)技术,首次实现从提示词生成包含动态画面、精准口型、环境音效及角色对话在内的完整视频内容。
OpenAI发布Codex
- OpenAI发布基于云端的代码Agent——Codex。Codex可为开发人员自动执行多种任务。例如,编写代码、回答代码库相关问题、修复错误以及提出拉取请求审查等。每个任务都在云端沙盒环境中运行。
- Codex由Codex-1模型提供支持,这是OpenAI o3模型的微调版本,专门针对软件工程进行了优化。
OpenAI宣布Responses API支持MCP
- OpenAI宣布,用于开发Agent的API——Responses API支持MCP服务。开发者只需几行代码即可将Agent连接到外部工具和服务。
Hedra完成3200万美元A轮融资
- 视频生成平台Hedra宣布完成3200万美元A轮融资,由Andreessen Horowitz的基础设施基金领投,Index Ventures和Abstract等早期投资者继续参投。
- Hedra成立于2023年。该公司的Character-3模型能整合文本、图像和音频,并可实现跨图像与音频的风格迁移。
Granola完成4300万美元B轮融资
- Granola于近日宣布完成了4300万美元的B轮融资,由Nat Friedman和Daniel Gross的风险投资公司NFDG领投,估值达到2.5亿美元。
- Granola是一款AI会议记录应用。自一年前面世以来,用户基数每周稳定攀升10%。该产品正逐步转型为用户整合个人与职业信息的全方位“AI助手”。