每周AI新闻:NVIDIA发布GB300
GPT-4
GPT-4o
Gemini
AI Agent
OpenAI
NVIDIA
AI芯片
AI NEWS: 2025.03.17-03.23
NVIDIA发布GB300
- 在NVIDIA GTC大会上,黄仁勋发布旗下最强AI芯片GB300。相比去年发布的GB200,GB300推理性能是其1.5倍。该芯片将于今年下半年出货。
Gemini推出Canvas功能
- Gemini推出全新Canvas功能,支持所见即所得的预览功能。Canvas允许用户通过语音指令快速生成代码原型,并实时可视化输出结果。
- 此外,Gemini还新增Audio Overview功能,可将文档、幻灯片和深度研究报告转化为播客。
OpenAI发布新款语音模型
- OpenAI发布三款全新语音模型,专用于开发语音AI Agent。其中,两款是语音转文本模型GPT-4o Transcribe和GPT-4 Mini Transcribe;一款是文本转语音模型GPT-4o Mini TTS。
- GPT-4o Transcribe是高性能版本,基于最新语音模型架构,可处理复杂的语音信号。GPT-4 Mini Transcribe在保持较高转录性能的同时,通过模型压缩技术,将体积大幅减小。GPT-4o Mini TTS不仅能够将文本内容转换为自然流畅的语音,还允许开发者通过指令控制语调、情感和风格。
AWS开源通用AI Agent框架
- AWS开源5级通用AI Agent框架——Multi-Agent Orchestrator。该框架支持Python和TypeScript,可通过多层级Agent来处理各种复杂任务,针对用户请求找到最适合的Agent执行,并在整个交互过程中保持上下文的一致性和连贯性。