请先登录以管理你的Prompts

每周AI新闻:Google开源Gemma-3

Meta
Google
Gemini
OpenAI
大模型
Transformer
英伟达
Llama
o3
AI芯片

AI NEWS: 2025.03.10-03.16

Google开源Gemma-3

  • Google宣布开源最新多模态大模型Gemma-3,主打低成本、高性能。
  • Gemma-3共有10亿、40亿、120亿和270亿四种参数。最大的270亿参数模型仅需一张H100就能推理。
  • LMSYS ChatbotArena数据显示,Gemma-3 27B仅次于DeepSeek-R1 671B,高于o3-mini、Llama-3 405B等知名模型。

Gemini 2.0 Flash解禁图像生成功能

  • Google解禁Gemini 2.0 Flash图像生成功能,不仅支持原生图像生成,还能通过自然语言提示进行对话式编辑,极大简化图像处理流程。
  • 开发者可通过Gemini API和Google AI Studio的实验版本使用这一功能。

OpenAI开源首个Agent SDK

  • OpenAI开源首个Agent SDK,并发布Responses API,可简化、增强智能体开发流程。
  • Agent SDK支持多Agent之间的动态任务协作,可以开发复杂的业务流程。
  • Responses API内置网络搜索、文件搜索、计算机控制、可观测性、流程跟踪、Agent编排等功能,可与Agent SDK结合使用。

Meta测试首款自研AI芯片

  • 路透消息,Meta正在与台积电合作测试首款自研AI训练芯片。如果测试成功,Meta将迅速扩大生产规模。
  • 此前Meta已完成首次tape-out,这是芯片完成初始设计、交付制造伙伴评估可行性的重要步骤。
  • Meta的新芯片是专为训练大模型打造的AI加速器,相比英伟达的通用GPU更节能。
  • 2025年Meta预计投入1140亿至1190亿美元,其中650亿美元将用于AI基础设施建设。

Cartesia获6400万美元融资

  • 语音模型平台Cartesia宣布,获得6400万美元A轮融资。本轮融资由Kleiner Perkins领投。
  • Cartesia推出最新语音模型Sonic 2.0和Sonic Turbo,克隆语音仅需要3秒,延迟最高只有90毫秒。

何恺明与LeCun联手改造Transformer

  • 何恺明与Yann LeCun联手提出了一种名为Dynamic Tanh的新技术,旨在替代Transformer中的归一化层。该技术可在不牺牲性能的前提下,显著加速模型训练和推理。Dynamic Tanh已入选CVPR 2025。