Meta 今日发布了首批 Llama 4 系列模型:Llama 4 Scout 和 Llama 4 Maverick。 据报道,此前 DeepSeek 发布的开源模型(如 R1 和 V3)在性能上与 Meta 之前的旗舰 Llama 模型相当甚至更优,促使 Meta 加快了 Llama 4 的研发节奏。为应对竞争,Meta 内部曾设立“作战室”以深入研究 DS 如何实现更低成本的模型部署与运行。如今,Llama 4 与 V3 在性能上的对比依然是业内关注的焦点。 Meta GenAI负责人在X上表示,本次发布标志着 Llama 系列的全面重构完成。他表示,此次推出的是 Llama 4 系列中首批开源模型,代表了该系列发展的又一重要里程碑。本次发布的主要亮点有: 📌 Llama 4 系列在架构层面进行了全面升级,采用先进的专家混合(MoE,Mixture-of-Experts)架构,并在原生多模态任务上进行了联合训练。此次发布包括 Llama 4 Scout 和 Llama 4 Maverick,同时也首次预览了更强大的 Llama 4 Behemoth。 📌 Llama 4 Scout 是目前性能最强的小型模型,拥有 170 亿活跃参数和 16 个专家模块。该模型具备出色的推理速度,原生支持多模态,具备强大的智能能力,支持业界领先的 1000 万以上 token 上下文窗口,并且可在单张 GPU 上运行。 📌 Llama 4 Maverick 是当前同类中最强的多模态模型,在多个公开评测中超越 GPT-4o 和 Gemini 2.0 Flash,在推理和编程任务上与 DeepSeek v3 表现相当,同时活跃参数不到其一半。该模型在性能与成本比方面表现出色,其实验性对话版本在 LMArena 榜单中获得 1417 的 ELO 分数,并且也可在单机环境中运行。 📌 Meta 还预览了 Llama 4 系列中性能最强的模型 —— Llama 4 Behemoth,该模型在多个 STEM 基准测试中超过 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 目前仍在训练中,Meta 表示将持续披露其更多细节。
Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE
Meta 今日发布了首批 Llama 4 系列模型:Llama 4 Scout 和 Llama 4 Maverick。 据报道,此前 DeepSeek 发布的开源模型(如 R1 和 V3)在性能上与 Meta 之前的旗舰 Llama 模型相当甚至更优,促使 Meta 加快了 Llama 4 的研发节奏。为应对竞争,Meta 内部曾设立“作战室”以深入研究 DS 如何实现更低成本的模型部署与运行。如今,Llama 4 与 V3 在性能上的对比依然是业内关注的焦点。 Meta GenAI负责人在X上表示,本次发布标志着 Llama 系列的全面重构完成。他表示,此次推出的是 Llama 4 系列中首批开源模型,代表了该系列发展的又一重要里程碑。本次发布的主要亮点有: 📌 Llama 4 系列在架构层面进行了全面升级,采用先进的专家混合(MoE,Mixture-of-Experts)架构,并在原生多模态任务上进行了联合训练。此次发布包括 Llama 4 Scout 和 Llama 4 Maverick,同时也首次预览了更强大的 Llama 4 Behemoth。 📌 Llama 4 Scout 是目前性能最强的小型模型,拥有 170 亿活跃参数和 16 个专家模块。该模型具备出色的推理速度,原生支持多模态,具备强大的智能能力,支持业界领先的 1000 万以上 token 上下文窗口,并且可在单张 GPU 上运行。 📌 Llama 4 Maverick 是当前同类中最强的多模态模型,在多个公开评测中超越 GPT-4o 和 Gemini 2.0 Flash,在推理和编程任务上与 DeepSeek v3 表现相当,同时活跃参数不到其一半。该模型在性能与成本比方面表现出色,其实验性对话版本在 LMArena 榜单中获得 1417 的 ELO 分数,并且也可在单机环境中运行。 📌 Meta 还预览了 Llama 4 系列中性能最强的模型 —— Llama 4 Behemoth,该模型在多个 STEM 基准测试中超过 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 目前仍在训练中,Meta 表示将持续披露其更多细节。