Meta 新一代AI大模型 Llama 4 即将发布

Meta有望在本月发布的新一代开源大语言模型 Llama 4。此前这款大语言模型的发布已至少经历两次延期,目前仍存在再度推迟可能。这距离前代模型 Llama 3 的发布已过去近一年,凸显出Meta在AI军备竞赛中面临的技术挑战。据Meta内部测试显示 Llama 4 模型在数学推理 (GSM8K 基准) 以及代码生成 (HumanEval) 准确率较 Llama 3 提升37%。这款大语言模型多次延期的主因是多模态训练数据清洗遇阻,特别是视频-文本对齐质量未达预期。该模型需协调16000块H100 GPU集群,能源消耗较 Llama 3 训练增加2.3倍。


文章中提到的工具包在社群里都能搜索到。

(0)
打赏 微信扫一扫 微信扫一扫
上一篇 2025年4月5日 下午2:46
下一篇 1天前

相关文章

发表回复

登录后才能评论

1641993361-wxqrcode