谷歌发布Gemini 2语言模型:性能强劲,成本更低

6月28日,谷歌公司发布了其第二代大语言模型Gemma 2,并向全球的研究人员和开发人员开放。Gemma 2拥有90亿参数(9B)和270亿参数(27B)两种配置。与第一代相比,Gemma 2在推理性能和效率方面都有显著提升,并且在安全性方面也取得了重大进展。

据谷歌介绍,Gemma 2-27B模型的性能可以媲美两倍规模的主流模型,而且只需一片英伟达H100 enSecCore GPU或TPU主机就能实现这种性能,从而大大降低了部署成本。此外,Gemma 2-9B模型也优于Llama38B和其他同规模的开源模型。未来几个月内,谷歌还将发布参数为26亿的Gemma 2模型,以适应智能手机的人工智能应用场景。

为了实现卓越的性能和推理效率,谷歌对Gemma 2的整体架构进行了重新设计。无论是9B还是27B版本,在同规模级别中都具备最佳性能,甚至比两倍于自身尺寸的机型更具竞争力。同时,在保持高性能的同时大幅降低成本也让人工智能部署变得更加容易和预算更加合理。

除了出色的性能外,Gemma 2还具有跨硬件快速推理的能力。用户可以在各种硬件设备上使用Gemma 2进行全精度运行,并通过Google AI Studio解锁本地性能。另外,用户还可以尝试使用Hugging Face Transformers来在配备NVIDIA RTX或GeForce RTX的家庭电脑上进行测试。

总的来说,谷歌公司推出的Gemini 2大语言模型将极大地改变人工智能领域的发展方向,并为研究人员和开发人员提供更多的选择和可能性。