反击OpenAI,谷歌多模态大模型Gemini上线,碾压GPT4
当地时间12月6日,谷歌CEO桑达尔·皮查伊官宣 Gemini 1.0 版正式上线。据悉,这是迄今为止规模最大,能力最强的谷歌大模型。
桑达尔·皮查伊在一篇博文中写道:“这个新模型代表了我们作为一家科技公司所做的最大的科学和工程努力之一,它也是一个多模态基础模型,可以概括和理解不同类型的信息,包括文本、代码、音频、图像和视频。”
据悉,Gemini 1.0在谷歌内部筹备了一年之久,以应对当时引起巨大轰动的GPT4。目前,Gemini 1.0包括三种不同套件,分别是Gemini Ultra,、Gemini Pro以及Gemini Nano,不同量级的Gemini,可以触达到不同范围,能够高效地运行在数据中心和移动设备等多类型平台上。。
其中,Ultra的能力最强,复杂度最高,能够处理最为困难的多模态任务;Pro能力稍弱,是一个可扩展至多任务的模型;Nano则是一款可以在手机端侧运行的模型。
谷歌对 Gemini 模型进行了严格的测试,并评估了它们在各种任务中的表现,从表现来看,Gemini被称为当下能力最强的大模型。据了解,从自然图像、音频和视频理解,到数学推理等任务,Gemini Ultra 在大型语言模型研发被广泛使用的 32 个学术基准测试集中,在其中 30 个测试集的性能超过当前 SOTA 结果。
此外,Gemini Ultra 在 MMLU(大规模多任务语言理解数据集)中的得分率高达 90.0%,首次超越了人类专家,更是超过了GPT4的86.4%的得分率。
在应用规划方面,谷歌将在其产品中添加 Gemini,进行全线升级。谷歌的类 ChatGPT 应用 Bard 已经升级到了Gemini Pro版本,实现了更为高级的推理、规划、理解等能力,同时继续保持免费。而谷歌预计在明年初将推出Bard Advanced,将使用 Gemini Ultra。
在硬件上,谷歌还将 Gemini 引入了 Pixel。Pixel 8 Pro 将是第一款运行 Gemini Nano 的智能手机。接下来,Gemini 将陆续出现在谷歌其他的产品和服务中。