谷歌Gemini

当地时间12月6日周三，谷歌正式向公众发布新一代大语言模型Gemini，号称谷歌迄今为止“最大、也最全能的AI模型”，有高级推理能力，回答难题时“考虑得更仔细”。有别于其他公司LLM竞品的是，谷歌强调Gemeni是最灵活的模型，因为它用不同大小的版本，可以适用于各种生成式AI应用。

Gemini总共有三个版本：面对高度复杂任务的Gemini Ultra；用于一般多任务处理的Gemini Pro，以及应用于用户设备端侧的Gemini Nano。

Gemini Nano已经可以应用于谷歌的Pixel 8系列智能手机；Gemini Pro即日起支持AI聊天机器人Bard，下周面向云客户；最强大版Gemini Ultra明年推行，同时也可以支持Bard。

在32项行业大模型基准指标测试中，Gemini有30种“遥遥领先”GPT-4；Gemini为原生多模态模型，支持文本和图像的服务，速度更快、效率更高，在谷歌更高性能云芯片TPU v5p训练，谷歌搜索明年融入Gemini功能。

“谷歌运行了32个完善的基准测试来比较Gemini和GPT-4，从广泛的整体测试（如多任务语言理解基准测试）到比较两个模型生成Python代码的能力。”谷歌DeepMind首席执行官德米斯·哈萨比斯表示：“我认为我们在32项基准中的30项中大幅领先。”

最新的演示里，Gemini能听能说能看，还能教人类说中文。在谷歌角度看爱，Gemini Pro版本对标GPT-3.5版本，而明年发布的Gemini Ultra则对标GPT-4。


官方网址：deepmind.google/technologies/gemini

前往官网