谷歌I/O 2024如期来了,眼花缭乱地发布了一堆更新。
跟OpenAI半小时的「小而美」发布会相比,谷歌显然准备得更加充分,当然,时间也相当之长……
2个多小时的发布会也是挑战着观众们的极限,在场人群早已困倒一大片
准备好,谷歌要开始轰炸了。
首先,Gemini 1.5 Pro,上下文长度将达到惊人的200万token。
然后,面对昨天OpenAI GPT-4o的挑衅,谷歌直接甩出大杀器Project Astra,视觉识别和语音交互效果,跟GPT-4o不相上下。
接着,谷歌祭出文生视频模型Veo硬刚Sora,效果酷炫,时长超过1分钟,打破Sora纪录。
最后来了一个重磅消息:谷歌搜索将被Gemini重塑,形态从此彻底改变!我们不再需要自己点进搜索结果,而是由多步骤推理的AI Overview来代办一切。
发布会结束后,劈柴甚至还用Gemini算了一下,整个发布会共提了121次AI。
Gemini时代,来了
CEO劈柴上来就无视了GPT和Llama的存在,这样总结道:「我们完全处于Gemini时代」。
并且给出数据:如今全世界使用Gemini的开发者,一共有150万人。
万众瞩目的Gemini更新如期而至。
Gemini 1.5 Pro最强特性之一,就是超长的上下文窗口,达到了100万tokens的级别,超过了目前所有的大语言模型,而且开放给个人用户使用。
今天,劈柴宣布:它的上下文token数将会达到2000K(200万)!相比之下,GPT-4 Turbo只有128K,Claude 3也只有200K。
而这也意味着——你可以给模型输入2小时视频、22小时音频、超过6万行代码或者140多万单词。
2M长上下文窗口,可以去排队申请了
这个上下文长度,已经超过了目前所有大模型。
但是,这并不是终点,谷歌的目标是——无限长上下文,不过,这就是后话了。
用篮球讲解牛顿运动定律
在这样的Gemini加持下,我们可以实现许多迅捷的功能。
比如,作为父母需要了解孩子在学校的情况,就可以在Gmail中要求Gemini识别所有关于学校的电子邮件,然后帮你总结出要点。