谷歌人工智能的最新版本–Gemini 1.5 Pro–现在可以听到您的声音了。
Gemini是谷歌重新命名的机器人,以前叫 Bard,,而 “Gemini 1.5 Pro “则是今年 2 月向少数开发者推出的最新版本。Gemini 1.5 Pro 能够处理文本、代码、视频和(现在)上传的音频流,包括视频中的音频。
实际上,对音频文件的支持意味着用户可以使用 Gemini 1.5 Pro 从收益电话中收集信息、转录采访录音或分析带有音频的视频–基本上可以分析任何类型的音频文件。人工智能可以处理包括 1 小时视频、11 小时音频、30,000 行代码或超过 700,000 个单词的提示信息。
谷歌还将 Gemini 1.5 Pro 作为公开预览版提供给那些可以访问顶点人工智能的用户,但目前还没有公开测试版。目前,大多数用户通过 Gemini 聊天机器人与谷歌的人工智能互动。