随着昨日OpenAI发布模型“GPT-4o”,谷歌在今天也发布了Gemini模型相关的升级模型:Gemini1.5-Flash

“我们希望每个人都能从 Gemini 所做的事情中受益,”皮查伊说。他还透露了 Gemini 将如何融入谷歌的许多服务中。人们使用 Google 搜索的方式比以往任何时候都多,关键字搜索的时间甚至更长。

SmallAI已接入无限制可用GPT-4o/Gemini/Claude3

Gemini 1.5 Flash

谷歌推出了公共预览版 Gemini 1.5 Flash,这是 Gemini 1.5 Pro 的“精炼”版本,是专为“窄”、“高频”生成 AI 工作负载而构建的小型高效模型。

Flash 拥有多达 200 万个 token 上下文窗口,与 Gemini 1.5 Pro 一样是多模式的,这意味着它可以分析 音频、视频和图像以及文本。

此外,超过 150 个国家/地区和超过 35 种语言的 Gemini Advanced 用户可以利用 Gemini 1.5 Pro 的更大上下文,让聊天机器人分析、总结和回答有关长文档(最多 1,500 页)的问题。

谷歌搜索引擎颠覆式变革

谷歌搜索负责人 Liz Reid 宣布了对全球主导搜索引擎进行人工智能驱动的重大变革。

以往,当用户在使用搜索引擎时,通常以文字或图片形式呈现。

如今,作为推动将生成式人工智能添加到搜索中的一部分,谷歌引入了一个新的转折点:视频。Gemini 会让用户上传演示其要解决的问题的视频,然后启动搜索在论坛和互联网的其他区域以找到解决方案。

除了将 Gemini 能力加持到搜索引擎外,Gemini 还将为 Gmail 应用程序提供一些有趣的新功能,包括长电子邮件线程的摘要。用户还可以直接与 Gemini 聊天,从整个收件箱中查找详细信息。

下一代开放模型 Gemma 再迎重大更新

谷歌也在发布会上带来了旗下开源大模型Gemma的最新版本Gemma 2。据介绍,Gemma 2采用全新架构,参数上达到27B,拥有突破性的性能和效率。

Gemma 家族也在随着 PaliGemma 的扩展而扩展。据悉,PaliGemma 是谷歌受 PaLI-3 启发的第一个视觉语言模型。他们还使用 LLM Comparator 升级了 Responsible Generative AI Toolkit,用于评估模型响应的质量。