谷歌和OpenAI杠上了！Gemini发布新模型：gemini-1.5-flash-latest

随着昨日OpenAI发布模型“GPT-4o”，谷歌在今天也发布了Gemini模型相关的升级模型：Gemini1.5-Flash

“我们希望每个人都能从 Gemini 所做的事情中受益，”皮查伊说。他还透露了 Gemini 将如何融入谷歌的许多服务中。人们使用 Google 搜索的方式比以往任何时候都多，关键字搜索的时间甚至更长。

SmallAI已接入无限制可用GPT-4o/Gemini/Claude3

Gemini 1.5 Flash

谷歌推出了公共预览版 Gemini 1.5 Flash，这是 Gemini 1.5 Pro 的“精炼”版本，是专为“窄”、“高频”生成 AI 工作负载而构建的小型高效模型。

Flash 拥有多达 200 万个 token 上下文窗口，与 Gemini 1.5 Pro 一样是多模式的，这意味着它可以分析音频、视频和图像以及文本。

此外，超过 150 个国家/地区和超过 35 种语言的 Gemini Advanced 用户可以利用 Gemini 1.5 Pro 的更大上下文，让聊天机器人分析、总结和回答有关长文档（最多 1,500 页）的问题。

谷歌搜索负责人 Liz Reid 宣布了对全球主导搜索引擎进行人工智能驱动的重大变革。

以往，当用户在使用搜索引擎时，通常以文字或图片形式呈现。

如今，作为推动将生成式人工智能添加到搜索中的一部分，谷歌引入了一个新的转折点：视频。Gemini 会让用户上传演示其要解决的问题的视频，然后启动搜索在论坛和互联网的其他区域以找到解决方案。

除了将 Gemini 能力加持到搜索引擎外，Gemini 还将为 Gmail 应用程序提供一些有趣的新功能，包括长电子邮件线程的摘要。用户还可以直接与 Gemini 聊天，从整个收件箱中查找详细信息。

下一代开放模型 Gemma 再迎重大更新

谷歌也在发布会上带来了旗下开源大模型Gemma的最新版本Gemma 2。据介绍，Gemma 2采用全新架构，参数上达到27B，拥有突破性的性能和效率。

Gemma 家族也在随着 PaliGemma 的扩展而扩展。据悉，PaliGemma 是谷歌受 PaLI-3 启发的第一个视觉语言模型。他们还使用 LLM Comparator 升级了 Responsible Generative AI Toolkit，用于评估模型响应的质量。