Claude3、GPT4、Gemini等33款大模型通通免费! 抓紧用，手慢无

发现了一个可以免费体验大模型的地方。

先说结论——确实可用。

它目前它支持包括Claude3、GPT4与Gemini等在内的33款大模型。下图这个列表几乎覆盖了市面上所有知名厂商。

四种体验方式

这是一个测试与收集大模型使用效果的平台。目前你可以通过以下四种方式参与测试。

1. 匿名PK——Arena(battle)

在个这模式中，你的问题会被随机分配给这33款大模型中的任意两款进行回答。只有当你完成投票后，系统才会告诉你参与PK的大模型分别是谁。规则中有一条挺有意思，如果在对话过程中模型的身份被识破，则投票无效。

举例：

比如在这个例子中，从下图可以明显看出右侧答案比左侧更加完整。在我选择“B is Better”后，知道右侧的答案来自Claude3的opus。

我很喜欢这个模式，因为它让我更加关注实际效果而非品牌影响力。有时候确实会出现非常棒的答案来自非著名小厂的情况。

不过对于如何定义“更好”，个人因素会让标准显得不那么清晰。比如下面这个结果，从内容覆盖面上肯定是opus胜出，但我更喜欢sonnet简洁的回答。
2. 实名PK——Arena(side-by-side)

在这个模式中你可以直接根据名字来选择两款大模型进行PK。相信很多人就是冲着这个模式来的，毕竟可以同时免费使用Claude3与GPT4，并直观地进行效果对比。

举例：

比如下图中，我询问是否可以发送文章链接并进行分析，gpt4的答案里包含了正确的内容。目前各家大模型都仅在角色扮演的前提下，偶尔对外链进行正常访问与分析，大部分情况下是无法获得满意效果的。

3. 文字单聊——Direct Chat

在这个模式下，你可以直接选择一款大模型进行体验。从介绍中能看出来，这个模式的作用是为了推广新模型，比如Llama2。比如当你在使用上面匿名PK时发现一款效果还不错的大模型，那么可以省去注册开通的麻烦，直接来这里继续进行体验。

4. 支持图片的聊天——Vision Direct Chat

目前在这个模式中仅支持LLaVA下的三款大模型，而且每次对话只能上传一张不超过15MB大小的图片。

以图作诗

我从硬盘里上传了一张自己喜欢的图片，尝试让这个未曾深入了解过的模型来作一首诗：

遗憾，不支持中文内容解析

我将自己的简历转换成PNG格式进行上传，以往在Gemini，Claude的模型中可以获得的分析在这里无法实现。

大模型比分排行榜

所有的投票都会记录下来，最终形成一个针对各种大模型的比分排行榜。

可以看到，根据这里的投票情况，GPT4依然稳坐头把交椅。紧接着是Claude3与GeminiPro。我个人更认可这个排序。欢迎你在评论里分享你的观点。

这里的模型是真的吗？

我连续免费用了好几天，即使在使用GPT4时遇到条数限制的提示，换个IP也能继续使用。这个平台的成本可不低啊，确实会让人不禁产生疑问，会不会使用的大模型是假的呢？而且确实有朋友在使用的过程中，发现这里的GPT4偶尔有明显“名不副实”的表现。

我做了几个摸底的尝试，分享一下：

我试着问过一个简单的问题，“你的创造团队来自哪里？”。有意思的是所有gpt模型都不愿透露团队名字，而所有名为Claude的模型都是最诚实的。我当时被下面这个图笑趴下

而且，我使用了它的建议，用上图中第一个与第二个问题分别在不同模型中进行了测试。从结果上看，名为GPT4的模型确实在上下文联系与概念推理上明显强于其它模型，Cluade3也表现很突出。

虽然目前这些依然不能解除我心中的疑虑，但确实很够用。现在知道这个平台的人还不多，抓紧时间来玩耍吧！周末愉快！