
Claude3、GPT4、Gemini等33款大模型通通免费! 抓紧用,手慢无
Claude3、GPT4、Gemini等33款大模型通通免费! 抓紧用,手慢无
发现了一个可以免费体验大模型的地方。
先说结论——确实可用。
它目前它支持包括Claude3、GPT4与Gemini等在内的33款大模型。下图这个列表几乎覆盖了市面上所有知名厂商。
四种体验方式
这是一个测试与收集大模型使用效果的平台。目前你可以通过以下四种方式参与测试。
两款大模型之间匿名PK——Arena(battle)
两款大模型之间实名PK——Arena(side-by-side)
与一款大模型文字聊天——Direct Chat
支持图片的聊天——Vision Direct Chat
1. 匿名PK——Arena(battle)
在个这模式中,你的问题会被随机分配给这33款大模型中的任意两款进行回答。只有当你完成投票后,系统才会告诉你参与PK的大模型分别是谁。规则中有一条挺有意思,如果在对话过程中模型的身份被识破,则投票无效。
举例:
比如在这个例子中,从下图可以明显看出右侧答案比左侧更加完整。在我选择“B is Better”后,知道右侧的答案来自Claude3的opus。
我很喜欢这个模式,因为它让我更加关注实际效果而非品牌影响力。有时候确实会出现非常棒的答案来自非著名小厂的情况。
不过对于如何定义“更好”,个人因素会让标准显得不那么清晰。比如下面这个结果,从内容覆盖面上肯定是opus胜出,但我更喜欢sonnet简洁的回答。
2. 实名PK——Arena(side-by-side)
在这个模式中你可以直接根据名字来选择两款大模型进行PK。相信很多人就是冲着这个模式来的,毕竟可以同时免费使用Claude3与GPT4,并直观地进行效果对比。
举例:
比如下图中,我询问是否可以发送文章链接并进行分析,gpt4的答案里包含了正确的内容。目前各家大模型都仅在角色扮演的前提下,偶尔对外链进行正常访问与分析,大部分情况下是无法获得满意效果的。
3. 文字单聊——Direct Chat
在这个模式下,你可以直接选择一款大模型进行体验。从介绍中能看出来,这个模式的作用是为了推广新模型,比如Llama2。比如当你在使用上面匿名PK时发现一款效果还不错的大模型,那么可以省去注册开通的麻烦,直接来这里继续进行体验。
4. 支持图片的聊天——Vision Direct Chat
目前在这个模式中仅支持LLaVA下的三款大模型,而且每次对话只能上传一张不超过15MB大小的图片。
以图作诗
我从硬盘里上传了一张自己喜欢的图片,尝试让这个未曾深入了解过的模型来作一首诗:
遗憾,不支持中文内容解析
我将自己的简历转换成PNG格式进行上传,以往在Gemini,Claude的模型中可以获得的分析在这里无法实现。
大模型比分排行榜
所有的投票都会记录下来,最终形成一个针对各种大模型的比分排行榜。
可以看到,根据这里的投票情况,GPT4依然稳坐头把交椅。紧接着是Claude3与GeminiPro。我个人更认可这个排序。欢迎你在评论里分享你的观点。
这里的模型是真的吗?
我连续免费用了好几天,即使在使用GPT4时遇到条数限制的提示,换个IP也能继续使用。这个平台的成本可不低啊,确实会让人不禁产生疑问,会不会使用的大模型是假的呢?而且确实有朋友在使用的过程中,发现这里的GPT4偶尔有明显“名不副实”的表现。
我做了几个摸底的尝试,分享一下:
我试着问过一个简单的问题,“你的创造团队来自哪里?”。有意思的是所有gpt模型都不愿透露团队名字,而所有名为Claude的模型都是最诚实的。我当时被下面这个图笑趴下
而且,我使用了它的建议,用上图中第一个与第二个问题分别在不同模型中进行了测试。从结果上看,名为GPT4的模型确实在上下文联系与概念推理上明显强于其它模型,Cluade3也表现很突出。
虽然目前这些依然不能解除我心中的疑虑,但确实很够用。现在知道这个平台的人还不多,抓紧时间来玩耍吧!周末愉快!