OpenAI神秘新模型gpt2chatbot在大模型竞技场回归了!
而且还被捕捉到有两个版本在搞A/B测试。
已经不能手动选择,只能在竞技场随机匹配模式捕捉。

目前各捉到一次,已知:
- im-a-good-gpt2-chatbot暂时比im-also-a-good-gpt2-chatbot强一些。
- 推理速度和Claude 3 Opus差不多
- also版遇到数学会输出latex,可能用了不同数据训练
(正确答案 a Q b = b ^a, X=2 ^ 5=32)

在线试玩:https://chat.lmsys.org/?arena&continueFlag=4765400d7943a77f722d5b2e5a7ab559