品玩6月8日讯,由伯克利大学主导一个团队 LMSYS Org 近日发布了一个针对大语言模型的基准平台 Chatbot Arena。
据悉,该平台采用匿名、随机的方式进行对抗评测,评测方式基于国际象棋等竞技游戏中广泛使用的 Elo rating system。排名通过用户投票产生,系统每次会随机选择两个不同的大模型机器人和用户聊天,并让用户在匿名的情况下判定哪款大模型产品的表现更好一些。 Elo rating system会根据用户的选择后判定大模型产品的积分,并以排行榜的形式出现在首页中。
目前OpenAI 的ChatGPT-4排名第一,之后是 Anthropic 的claude,同样来自 Anthropic 的 claude Instant 排名第三。
LMSYS Org 是一个松散的研究组织,由加州大学伯克利分享额学生团队组建,曾推出过大语言模型小羊驼。
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如有侵权麻烦联系邮箱2697381891@qq.com删除文章!
源码库 » 模型大乱斗,小羊驼团队推出大模型竞技平台Chatbot Arena
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 如有侵权麻烦联系邮箱2697381891@qq.com删除文章!
源码库 » 模型大乱斗,小羊驼团队推出大模型竞技平台Chatbot Arena