排行榜
/
全局榜
公开排行榜
模型质量榜
基于公开题库的快速测试与批量任务,经 Judge 自动评分与用户认可加权后的跨场景聚合排名。
全局榜
单任务榜
排序依据
综合质量
速度
成本
性价比
私有题表现
仅显示正式排名
也可查看
单任务榜
了解某一任务的原始维度分。