AI 社区驱动的评估(Community Evals):为何我们不再信任 AI 厂商的官方榜单 社区驱动的评估(Community Evals):为何我们不再信任 AI 厂商的官方榜单引言:当“刷榜”成为常态在 2024 年和 2025 年,AI 领域最常见的口水战就是厂商之间的榜单博弈。每当一个新模型发布,它总是声称在 MML...