Skip to content

[需求] 希望支持aime2026数据集的精度测试 #211

@chenweiqiang11

Description

@chenweiqiang11

问题/痛点描述

目前从指导和代码上 ,还未发现支持aime2026

建议方案

参考aime2025和aime2024数据集的实现方式

备选方案

No response

预期价值

aime2026数据集为开源数据,是衡量衡量模型精度重要指标

参与意向

  • 我愿意参与此功能的开发或测试

Metadata

Metadata

Labels

Type

No type

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions