资格审查流程
资格审查概述
参赛队伍需要将“资格赛最终提交结果”对应的模型和源代码提交至组委会。“资格赛最终提交结果”指代的是每支队伍最终参与资格赛排名所对应的结果。
重要提醒:资格审查提交的模型将作为决赛阶段的其中一个模型。另外一个模型在决赛阶段提交,两者取测试集效果高者作为决赛成绩。
举例
- 参赛队伍:A队伍最终在资格赛榜单上的结果为74.2%,其对应的prediction文件为
a.json
。则A队伍需要将生成a.json
对应的程序进行打包,发送给组委会进行审查。 - 组委会:通过运行参赛队伍提交的程序生成prediction文件
b.json
。比对b.json
是否和线上的a.json
文件内容一致。同时根据系统描述文档审查系统是否符合大赛各项要求。
主要审查内容
- 开发集与测试集结果是否存在较大差异。
- 源代码和模型能否准确地复现资格赛提交结果。
- 训练数据是否符合大赛要求。再次强调:不能将开发集放入训练集进行训练。 见:数据要求
- 队伍是否存在违反比赛规则的行为(例如注册多个账号等)。
- 源程序zip压缩包应小于10G限制。
重要时间
提交代码时间:2022年8月1日-2022年8月7日 23:59(北京时间,UTC+8)
资格审查结果通知时间:2022年8月15日
注: 1、资格审查结果仅公布是否通过,即是否进入最终决赛,不会告知测试集结果。 2、超时未提交则视为放弃比赛。
提交流程
所有队伍将采用线下评测的方式提交代码,参赛队伍需要将打包好的zip文件发送给组委会。
zip文件应按以下规范进行整理:
- 必须包含运行程序必要的源代码和模型文件。
- 程序主入口为单个shell脚本,即
run.cmrc.sh
(抽取型)或run.c3.sh
(选择型)。运行格式为run.sh input_file output_file
,其中input_file
为数据集JSON文件、output_file
为模型输出文件JSON文件。如程序包含多个步骤,请放在run.sh
内处理。 - 系统描述文档,简要填写系统的主要情况,包括训练数据来源和大小、程序运行环境说明(包括依赖的库及其版本)等。描述文档请使用模板填写:模板下载地址
- 系统描述文档和zip压缩包请分别命名为
cmrc2022_system_NAME
(.docx/.zip),其中NAME
为codalab账号名。 - 准备好上述压缩包后,请队伍联络人使用注册邮箱将zip压缩包发至组委会邮箱
cmrc2022@126.com
。推荐使用百度网盘或阿里网盘等,请勿使用小众且限速的网盘。邮件主题:CMRC2022资格审查代码提交(codalab名:) 邮件内容:(自拟) (附源程序zip压缩包)
注意:
- 由于有一周的时间准备代码,提交之前请务必线下测试好再发送。
- 因参赛队伍自身问题导致程序无法运行等情况,其后果由参赛队伍自行承担。
- 参赛队伍应预留一定时间,提早提交代码(而不是在最后一刻提交),以免程序出现bug导致拖慢进度,甚至失去决赛资格。
- 请勿尝试访问开发集或测试集的标签(label),此部分已做相应处理。
隐私声明
参赛选手所提交的代码和模型将保存至本届评测结束,以便CMRC 2022以及CCL 2022委员会备查。 除以上用途外,相关资源不会透露给第三方,并将在评测结束后在服务器上彻底删除。