《第七届信也科技杯操作手册.docx》由会员分享,可在线阅读,更多相关《第七届信也科技杯操作手册.docx(17页珍藏版)》请在三一办公上搜索。
1、第七届信也科技杯操作手册目录第七届信也科技杯操作手册1注册2登录2报名3组队4账户设置和消息通知5赛程说明6初赛7初赛阶段一7初赛阶段二8复赛8复赛阶段一8复赛阶段二9决赛9决赛阶段一9决赛阶段二9决赛日10镜像提交相关说明101 .提交说明10操俯旨南102 .资源配置113 .基础镜像114 .镜像要求125 .代码规范13注册在报名比赛前,各位选手需要先在信也Al网站(更)注册一个账号,注册入口详见下图(如已注册,请跳过此步骤); 请根据要求准确填写个人用户名,手机号,验证码、手机动态码和密码; 请确保注册的手机号为本人使用,并保持畅通,后续会通过注册手机号发送晋级和获奖通知; 请认真阅
2、读用户协议,点击勾选表示同意此协议,点击“确认注册后,我们将为您创建个人账号登录点击信也Al网站(祖)右上角登录按钮进入登录页,您可以选择密码登录或手机动态码登录;报名比赛需在登录状态下进行密码登录,填写注册账号时确认的用户名和密码及图片验证码登录手机动态码登录(请确保填写的本人手机畅通)报名登录后,请点击顶部菜单信也科技杯”,进入比赛列表页,找到第七届信也科技杯图算法大赛一一欺诈用户风险识别,点击标题进入比赛详情页,在详情页右上角找到“报名按钮”即可完成报名。报名后请进行实名认证,未进行实名认证的选手将无法下载和查看数据集。笫七届信也科技杯图算法大赛一欺诈用户风险识第七Bta科技杯SE法大春
3、,于2022年6月11日至202困月期可举行,与三丽达31万人民币.届大畜以*爱凤拄为场L从用户相互关联和3的次角,算裁满是双拄员女物靖求的,可窜腐.覆必映E样蛀网多应用力有,从那口助JS好出崂9欧诈用户AJtt7费队伍3时间2022W11-2022/0940*310,000止在出I聚唐颤创隹搜市用第七届信也科技杯图箕法大篓欺诈用户风险识别报的止日时202207/11“认3“07M-be三Wf三WW.于2022W月11日至2022华9月0现存行.S案如231万人民不,定S;MRRHW校方制L从用户足耳关盆町修*总角.FQi足又以反切MW祕.可隹.吗我钙的脸网络应用方有.从成的斯侬为必汴用户.参
4、赛成功状态WUhWffBq聚焦黝创Fi三授市用第七届信也科技杯图算法大赛欺诈用户风险识别侬触日期282MF皿3MA,,H-t三Gi三qEB三W.于其22年6月11日至XS年9月网间里行.忌笑也这31万人品行.率届大!以1?睢凤庄为场IL从用户相互关联幻Me减禽.夕红足及拄爱4*翎电M涕.三Jfi.昭理灌。蛆月端应用方上,从无.助更好SS况B州*用户.组队报名成功后,您可以和其他报名选手组队参赛,也可以单人成组,比赛成绩将以组为单位公布并排名;组队需要提交队伍logo,队名,以及队伍介绍,请按要求填写,组队上限5人;只有队长可以邀请其他队员加入,队长身份可转让;选手也可以在我的团队一一加入其他团
5、队页面下申请加入其他团队。组队操作页面如下:箕七日信。技侬Blt强大典.于2加月11日至2022年9月期好8行.8奖赛迎31万人艮而.WB大M以*彩脏为图IL欣用户IBq关般i3肠喉河角.夕g足贝MW评依SOTF的.可性.三f数的三J蛀网络应用方W.Alt映昆好与浜别对t里Q.8秀作昌宴切介绍谩交结一曲JBJU建行&决入AK心*晦a队nNmk伍与比克n-tamtummr三V一欺件用户级?团队头EEa名符杂初EW*或由。*.BT学M亦或团队介始拿E工人”0个字H由子力tr判O=加入其他团队操作如下UMWW t2露唐殿刖1/日授市用第七届信也科技杯图算法大赛欺诈用户风险识别fiSttltSK 2Z
6、07f11#U 3 M 1M-e8traBXX.于2。22隼6月IlBmo22年S月侬0? eNWZ3l万人艮石.TSXUW6fi.从用户每互关*lW9 角,身IBlS风检反欺许族”轴匚可天或.充刖&3延事立用方上 从无.的更好型责欧作用户.优秀作晶安勒介出至交IaK细烟队林行决ILMS名单ett&uISQ人幽队账户设置和消息通知点击信也Al网站(祖)右上角个人账号,您可以进入个人主页,修改个人资料,设置账户和查看站内信消息; 比赛关键节点我们会通过站内信的方式通知各位参赛选手,请注意查看; 报名组队相关操作记录也将以站内信的形式通知选手,请随时关注; 收到站内信消息,个人账号会出现消息角标,
7、注意关注。赛程说明比赛关键时间节点及相关说明:赛程报名初赛评测初赛审核复赛评测复赛审核决赛材料提交决赛审核决赛日起始日期2022/6/62022/6/112022/7/162022/7/282022/8/152022/8/192022/8/50待定结束日期(含)2022/7/152022/7/152022/7/272022/8/142022/8/182022/8/292022/9/13融晋级方式一提交偿测结果在线打分提交代码线下审核提交镜像在她推断打分境下审核评测阶段镜像按照要求三35WI线下审核三3tWI钠晋级数量301510每日提交上限S2S2单次文件大小5OMSGIOG文件格式11pyZ
8、lP魂像本次比赛大致可分为三个赛段:初赛,复赛和决赛。为了保证比赛公平公正,我们在赛段之间加入了评审环节,评审环节主要是针对选手提供的作品做线下人工复核,确保晋级小组符合晋级条件。比赛过程中作品均通过以下入口提交,不同赛段提交作品内容,格式,流程会有差异,请详细阅读页面提交说明,严格按照要求提交:聚点酗ElI F隹授市用第七届信也科技杯图目法大赛欺诈用户风险识别s*皿力”“从J Eat七SSfB班技晒配吞Xir于“22照月11日至2022月*.RMEK31万人反梏.5SXUWS.从用户相互笑电刈心* .励H5fi反咬诈镂WII季的E史最.充确便但限格或用方会,从而.际更好MRg皿炸用户.优秀作
9、Sa介招提文结果建行。决 MAS初裹舱段一 投交绘止时间:谪述手注意很交通追将于2022/07/1423:59:59美闵. IS玄IIagJ0摩=提交测试柱本的文更结累文件格式为npy 也交次数要求悠铝雷天可展交欹.以点击IS交力依据,无论打分成功与否均的入提交次级,谓SwIlS交: 援交脸址要或0次提交文件不M1260MB超过上限将无法提交; 排名方式:”JfU小怛提交为学位帙历史珍殳Ii好打分Wlm名.如提交皑SWJ分未超过历史最好谢8,料不5MM非名; 昌级说明:的白卷窿团队都可以进入奏程下Trtfifi交代码:建交历史文用5标仲审g4分初赛:!匕京时间2022/06/1100:00:0
10、0-2022/07/2723:59:59初赛分为以下两个阶段:阶段一初赛评测:北京时间2022/06/1100:00:00-2022/07/1523:59:59阶段二初赛审核:北京时间2022/07/1600:00:00-2022/07/2723:59:59初赛阶段一初赛阶段一为初赛评测阶段,我们将提供初赛图数据,选手可在初赛开始后下载数据,本地调试算法,在线提交测试样本的预测结果。相关说明如下: 提交截止时间:请选手注意提交通道将于2022/07/1423:59:59关闭。 提交作品格式要求:选手需要提交测试样本的预测结果文件,格式为npy; 提交次数要求:每组每天可提交5次,以点击提交为依
11、据,无论打分成功与否均计入提交次数,请谨慎提交; 提交作品大小要求:单次提交文件不超过50MB,超过上限将无法提交; 排名方式:初赛以小组提交为单位,按历史提交最好打分结果排名,如提交结果打分未超过历史最好成绩,将不更新排名; 晋级说明:所有参赛团队都可以进入赛程下一阶段提交代码。.初赛阶段二初赛阶段二参赛团队需要在线提交模型训练&推断代码(代码规范详见结果评估”页面),组委会将对代码进行线下审核,识别使用作弊手段的团队。相关说明如下: 提交截止时间:请选手注意提交通道将于2022/07/2623:59:59关闭。 提交作品格式要求:选手需要提交代码压缩包文件,文件格式为zip; 提交次数要求
12、:每队每天可提交2次,以点击提交依据; 提交作品大4凄求:单次提交文件不超过5GB,超过上限将无法提交; 晋级说明:组委会根据团队在初赛阶段一的打分排名,结合线下代码审核,选择符合要求的Top30团队晋级。晋级团队会收到短信和站内信通知,选手可通过初赛排行榜页面查看晋级名单。含主办方集团员工参赛队伍不占用晋级名额,如遇)顺延。.复赛北京时间2022/07/2800:00:00-2022/08/1823:59:59复赛分为以下两个阶段阶段一复赛评测:北京时间2022/07/2800:00:00-2022/08/1423:59:59阶段二复赛审核:北京时间2022/08/1500:00:00-20
13、22/08/1823:59:59复赛阶段一复赛阶段一参赛团队使用初赛图数据线下调试算法、提交d。Cker镜像对复赛测试样本进行线上推断打分。复赛提交页面将在复赛开始当天对晋级团队成员开放,相关说明如下: 提交截止时间:请选手注意提交通道将于2022/08/1323:59:59关闭。 镜像提交相关说明:晋级团队请按照镜像提交相关说明“部分将镜像推送至指定仓库,然后在复赛提交页面提交镜像地址,等待打分结果; 提交次数要求:复赛每组每天可提交5次,以点击提交为依据,无论镜像是否成功运行,请谨慎提交。同一团队需要上一轮推理打分流程结束后才能再次提交; 提交作品大(J凄求:镜像大小不能超过IOG,超过上
14、限将无法运行,当次提交成绩为0; 排名方式:以团队提交为单位,按历史提交最好打分结果排名,如提交结果打分未超过历史最好成绩,则不更新排名。 晋级说明:组委会将在复赛阶段二对参赛团队提交的docker镜像进行线下审核。复赛阶段二复赛阶段二为审核阶段,主办方将对复赛阶段一的docker镜像进行线下审核,结合复赛评测阶段排名和审核结果,主办方将邀请TOP15的团队提交决赛材料。晋级团队会收到短信和站内信通知,选手可通过复赛排行榜页面查看晋级名单决赛:!匕京时间2022/08/1900:00:00-2022/09/17决赛分为以下三个阶段阶段一提交材料:北京时间2022/08/1900:00:00-2
15、022/08/2923:59:59阶段二决赛审核:北京时间2022/08/3000:00:00-2022/09/1323:59:59阶段三决赛日:北京时间2022/09/17决赛阶段一决赛阶段一为提交材料阶段,参赛团队需提交决赛答辩所需材料以及复赛训练&推断代码镜像。相关说明如下: 提交作品格式要求:选手需要提交包括答辩PPT、参赛总结、算法设计等,文件格式为zip;同时选手还需提交包含完整复赛训练&推断代码的docker镜像,组委会将对镜像进行线下审核; 提交次数要求:每组每天可提交1次,以点击提交为依据,请谨慎提交; 提交作品大,J凄求:单次提交zip文件不超过5GB,超过上限将无法提交;
16、提交镜像大小上限为IOGB; 排名方式:决赛环节不再线上排名; 晋级说明:决赛阶段一(2022/08/29)结束,我们将关闭提交通道;组委会将在决赛下一阶段对选手提交的作品进行线下评审,筛选出符合决赛答辩资格的队伍名单。决赛阶段二决赛提交材料阶段结束后,组委会将对各参赛团队提交的最新作品进行审核。组委会将筛选出符合决赛答辩资格的队伍名单,晋级队伍上限为10支。届时主办方将通过选手在网站注册时预留的手机号进行邀约,请保证手机畅通。如邀约失败将取消比赛资格,并根据复赛排行榜对决赛队伍进行候补。决赛日北京时间2022/09/17 决赛将以答辩会的形式进行,晋级决赛团队需提前准备答辩材料,最终以决赛准
17、备时间截止前最新一次提交的材料为准。答辩要求将另行邮件通知决赛队伍。 决赛现场,主办方会邀请权威评委对各队选手的答辩内容做点评,并根据选手综合表现给出评分。最终会结合复赛客观成绩和现场答辩成绩加权平均后给出名次。 决赛时间将会另行通知。镜像提交相关说明1.提交说明第七届信也科技杯比赛平台提供了基于GPU计算资源提交镜像的方式。选手需基于官方基础镜像将本地代码打包成镜像使用分配的账号密码招镜像推送至指定的容器镜像仓库。在复赛提交页面中输入镜像地址后,比赛平台会拉取镜像并运行,对复赛测试集进行线上推断。选手可在提交页面下方查询评测状态、结果和部分报错日志。我们会在2022/7/27号,根据晋级复赛
18、团队队长的手机号,以短信方式通知为每支队伍分配的容器镜像账号、密码、仓库名,请注意查收。为了合理分配资源,每支队伍只能使用CPU算力和一张GPU卡算力,镜像总运行时间不超过30分钟,超时镜像运行会被强行中断,提交成绩为Oe操作指南1 .登录DockerRegistry$dockerlogin-username=用户名Registry请使用为每支队伍分配的用户名和密码登陆。请注意,只有出现LoginSucceeded-的提示,才是登录成功。2 .从Registry中拉取镜像$dockerpullRegistryfinvcuptorch:镜像版本号3 .将镜像推送到RegiStry$dockerl
19、ogin-username=用户名Registry$dockertagImageIdRegistry做(:叩/仓库名:镜像版本号$dockerpushRegistryfinvcup仓库名:镜像版本号Imageld对应选手要提交的镜像。每支队伍都会被分配指定的仓库名、用户名、密码。2 .资源配置 CPU:8Cores GPU:NVIDIATeslaVlOO32G显存(CUDA11.1+cuDNN8) 内存:100G3 .基础镜像本次比赛提供了pytorch基础镜像、包含PyG和DGL的基础镜像,以及提交示例镜像。 Pytorch镜像Registry/finvcup/torch:1.6.0_pyt
20、hon3.7_cudal0.1_cudnn7_ubuntul8.04Registry/finvcup/torch:1.6.0_python3.7_cudal0.2_cudnn7_ubuntul8.04Registry/finvcup/torch:1.9.1_python3.8_cudal0.2_cudnn7_ubuntul8.04Registry/finvcup/torch:1.12.0_python3.8_cudal0.2_cudnn7_ubuntul8.04 PyG&Networkx镜像Registry/finvcup/torch:1.6.0_python3.7_cudal0.1_cudn
21、n7_ubuntul8.04_pygDGL&Networkx镜像Registry/finvcup/torch:1.9.1_python3.8_cudal0.2_cudnn7_ubuntul8.04_dgl示例镜像Registry/finvcup/torch:1.6.0_python3.7_cudal0.1_cudnn7_ubuntul8.04_pyg_submitRegistry/finvcup/torch:1.9.1_python3.8_cudal0.2_cudnn7_ubuntul8.04_dgl_submit示例镜像包含Dockerfile和baseline预训练的模型,可直接运行对复赛
22、测试集进行线上推断。4.镜像要求 默认工作目录设置成/workspace。 封装入口脚本,放于默认工作目录/workspace下。 提交前请确保镜像可正常运行。docker版本19及以上,可运行dockerrun-gpusall-vxydata:/xydatayourjmagesh验证。DoCker版本18,可运行nvidia-docker-vydataxydatayoujimagesh验证。 请基于官方镜像构建提交镜像。官方镜像包含在线打分所需的python包,不使用官方镜像可能造成打分失败。 提交镜像大小上限为IOG,提交之前请使用dockerimages检查镜像大小。 请使用Docker
23、file构建提交镜像,以下为Dockerfile示例:FROMRegistryfinvcup/torch:xxx# 安装APT依赖RUNapt-get-yupdate&apt-getinstallxxx清理APT缓存apt-getclean&rm-rfvarlibaptlists*&rm-Rftmp*# 安装PIP依赖RUNsourceroot.bash-profile&pipinstall-Upip&pipinstallx清理PIP缓存rm-rfroot.cachepip# 安装CONDA依赖RUNsourceroot.bash-profile&condainstall-y-ccon
24、da-forgex清理CONDA缓存findoptconda-follow-typef-name,*.a,-delete&findoptconda-follow-typef-name*js.map,-delete&condaclean-afy初赛和复赛图数据以只读方式挂载在容器内xydata目录下。具体路径如下,其中phasel和phase2分别对应初赛和复赛图数据。初赛和复赛图数据结构相同,但是请注意,复赛图数据中没有train_mask。|xydata|phasel|raw|phase2-raw5.代码规范注意:原始图数据挂载在xydata下,其余文件夹和代码在默认工作路径/works
25、pace下。1 .原始图数据文件夹xydata选手无需提交信也提供的比赛图数据。我们会把所有的原始数据放到xydata文件夹下。需要注意,初始的时候xydata文件夹会被清空,然后再放入原始图数据文件。数据结构示例如下:|xydata|phasel|raw|phase2|raw2 .特征工程文件夹feature/数据处理和特征工程的代码,请放入该文件夹中。文件夹下的子目录、文件名,选手可自行决定。3 .模型结构文件夹model/用于存放选手的模型结构模块代码文件,文件夹下的子目录、文件名,选手可自行决定。数据结构示例如下:|model|basic,|optimization|model.4 .
26、模型权重文件夹modeLfiles/用于存放选手训练好的模型文件,文件夹下的子目录、文件名,选手可自行决定。不允许在训练或测试代码中直接调用没有源代码定义的模型文件。5,工具模块文件夹UtiIs/用于存放工具代码文件,如预处理代码、后处理代码等。6 .结果输出文件夹SIIbmit/选手提交的代码,需要在此文件夹中产生复赛测试集的预测结果。预测结果为包含一个sipe为(N,2)的array的npy文件,其中N为测试样本的数目。预测结果的顺序必需与test_mask中的样本顺序一致。结果文件请命名为。初始的时候SUbmit/文件夹会被清空。数据结构示例如下:|submit1-7 .代码文件夹cod
27、e/选手需要在此文件夹中存放预测与训练代码。代码审核会剔除有作弊行为、方案中无算法贡献的团队。a)预测相关test/ 请确保对复赛测试集的预测结果可以由提交的代码产出,并在文件中指导运行。 请在工作目录下提供文件作为程序入口,确保可以通过执行该文件得到预测结果,并将结果保存到上述的SUbmit/文件中。b)训练相关train/ 请将训练相关代码也存放于此代码文件夹中,文件结构组织由选手自行决定,并在文件中简略叙述训练流程并给出训练脚本。 请固定训练时的超参,例如学习率、batchsize等影响模型训练的参数。数据结构示例如下:|train|test8.解决方案及算法介绍文件 介绍自己的解决方案
28、及算法,包含从原始图数据到最终结果输出的整个逻辑流程以及算法详情,且需叙述模型训练复现流程。 代码运行说明,包括代码运行入口,若需额外输入参数请自行将参数写入运行代码。比如把pythonparamlparam2命令写进文件。 若选手提交的代码在运行时有需要特殊注意的内容,也请在该文件中一并说明。提交代码文件夹结构举例|xydata!-workspaceI-Dockerfile#必选,请使用我们提供的基础镜像并通过D。Ckerfile构建镜像#解决方案及算法介绍文件,必选#Python环境依赖,必选#预测执行脚本,必选!-feature |model#特征工程文件夹,可自行组织#模型文件夹示例,可自行组织|basic,!-optimization|model_|model-files(submit#模型权重文件夹,可自行组织|utils-code|train|testI#工具模块文件夹,可自行组织#训练代码文件夹示例,可自行组织#预测代码文件夹示例,可自行组织#训练执行脚本,必选