大赛说明
标题
  • 个人赛
  • 团体赛
  • qq图标
    qq联系方式
  • 微信图标
    微信联系方式
  • 电话图标
    0757-82723368
  • 返回顶部图标

基本说明

个人赛要求选手针对大赛提供的数据集,对数据进行初步的统计分析和理解。基于分析的初步结果,对数据进行清洗。确定预测思路,选定预测方法,并最终具体实现分析和预测。

个人赛主要考核选手对数据的理解能力,掌握数据分析的基本原理与有效的数据分析方法的能力,并能将其灵活运用到实践工作中的工程实现能力。最后考察选手对于结果的分析能力以及数据可视化的展现能力。 最后考察选手对于结果的分析能力以及数据可视化的展现能力。

初赛(线上实操赛)

1.赛题说明

城市道路交通流量是城市交通规划非常关心的一个问题。本赛题要求参赛者利用某城市公路的基本天气信息以及过去数年的道路交通流量,来预测下一年的道路交通流量。

赛题中提供了大约45000条某城市公路基本天气信息,以及2013年1月-2018年9月期间的该道路交通流量。

第一阶段:参赛者根据建立的模型,使用2013、2014、2015年的数据对测试数据中该道路在2016年的交通流量进行预测,并将预测结果按时提交到平台上;

第二阶段:使用2013、2014、2015、2016年的数据对测试数据中该道路在2017年的交通流量进行预测,并将预测结果按时提交到平台上;

第三阶段:使用2013、2014、2015、2016、2017年的数据对测试数据中该道路在2018年1月到9月的交通流量进行预测,并将预测结果按时提交到平台上。


2.数据描述

赛题训练数据集包含3个文件,分别为:train_13_15.csv(2013、2014、2015三年的道路基本天气及交通流量数据)、train_16.csv (2016年的道路基本天气及交通流量数据) 、train_17.csv(2017年的道路基本天气及交通流量数据)。

其中:

道路基本天气及交通流量格式:

id:数据id,整数,范围:1~45646

holiday:节假日。None;Christmas Day;Columbus Day;Independence Day ……

temp:实时温度,单位:华氏度

rain_1h:一小时内降雨量

snow_1h:一小时内降雪量

clouds_all:天空云量占比,单位%,范围0~100

weather_main:天气情况,Clear;Clouds;Fog ……

weather_description:天气描述,scattered clouds;broken clouds;overcast clouds ……

date_time:时间

traffic_volume:交通流量,单位:车次


3.结果提交

【第一阶段】利用建立好的预测模型,利用数据集train_13_15.csv对2016年1月到12月交通流量进行预测,建立一个predict_16.csv文件,列出相关数据id顺序,生成如下的内容,存为csv格式文件,上传到大赛平台上。

提交的文件格式如下:(predict_16.csv)

id,traffic_volume

17786,预测结果

17787,预测结果

17788,预测结果

27091,预测结果

注:预测数据集中的数据id范围为:17786——27091。


【第二阶段】利用建立好的预测模型,利用数据集train_13_15.csv和train_16.csv两个数据集之和对2017年1月到12月交通流量进行预测,建立一个predict_17.csv文件,列出相关数据id顺序,生成如下的内容,存为csv格式文件,上传到大赛平台上。

提交的文件格式如下:(predict_17.csv)

id,traffic_volume

27092,预测结果

27093,预测结果

27094,预测结果

37696,预测结果

注:预测数据集中的数据id范围为:27092——37696。


【第三阶段】利用建立好的预测模型,利用数据集train_13_15.csv ,train_16.csv和train_17.csv三个数据集之和对2018年1月到9月交通流量进行预测,建立一个predict_18.csv文件,列出相关数据id顺序,生成如下的内容,存为csv格式文件,上传到大赛平台上。

提交的文件格式如下:(predict_18.csv)

id,traffic_volume

37697,预测结果

37698,预测结果

37699,预测结果

45646,预测结果

注:预测数据集中的数据id范围为:37697——45646。


4.结果评定

(1)个人赛将以三个模型结果与真实数据(realdata_16.csv、realdata_17.csv、realdata_18.csv、)进行比较,按照预测结果与真实值的均方误差(MSE)均值来评价成绩, MSE越小排名越高,并依此维护排行榜。

公式1图片

其中m为测试集数据量,

公式5图片 为测试集实际数值, 公式6图片 为模型预测数值。

(2)分数计算

·参赛选手MSE值将转换成标准分。
·组委会将根据参赛的实际情况进行如下分数换算:
最高分为100分,最低分为60分, 选手的当前得分为C.预测的最大MSE为MSE1(成绩最差), 最小MSE为MSE2(成绩最好),当前选手的MSE为MSE0,
选手的当前得分为:C=100-((MSE0-MSE2)/(MSE1-MSE2))*(100-60)。
注:
①分数将以四舍五入的方式保留小数点后三位。
②由于最大MSE值与最小MSE值的跨度可能会非常大,为了更好地反映选手的实际成绩,组委会将根据实际情况制定最大MSE值,超过最大值的选手成绩则会被视为不及格,不列入分数计算范围。

(3)考核结果

选手初赛最终成绩为三个阶段得分总和的平均分

公式7图片

其中

公式5图片 表示第i个阶段模型的得分, 公式5图片 越大排名越高,并依此维护排行榜。

·各城市选出1名选手(选手所在城市MSE值最小,总得分最高,排名第一的选手)晋级个人赛决赛,即共选出11名选手进入决赛。


决赛(线下答辩)

1、考核规则:
选手需就提交的实操结果准备相关答辩材料(包括答辩PPT、相关证明材料等),以PPT形式讲解预测建模思路、算法实现、结果分析等。

2、答辩时间:
每位选手讲解时间为8分钟,现场评委提问时间5分钟。

3、评分标准:
评委根据评分要点对选手的答辩情况进行打分。答辩满分100分;

评分标准:

评分要点 评分细则 分值
数据分析与清洗 考察选手对数据的理解程度。 15
预测建模思路 考察选手整体思路是否清晰以及将实际问题抽象成模型的能力。 20
算法实现 考察选手对于算法的构建能力以及算法逻辑结构。 25
结果分析 考察选手对结果的分析是否清晰、具有逻辑性。 25
现场表现 1、思路明确,展示内容逻辑性强,层次分明;2、正确理解评委提问,及时流畅作答,回答内容切题。 15

结果评定

总分计算及排名:参赛选手的总分=初赛(线上实操赛)成绩*60%+决赛(线下答辩)成绩*40%,总成绩从高到低依次排名;

总成绩相同者,以实操赛成绩高者为先,若仍不能分出先后,则名次并列。

选手须知

1、参赛选手或队伍需在限定时间内线上注册,并完善参赛资料。参赛者应当保证身份信息的真实性。大赛组织方承诺对个人信息中所有涉及个人隐私的内容予以保密。

2、参赛选手需在限定时间内,提交方案,过期则当弃权处理。

3、参赛项目的所有权归选手所有,选手需对所提交成果负责,确保原创。

答辩赛规则

1、参赛选手须持队员身份证到答辩现场领取竞赛组委会签发的参赛证,凭证参加答辩竞赛。

2、参赛选手均需到场参加答辩。

3、参赛选手须按竞赛时间提前15 分钟检录进入赛场,开赛前5分钟停止进场。开赛前5分钟未进入考场视为自动放弃竞赛资格。

4、参赛选手应严格遵守赛场纪律,除携带竞赛必备的参赛证、身份证和相关资料外,所有未经允许的竞赛技术资料、录音录影工具设备、手机等物品不得带入竞赛现场。

5、参加答辩的选手需提前准备答辩材料,包括答辩PPT、创意方案的相关证明材料等。

6、选手必须在规定时间内完成答辩,不得超时答辩。

赛场管理

1、各类赛务人员必须统一佩戴由竞赛组委会签发的相应证件,并着装整齐。

2、赛场除现场裁判、赛场工作人员以外,其他人员未经允许不得进入赛场。

3、新闻媒体等如需要进入赛场必须经过竞赛办公室允许,并且听从现场工作人员的安排和管理,不能影响竞赛进行。

4、竞赛现场不允许抽烟,大声喧哗,不得影响竞赛选手比赛。

裁判组织

由竞赛组委会组织专家和评委,负责竞赛的评审工作。

申诉与仲裁

1、参赛选手对不符合竞赛规定的设备、工具和资料数据,有失公正的评审、计分,以及对工作人员的违规行为等,均可提出申诉。

2、大赛评委组兼任仲裁组,负责受理比赛中出现的所有申诉并进行仲裁。

3、仲裁组的裁决为最终裁决,参赛选手或团体不得因申诉或对处理意见不服而停止竞赛,否则视弃权处理。

4、竞赛中因不可预测的意外导致选手中断比赛,或竞赛平台存储的数据丢失,由竞赛组委会根据仲裁组意见处理。

相关约定

1、选手报名参赛,即为视为同意并须遵守大赛组委会制定的相关规定。

2、参赛方案的知识产权归参赛团体所有。大赛组织方有权将参赛选手提交的参赛作品、相关信息、参赛选手信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

3、参赛选手应确保提交方案的原创性,作品不得违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,大赛组织方将取消其参赛资格。

4、关于大赛官方规则的制定、有效性、解释和可执行性的所有问题,或者本赛事参赛选手和主办方的权利和义务,应根据中国法律予以解决和解释。

5、大赛组织方保留拒绝任何参赛个人、参赛组织、参赛作品的权利。

6、大赛组织方保留修改比赛各环节的时间,包括但不限于预测结果提交(方案提交)截至日期、线下活动日期等日期的权利。大赛组织方有权利随时暂停或终止比赛。

7、大赛组织方保留修改比赛赛制的权利,包括但不限于考试题型、考核规则等。

8、大赛组织方保留调整比赛各阶段入选选手或队伍数量的权利(包含决赛),以及调整奖项设置的权利。

9、大赛组织方保留收回或拒绝授予某个特定团体或个人奖项的权利。

报名流程

流程曲线图
  • 流程图1
  • 报名时间

    即日起至8月28日前

  • 填写报名表

    参赛选手登陆大赛官网(www.gbadata.cn)下载并填写报名表,在限定时间内各地市的选手报名表报送给所属地市总工会(工联会),由所属地市总工会(工联会)汇总完毕后统一报送佛山市总工会,且于8月28日14:00前进行线上报名。

  • 流程图2
  • 流程图3
  • 资料确定

    报名资料填写确认提交后,选手名单不能变更。

  • 信息审核

    参赛审核由本大赛组委会执行,审核结果会在七个工作日内通过手机短信通知参赛选手。

  • 流程图4
  • 流程图5
  • 参加大赛

    资料审核通过后,参赛选手可以访问大赛官网,点击“登录”进入页面,登录参加大赛。

赛程安排

具体赛程安排如下表:

环节 时间 地点 方式 备注
报名 即日起至8月28日14:00前 大赛官网 在线注册 选手需在截止时间前完成网上注册,否则视为自动放弃比赛资格。
初赛 8月28日14:00开始 大赛官网 构建模型 期间选手每阶段可重复多次提交结果,平台根据选手各阶段的最佳成绩综合分刷新展示榜,各地市排名第一的选手将显示在展示榜上。
第一阶段
(8月28日至9月12日)
平台开放第一批数据;选手进行第一阶段结果提交
第二阶段
(9月12日至9月20日)
平台开放第二批数据;选手进行第二阶段结果提交
第三阶段
(9月20日至9月27日)
平台开放第三批数据;选手进行第三阶段结果提交(最终提交)
9月30日 公布个人赛
决赛名单
决赛 10月10日14:00前 答辩材料提交 已入围决赛的选手需就提交的实操结果准备相关答辩材料(包括答辩PPT、相关证明材料等),讲解预测建模思路、算法实现、结果分析等。
10月16日 佛山禅城 现场赛前会议、抽签 为选手就比赛问题解疑答难;抽签决定选手比赛顺序。
10月17日 佛山禅城 个人赛决赛现场答辩 选手现场展示8分钟+评委提问5分钟;评委现场评分。

联系方式

Tel:0757-82723368

QQ: 2407436281(工作日在线:8:30--17:30)

Email:2407436281@qq.com  

  • 数创岭南公众号

    扫一扫,关注数创岭南公众号

    随时了解最新资讯

  • 佛山市互联网协会公众号

    扫一扫,关注佛山市互联网协会公众号

    随时了解最新资讯

基本说明

参赛队伍通过自带数据,提出一个大数据应用的创意解决方案。参赛作品需对问题需求、价值导向(商业价值和社会效益)、应用的整体构思(拟采用的技术架构和产品架构)、数据使用等关键要素作概要性介绍。

初赛(预评审)

1、考核规则:
参赛团队通过官网提交方案(以PPT形式提交);展示素材包括但不限于文字、图片、视频等,使用中文或繁体中文。每支代表队限提交一个创意方案。


2、展示方式:
为了全面展示作品细节,各团队在提供可测试原型之外,需提交原型文档,内容请参考以下格式:

· 作品摘要:对创新应用做整体介绍;

· 问题需求:描述作品适用的应用场景,清楚说明所解决的问题和受众;

· 数据使用:描述应用使用过的各项数据,并详细说明不同数据如何进行整合及应用;

· 技术介绍:说明创新应用开发的整体技术架构和思路,应用开发的相关技术细节,数据处理采用的主要技术、算法、流程等;

· 原型测试:详细说明原型的使用方法、测试用例、原型局限性;

· 应用成果:说明作品的预期应用成果;

· 价值导向:说明作品的潜在商业价值和社会价值。


评委将对作品进行预评审,提出评审意见。本环节不作打分。

决赛(线下答辩)

1、考核规则:

(1)参赛团队需按时提交方案的演示材料及创新应用发展计划等,答辩现场以PPT形式对创新应用方案进行演讲解说,展示素材包括但不限于文字、图片、视频等,使用中文或繁体中文。

(2)需提交作品原型及其原型文档。(作品原型的形式包括但不限于移动应用(apps)、可视化、分析报告、demo等形式,需提交可供应用原型下载或测试的网络链接,以及下载或使用说明,所有素材包括但不限于文字、图片、视频等,文字均需为中文或繁体中文)。

2、答辩时间:
每位选手讲解时间为10分钟,现场评委提问时间5分钟。

3、评分标准:
评委根据评分要点对选手的答辩情况进行打分。答辩满分100分;

评分要点 评分细则 分值
方案描述 方案完整,逻辑思路清晰。 10
创新性 具有原始创意特点,解决现实问题;思维新突破,具有先进性和独特性。 10
技术含量 创新应用开发的整体技术架构和思路,应用开发的相关技术细节,数据处理采用的主要技术、算法、流程等。 10
数据使用 对使用过的各项数据进行整合及应用的能力。 10
商业价值 行业调研:鼓励田野调查和实际操作检验,形成项目现况的一手资料。 10
商业模式:完整描述商业模式,测评其商业效益和推导过程的合理性。 10
社会效益 社会发展前景分析的合理性;对社会发展的影响力。 10
可行性 方案是否具有较强可行性。 10
团队能力 考察团队成员的价值观念,分工与业务互补情况。 10
现场展示与答辩 思路明确,展示内容逻辑性强,层次分明;正确理解评委提问,及时流畅作答,回答内容切题。 10

选手须知

1、参赛选手或队伍需在限定时间内线上注册,并完善参赛资料。参赛者应当保证身份信息的真实性。大赛组织方承诺对个人信息中所有涉及个人隐私的内容予以保密。

2、参赛选手需在限定时间内,提交方案,过期则当弃权处理。

3、参赛项目的所有权归选手所有,选手需对所提交成果负责,确保原创。

答辩赛规则

1、参赛选手须持队员身份证到答辩现场领取竞赛组委会签发的参赛证,凭证参加答辩竞赛。

2、参赛选手均需到场参加答辩。

3、参赛选手须按竞赛时间提前15 分钟检录进入赛场,开赛前5分钟停止进场。开赛前5分钟未进入考场视为自动放弃竞赛资格。

4、参赛选手应严格遵守赛场纪律,除携带竞赛必备的参赛证、身份证和相关资料外,所有未经允许的竞赛技术资料、录音录影工具设备、手机等物品不得带入竞赛现场。

5、参加答辩的选手需提前准备答辩材料,包括答辩PPT、创意方案的相关证明材料等。

6、选手必须在规定时间内完成答辩,不得超时答辩。

赛场管理

1、各类赛务人员必须统一佩戴由竞赛组委会签发的相应证件,并着装整齐。

2、赛场除现场裁判、赛场工作人员以外,其他人员未经允许不得进入赛场。

3、新闻媒体等如需要进入赛场必须经过竞赛办公室允许,并且听从现场工作人员的安排和管理,不能影响竞赛进行。

4、竞赛现场不允许抽烟,大声喧哗,不得影响竞赛选手比赛。

裁判组织

由竞赛组委会组织专家和评委,负责竞赛的评审工作。

申诉与仲裁

1、参赛选手对不符合竞赛规定的设备、工具和资料数据,有失公正的评审、计分,以及对工作人员的违规行为等,均可提出申诉。

2、大赛评委组兼任仲裁组,负责受理比赛中出现的所有申诉并进行仲裁。

3、仲裁组的裁决为最终裁决,参赛选手或团体不得因申诉或对处理意见不服而停止竞赛,否则视弃权处理。

4、竞赛中因不可预测的意外导致选手中断比赛,或竞赛平台存储的数据丢失,由竞赛组委会根据仲裁组意见处理。

相关约定

1、选手报名参赛,即为视为同意并须遵守大赛组委会制定的相关规定。

2、参赛方案的知识产权归参赛团体所有。大赛组织方有权将参赛选手提交的参赛作品、相关信息、参赛选手信息用于宣传品、相关出版物、指定及授权媒体发布、官方网站浏览及下载、展览(含巡展)等活动项目。

3、参赛选手应确保提交方案的原创性,作品不得违反任何中华人民共和国的有关法律,不侵犯任何第三方知识产权或者其他权利;一经发现或经权利人提出并查证,大赛组织方将取消其参赛资格。

4、关于大赛官方规则的制定、有效性、解释和可执行性的所有问题,或者本赛事参赛选手和主办方的权利和义务,应根据中国法律予以解决和解释。

5、大赛组织方保留拒绝任何参赛个人、参赛组织、参赛作品的权利。

6、大赛组织方保留修改比赛各环节的时间,包括但不限于预测结果提交(方案提交)截至日期、线下活动日期等日期的权利。大赛组织方有权利随时暂停或终止比赛。

7、大赛组织方保留修改比赛赛制的权利,包括但不限于考试题型、考核规则等。

8、大赛组织方保留调整比赛各阶段入选选手或队伍数量的权利(包含决赛),以及调整奖项设置的权利。

9、大赛组织方保留收回或拒绝授予某个特定团体或个人奖项的权利。

报名流程

流程曲线图
  • 流程图1
  • 报名时间

    即日起至8月28日前

  • 填写报名表

    参赛选手登陆大赛官网(www.gbadata.cn)下载并填写报名表,在限定时间内各地市的选手报名表报送给所属地市总工会(工联会),由所属地市总工会(工联会)汇总完毕后统一报送佛山市总工会,且于8月28日14:00前进行线上报名。

  • 流程图2
  • 流程图3
  • 资料确定

    报名资料填写确认提交后,选手名单不能变更。

  • 信息审核

    参赛审核由本大赛组委会执行,审核结果会在七个工作日内通过手机短信通知参赛选手。

  • 流程图4
  • 流程图5
  • 参加大赛

    资料审核通过后,参赛选手可以访问大赛官网,点击“登录”进入页面,登录参加大赛。

赛程安排

具体赛程安排如下表:

环节 时间 地点 方式 备注
报名 即日起至8月28日14:00前 大赛官网 在线注册 团体需在截止时间前完成网上注册,否则视为自动放弃比赛
方案提交 9月16日 大赛官网 选手进行第一次结果提交 作品建议包含:问题需求、价值导向(商业价值和社会效益)、应用的整体构思(拟采用的技术架构和产品架构)、数据使用(等关键的概要性介绍。
预评审及方案完善 9月18日至10月10日 专家预评 团体就专家的点评建议进行方案完善、优化。
决赛 10月10日14:00前 答辩材料截止提交 选手团体需就提交的结果准备相关答辩材料。
10月16日 佛山禅城 现场赛前会议、抽签 为团体就比赛问题解疑答难;抽签决定团体比赛顺序。
10月17日 佛山禅城 团体赛决赛现场答辩 提前提交方案的演示材料及创新应用发展计划等,PPT形式。评审专家组通过“方案描述、技术含量、数据使用(大赛开放数据、自带数据等)、社会效益、商业价值、创新性、可行性、团体能力”等维度。团体现场展示10分钟+评委提问5分钟;评委现场评分。

联系方式

Tel:0757-82723368

QQ: 2407436281(工作日在线:8:30--17:30)

Email:2407436281@qq.com  或  SCLN82723368@163.com

  • 数创岭南公众号

    扫一扫,关注数创岭南公众号

    随时了解最新资讯

  • 佛山市互联网协会公众号

    扫一扫,关注佛山市互联网协会公众号

    随时了解最新资讯

返回上一页

返回