大数据省赛总结

​ 前段时间大数据省赛结束,自己负责的部分是数据清洗,我负责的部分,分值占比较大,除去公共的15分,自己负责的部分分值将近占比50%。所以自己这部分对整体的影响是比较大的。自己负责的部分,模块B和C基本没什么问题,因为比赛的数据是和数据平台练习的数据一样的,暑假练习过很多遍了。感觉出问题的点应该在后面综合分析,综合分析之前都没做过,临近比赛那两天看了一下,也没记的很清楚,所以觉得综合分析那边应该是失分了。模块C指标计算最后一题,是看连续两月购买订单的,当时的比赛氛围比较紧张,虽然最后一题我给自己留了充足的时间去做,还是没有打开自己的思路,我认为比赛评分是只看截图的,就用了一种投机取巧的方法,做了出来,如果正儿八经的写的话,可能又要浪费很多时间,怕留下的时间太紧张,所以这题的正确率不太敢确保,再前面基本没什么问题。

​ 对于比赛过程的话,大学没有参加过这么正式比赛的经验,比赛过程中刚开始也很紧张,看到卷子以后,发现数据比较熟悉,稍微缓和了一些, 基本没什么磕磕绊绊,但是还是比平常练习的速度慢了很多,场地倒是还适应的。这次也能了解到正式比赛的过程是什么样子的,和一些会埋坑的地方,可能会搞你配置文件什么的,所以在下次比赛之前,一些可能会有坑的地方,要去背起来,这次给了你pom.xml文件下次可能就不给了,要以防万一,比赛前要问清楚的,自己平常也需要多注意一下。