kaggle是什么（kaggle比赛拿奖容易吗）

　　机器之心报道
　　编辑：张倩、小舟
　　想通过 Kaggle 磨练数据科学技能？先听听 Kaggle Grandmaster 分享了哪些成功经验。
　　对于机器学习、数据科学领域的入门者来说，Kaggle 是一个能让人学以致用、快速成长的平台。在之前的文章中，我们介绍过不少优秀的 Kaggle Grandmaster，他们都有自己独特的成长路径和解决问题的思路。
　　在这篇文章中，我们同样介绍了两位优秀的 Grandmaster——Christof Henkel 和 Philipp Singer，他们在 Kaggle Rankings 上位列第三、四位。
　　在文章中，他们介绍了自己在 Kaggle 比赛中的成功经验以及 Kaggle 给他们带来的帮助。
　　Christof Henkel：不喜欢读「书」的 Triple Grandmaster
　　Christof Henkel（代号 Dieter）是英伟达的一位数据科学家，拥有慕尼黑大学的数学博士学位，在 Kaggle 排行榜上位列第四。虽然进入 Kaggle 社区的时间不长，但 Henkel 已经拿到了三个 Grandmaster（Competitions Grandmaster、Notebooks Grandmaster 和 Discussion Grandmaster）。
　　在谈起自己参加 Kaggle 比赛的缘由时，Henkel 表示，他一直对 AI 领域很感兴趣，并在读博的最后一年自学了 Python 和一些深度学习教程。虽然刚开始参赛时成绩并不理想，但 Henkel 领悟到，「Kaggle 可能是掌握机器学习领域知识最有效的方式。」
　　在自学过程中，Henkel 看了很多高质量的 Youtube 视频以及吴恩达、Jeremy Howards 的热门课程。有趣的是，Henkel 对深度学习领域的书籍并不感冒，因为他认为这些书很快就过时了。他表示，「参加一个简单的 Kaggle 比赛学到的东西比看书要多。」为了得到新的启发，Henkel 现阶段主要在看论文。
　　解决 Kaggle 问题的一般步骤
　　当被问及解决 Kaggle 问题的一般步骤时，Henkel 总结出了以下几点：
　　首先，你需要进行非常简单的数据探索，对数据和手头的问题有一个大致的了解，想想好的交叉验证应该是什么样子。
　　接下来，你应该构建一个简单的初步模型，同时检查本地验证和竞赛排行榜之间的相关性（correlation）是否良好；
　　如果上述相关性无法满足要求，你需要进行迭代，以理解可能的差异并进行解释；
　　用比赛剩余的时间浏览论文、Kaggle 论坛、Kernel 等，以获取新的灵感；
　　在比赛的最后一周，进行模型集成和模型鲁棒性的检查。
　　为了更加具体地解释自己提到的问题解决步骤，Henkel 举了一个孟加拉手写字母分类的比赛作为例子。这个比赛要求选手将给定的手写字母分为三个类别：词根、元音变音和辅音变音。
　　「（在拿到数据之后，）我首先将给定的图像 resize 为 64*64，以便在比赛的前半段快速迭代想法。接下来，我创建了一个 resnet18 基线，并复制了竞赛 metric，以检查我的本地验证分数能否媲美排行榜分数，结果出入不大。然后，我使用了不同的增强方法和模型架构，并最终选出了一个效果比较好的。虽然我在接下来的步骤中使用了尺寸更大的图像（128*128），但我的分数变化不大。因此，我去读了很多关于孟加拉手写系统的书，发现这门语言有很多特殊与微妙之处。这使得我能够改进我的解决方案，并最终单枪匹马取得了前几名。」Henkel 回忆说。
　　比赛完整解决方案参见：https://www.kaggle.com/c/bengaliai-cv19/discussion/136129
　　工具与技巧
　　在访谈中，Henkel 介绍了在参赛过程中使用的工具与技巧。
　　在框架方面，他现在使用 PyTorch。除了灵活性和稳定性之外，他还看上了 Pytorch 在多 GPU 环境中的易用性，这点在 Kaggle 比赛中变得越来越重要。
　　如果手头有一些表格数据，Henkel 会使用 RAPIDS 平台来提高计算速度，因为它提供类似 Sklearn 或 pandas 的界面，但却在 GPU 上运行。此外，他还尝试了很多日志、数据存储等辅助工具，目前使用的是 neptune.ai（日志工具）和 AWS（数据存储）。
　　在硬件方面，Henkel 有两个深度学习单元。一个是 3x NVIDIA RTX 2080Ti，另一个是 4x V100，这是英伟达给的。但 Henkel 表示，这个配置对于 Kaggle 比赛来说过于豪华了，「之前我只有两个 GTX 1080Ti 的时候也取得了很好的成绩。」
　　Henkel 还补充说，「我喜欢将所有的代码和数据都留在自己的工作站里处理。但最近，我也开始用云来解决一些短期需求。」
　　此外，对于一些计算密集型的比赛，Henkel 喜欢用脚本，因为脚本可以将超参数调优、模型部署等步骤自动化。
　　Philipp Singer：成功来自积累
　　Philipp Singer 是 H2O.ai 的高级数据科学家，他在格拉茨技术大学获得了软件开发和商务管理硕士学位、计算机科学荣誉博士学位，还曾获包括万维网大会最佳论文奖在内的多个奖项。
　　在 Kaggle 领域，Philipp 更为人熟知的名字是 Psi，他在 Kaggle 排行榜上位列第三，拿到了两个 Grandmaster 称号（Competitions Grandmaster 和 Discussion Grandmaster）。
　　Philipp 最重要的成就之一是与 H2O.ai 的数据科学家 Dmitry Gordeev 共同赢得了第二届 NFL Big Data Bowl，来自世界各地的 2000 余名数据科学家在 Kaggle 上角逐，Philipp Singer 和 Dmitry Gordeev 的方案最终获得了 50000 美元的最高奖金。
　　2019-20 Big Data Bowl ，Philipp Singer 和 Dmitry Gordeev（后）发表获奖感言。
　　在访谈中，Philipp Singer 谈了谈他在 Kaggle 比赛中的成功经验。
　　问：您对 Kaggle 的尝试是如何开始的，是什么支撑您一步步走向 Grandmaster？
　　Philipp：大约八年前，我加入了 Kaggle，因为我听说过该平台，想要进一步了解它。但注册之后，我整整六年都没有再碰过它。大约两年前， Dmitry 和我决定一起尝试在 Kaggle 上参与比赛，作为一个业余项目。起初我们并没有抱什么期望，但最后我们赢得了比赛，这让我着迷了，于是我开始了自己的 Kaggle 旅程。
　　在 Kaggle 上，我通过解决新的问题类型来保持积极性，而且每过一段时间就会有令人兴奋的新问题需要解决。我也非常喜欢和 Kaggle 上的人才一起交流工作，并了解社区所做的努力。
　　问：最近，您以惊人的成绩刷新了 Kaggle 排行榜，并获得了 NFL 第一名和 Future-Impact Detection 第二名。您是如何做到在这些比赛中频频拿奖的呢？
　　Philipp：人们经常问我如何才能赢得 Kaggle 比赛，但我认为并没有什么通用秘笈。Kaggle 的许多成功都基于经验，并且需要深入了解和学习那些你乍看起来并不了解的东西。在比赛过程中，我积累了一个通用工具箱，其中包含我完成每项比赛用到的构建基块，例如，如何设置适当的交叉验证，模型需要用到哪些库，如何恰当地拟合模型、如何跟踪模型性能等。因此，我可以拿出更多时间专注于近期比赛的新领域和关键方面。我总是在每次比赛后都尝试改善工作流程，以提高效率和竞争力。
　　Philipp 在 Kaggle 上的成就。
　　问：您通常如何处理 Kaggle 问题？您想与社区分享些喜欢的 ML 资源（课程、博客等）吗？
　　Philipp：我尝试利用我已经积累的方法、工具和经验研究眼前的具体问题。这意味着我将在 Kaggle 上研究先前类似问题的解决方案，并阅读相关论文，学习问题的最佳方法是亲身实践并逐步学习。
　　问：您在 Kaggle 中学到的哪些东西可以应用于 H2O.ai 的工作中？
　　Philipp：在 Kaggle 上学到的很重要的一件事是如何构建鲁棒模型，让其可以很好地泛化，同时又不会遭受强大的过拟合。这对于 Kaggle 至关重要，因为模型需要泛化至此前没见过的数据。这意味着你将学到很多关于鲁棒交叉验证的知识，并关心特征分布转移等数据信息。我可以在 H2O.ai 的工作中充分利用这些知识，这也是我们产品不可或缺的一部分。
　　问：数据科学领域正在迅速发展，您是如何跟上所有最新进展的？
　　Philipp：我主要使用 Kaggle 来了解最新动态；它是对新技术能否解决实际问题的绝佳过滤器。通常，鲁棒的方法可以脱颖而出，而只是偶尔起作用的技术就会被筛掉。同时，我尝试通过 Twitter 和其他平台上的知名研究者和从业者来了解领域内最新的进展。
　　Philipp 在 2020 年 1 月 9 日维也纳的数据科学活动中。
　　问：对于刚刚开始数据科学之旅，对挑战 Kaggle 竞赛有点抱负的人，你有什么建议？
　　Philipp：不断尝试，不要害怕失败，同时要一直渴望学习新事物。
　　参考链接：https://analyticsindiamag.com/kaggle-interview-grand-master-christof-henkel/
　　https://towardsdatascience.com/meet-the-data-scientist-who-just-cannot-stop-winning-on-kaggle-dfc0e6fe88f8

男朋友过生日送什么（一般男朋友过生日送什么礼物）无论在什么时候，礼物一定都是需要送得有意义的，如果说一件礼物送得完全没有意义的话，那么这件礼物确实送得没有必要，这只不过是在浪费彼此之间的时间罢了。老公对于每一个女人来说，都是一个女性朋友生日送什么花（表达友谊送女性朋友鲜花）生日对于每一个人来说都是比较重要的日子特别是女朋友生日就一定得记住啦不然她会不高兴的。当然恋爱中的男女一般对生日都是特别重视的在女朋友过生日的时候我们得准备好礼物如果能给女朋友一些不是花中偏爱菊的全诗（菊花诗词赏析）不是花中偏爱菊的全诗（菊花诗词赏析）自从东晋大诗人陶潜写了采菊东篱下，悠然见南山的名句，陶渊明就成了爱菊之人的典范，菊花也逐渐成了超凡脱俗的隐逸者的象征。历代文人墨客爱菊者不乏其人小雏菊香水是什么档次（一朵花的牌子奢侈品）最近天气超热，出门一趟就浑身汗臭味，是时候买香水啦。对于学生党或职场新人来说，肯定想买到一款平价又大牌的香水。那不妨看看这七款，都是知名品牌的性价比之王，款款低于200元，好闻又不雏菊怎么读（小雏菊为什么不能送人）前几天买了一束紫色的雏菊花，想要摆放在室内，为房间增添点色彩。果然，放上一盆花，桌面都不一样了。雏菊花不只是自己送自己，也可以送给人。当然，送花之前，最好要了解下花语和寓意。一小雏爆菊花什么感觉（第一次菊爆正确方法）1。这老兄锯断树枝的逻辑完全失败了，简直跟动画片人物有一拼2。姑娘玩滑板，被插的不轻啊3。不作不死，也适用于动物4。咱就是不走寻常路5。这是我见过最高大上的爆菊方式6。有些人的运动闺蜜生日送什么花（最好的闺蜜生日送什么比较好）朋友过生日送什么礼物好？朋友关系乃至女性朋友也是能够的。自然送朋友关系生日花束的情况下還是必须留意一些事儿，生日送礼朋友过生日送什么礼物好？生日礼物这样选择不会出错，一起来和小糖小闺蜜生日送什么礼物（闺蜜12岁生日送什么礼物）01西子印社中国古风私人印章02香蕉人录音公仔这款香蕉人录音公仔，非常暖心的抱枕，蕉蕉果然是个外冷内热的孩子，还有录音功能，按下他的左手录音，再按右手就能播放了，录下自己的声音，送闺蜜生日送什么礼物好（女生能记一辈子的礼物）1。纸欧莉精致可爱书签看到不少女生喜欢泡一杯茶，读一本书，挑选一款有温度的文字款的书签，不贵又可爱的小礼物，送给女生礼物挺好的。像这款书签，可爱又精致，而且很有情怀的礼物，挑选送给过生日送什么（好朋友过生日送什么礼物最好）礼物千千万，心意最重要。下面我来推荐几类礼物，如果对你有帮助就更好了。类型1。零食类可以选购她本人喜欢的，最好不要是千篇一律的零食大礼包。因为那些里面大多数情况下是商家混装的，有时蜜蜡为什么不能送人（戴蜜蜡有什么风水功效）集天地之灵气聚万物之精华琥珀被称为穿越时光的精灵，这种天然的有机珠宝受到了众多人士的喜爱，但小编听很多人说蜜蜡佩戴挑人，真的是这样子的吗？今天小编负责任的告诉大家蜜蜡适合任何一个人

<<<<<<－>>>>>>

八宝粥的做法大全（家里做八宝粥需要什么材料）八宝粥的做法大全（家里做八宝粥需要什么材料）腊月风和意已春，时因散策过吾邻。草烟漠漠柴门里，牛迹重重野水滨。多病所须惟药物，差科未动是闲人。今朝佛粥交相馈，更觉江村节物新。十二月八诗歌教师颂（教师颂诗歌朗诵配乐有哪些）诗歌教师颂（教师颂诗歌朗诵配乐有哪些）作者郭志波（山东）那时侯你头顶上高擎的两条羊角小辮！是你第一天做代课老师的真现带补丁的大花袄不是体现你艰苦朴素雷锋精神而是那个年代现实生活的写开幕式主持词（朗诵大会主持词）开幕式主持词（朗诵大会主持词）尊敬的各位专家领导敬爱的老师们大家上午好！欢迎大家来到美丽的海滨城市山东日照，齐聚日照市岚山区玉泉实验中学，共享教师专业成长盛筵，深度探讨教师育人能力夏梦老公（夏梦的儿子和女儿照片）夏梦老公（夏梦的儿子和女儿照片）1956年5月1日，时年32岁的金庸在香港美丽华酒店举办婚礼，迎娶他的新娘。彼时的金庸靠大公报写一点文章已经小有名气，现场各界名流云集，有大公报的社身亡杂技演员家属不接受50万赔偿理由让人难受！身亡杂技演员家属不接受50万赔偿8月1日，呼和浩特一名28岁的杂技演员从8米高的道具上摔下，因治疗无效，该演员于8月9日不幸身亡。事后，马戏团打算赔偿50万，死者哥哥表示，弟弟离婚李玉刚哪里人？（歌手著名演员李玉刚）李玉刚哪里人？（歌手著名演员李玉刚）李玉刚，1978年7月23日出生于吉林省公主岭市，他在舞台上游刃有余地穿梭于男人和女人之间，特殊的表演方式融合了中国民族艺术将传统戏曲和歌剧等艺哪里招演员（招演员的地方在哪里）尊敬的中核佳联集团全国子公司董事长及股东大家好！我是佳联影视集团创始人李发海博士，我们于2021年10月11日正式启动小程序测试运营中，今天特别通知大家好消息，我们计划招募全国站长刘烨哪里人（演员谢娜简历）？在中国的娱乐圈里，刘烨能够进入前列。这是长春人的骄傲。提到刘烨的私生活，很多人会想到他和谢娜的感情，起起伏伏。那么，他们俩为啥分手呢？刘烨在很多人眼中，刘烨是一位很帅演技很高的长什么是近视（近视一词的两种意思）为什么孩子的眼睛会近视？人们通常认为是因为孩子看书看电视，玩手机玩电脑时间太长，用眼过度造成的。可是科学家发现，大多数近视的原因是在眼球发育的过程中，接受户外光不足造成的，而看书看读书怎么读（读书的两种意思）上篇文章我写到了关于关于读书的一些感受，现在我想详细将一些关于读书的东西。当我们拿起一本书的时候，一定要想想我们为什么读书？一定要知道自己读书的目的。周恩来先生可以为中华之崛起而读胡歌女朋友（胡歌现任女朋友是谁）胡歌女朋友（胡歌现任女朋友是谁）回顾胡歌的感情史，我们就会发现从胡歌出道至今，一共有两段公开的恋情，和两段传闻恋情。据悉，除了第一位女友薛佳凝之外，其余三位（林依晨杨幂江疏影）都是