Kaggle,作为AI和大数据领域无人不知的数据科学,机器学习竞赛和分享平台,至今拥有了百万会员。企业和开发商可以在Kaggle上提供数据并且提供一定的奖金开展竞赛,而数据科学家和爱好者则可以通过参加竞赛为其提供更优化的模型,赚取奖金。只要你能在Kaggle竞赛中获取优秀的成绩,你不仅仅将在这个虚拟世界出名,更会因为这个显赫的经理收获众多大公司抛来的橄榄枝,并且对于申请海外名校的学生来说,也是极其提升学术背景的一项经历。

MERRY CHRISTMAS
# 如何进步如何学习 #
自学数据科学和机器学习很难,也有人不知道从哪里开始学起,如何学习?
数据科学和机器学习相关的领域非常多,想要样样精通很难,因此要先找到自己感兴趣的内容,并充分挖掘它的潜力。

学习方法和路径:
数学是一切的基础,线性代数和微积分是使用的机器学习中最重要的概念。几乎多有的机器学习算法都以这样或那样的方式与这两个领域相关。数据以向量和矩阵的形式表示和处理,因此,理解矩阵的基本运算是必要的。在机器学习中,微积分最常见的用法之一是梯度下降。梯度下降是一种蒜贩,通过使用函数的梯度迭代一步步逼近全局最小值来最小化目标函数;
统计也非常重要,顾名思义,数据科学是关于数据的。虽然计算机可以预测数据的某些趋势;但只有人类可以分析它们,计算某些属性,并最终对数据得出结论。数据的预处理和特征工程在很大程度上依赖于统计学。我零碎地学习统计学,从网上搜集资料,寻找合适地在线课程;
在了解了基础知识后,开始着手编写代码。有了面向对象编程(OOP)和Python的基础知识,我找到了在线课程,教我机器学习中常用的库。与简单地遵循代码和复制粘贴不哦那个,我确保自己理解了代码背后的数学原理。如果你不了解代码的内在运作,你就不可能充分利用所学知识。我从简单的算法开始,例如线性回归,到更复杂的算法,例如神经网格。
 |