用于科学数据处理的统计学习教程

统计学习(Statistical learning)

机器学习 正在成为一种 越来越重要的技术(technique), 随着数据集规模的不断扩大,实验科学面临的挑战也在迅速增长。 它解决的问题包括建立一个连接不同观测的预测函数,对观测进行分类,或者在未标记的数据集中学习结构。

本教程将会带你探索 统计学习(statistical learning), 使用机器学习技术进行统计推断(statistical inference): 利用手头的数据得出结论。

Scikit-learn 是一个集成了经典机器学习算法的 Python module ,它构建在 (NumPy, SciPy, matplotlib) 的基础上。