通常,人们将SVM、KNN等之前介绍的算法理解为浅层学习,模型的识别能力更多取决于特征选取的有效性。浅层学习使用时,需要花费至少一半的时间在数据清洗与特征提取上,有人形象地将这些步骤称为“特征工程”,是对其巨大工作量的一种描述。从本章开始我们介绍神经网络,后面章节介绍深度学习算法,神经网络是人类第一次从自身生理结构上获得灵感,从而产生的一种新算法,从某种程度来说,也是人类理解自身的一次巨大进步。
本章将介绍神经网络的基本概念,并给出基本的使用方式,并通过案例介绍如何使用神经网络识别基于MNIST的验证码、识别基于Java的溢出攻击。