第5章 单智力体强化学习

在本套书的《Web安全之机器学习入门》和《Web安全之深度学习实战》中,我们解决的问题,无论是识别垃圾邮件还是检测WebShell,无论是识别XSS还是识别DGA域名,在本质上解决的都是一个分类问题。我们通过算法在大量经过标记的数据上训练出模型,并在实际环境中使用学习到的模型进行检测。但是,现实生活中,我们遇到相当多的问题不是需要我们分类,而是需要我们连续地做一些决策,犹如下围棋和打DotA,解决这类问题就需要使用强化学习了。本章将介绍强化学习中比较常见的单智力体强化学习,即整个问题中智力体只有一个,而不是像下棋那样有两个智力体,也不是像群体作战那样有多个智力体。