知识发现(KDD) 2019年论文解读:多分类下的模型可解释性 - 行业资讯

日前，由阿里巴巴研究型实习生张雪舟、蚂蚁金服高级算法专家娄寅撰写的论文《Axiomatic Interpretability for Multiclass Additive Models》入选全球数据挖掘顶级会议KDD 2019，本文为该论文的详细解读。论文地址：https://www.kdd.org/kdd2019/a...

前言

模型可解释性是机器学习研究中的一个重要课题。这里我们研究的对象是广义加性模型（Generalized Additive Models，简称GAMs）。GAM在医疗等对解释性要求较高的场景下已经有了广泛的应用 [1]。

GAM作为一个完全白盒化的模型提供了比（广义）线性模型（GLMs）更好的模型表达能力：GAM能对单特征和双特征交叉（pairwise interaction）做非线性的变换。带pairwiseinteraction的GAM往往被称为GA2M。以下是GA2

M模型的数学表达：

其中g是linkfunction，fi和fij被称为shape function，分别为模型所需要学习的特征变换函数。由于fi和fij都是低纬度的函数，模型中每一个函数都可以被可视化出来，从而方便建模人员了解每个特征是如何影响最终预测的。例如在[1]中，年龄对肺炎致死率的影响就可以用一张图来表示。

由于GAM对特征做了非线性变换，这使得GAM往往能提供比线性模型更强大的建模能力。在一些研究中GAM的效果往往能逼近Boosted Trees或者Random Forests [1, 2, 3]。

可视化图像与模型的预测机制之间的矛盾

本文首先讨论了在多分类问题的下，传统可解释性算法（例如逻辑回归，SVM）的可视化图像与模型的预测机制之间存在的矛盾。如果直接通过这些未经加工的可视化图像理解模型预测机制，有可能造成建模人员对模型预测机制的错误解读。如图1所示，左边是在一个多分类GAM下age的shape function。粗看之下这张图表示了Diabetes I的风险随年龄增长而增加。然而当我们看实际的预测概率（右图），Diabetes I的风险其实应该是随着年龄的增加而降低的。

为了解决这一问题，本文提出了一种后期处理方法（AdditivePost-Processing for Interpretability, API），能够对用任意算法训练的GAM进行处理，使得在的前提下，处理后模型的可视化图像与模型的预测机制相符，由此让建模人员可以安全的通过传统的可视化方法来观察和理解模型的预测机制，而不会被错误的视觉信息误导。