多示例论文泛读--2019-1-Fast Multi-Instance Multi-Label Learning

86 阅读 0 评论 57 点赞

我是靠谱客的博主成就黄豆，这篇文章主要介绍多示例论文泛读--2019-1-Fast Multi-Instance Multi-Label Learning，现在分享给大家，希望可以做个参考。

题目

Fast Multi-Instance Multi-Label Learning
快速多实例多标签搜索

算法思路

要处理多个标签的问题，最简单的方法是通过为每个标签独立训练一个模型，将其退化为一系列单标签问题。
基于标签 $l$ 分类模型对实例 $x$ 的分类：
$f_{l}(mathbf{x})=mathbf{w}_{l}^{top} W_{0} mathbf{x}$
实例 $x$ 的分类， $W_{0}$ 是映射原始特征向量映射到共享空间的 $m \times d$ 维矩阵， $mathbf{w}_{l}$ 是标签 $l$ 的 $m$ 维权重向量， $d$ 和 $m$ 分别是特征空间和共享空间的维度。

多实例多标签学习任务中的对象通常具有复杂的语义，因此，具有不同内容的示例可能会被分配相同的标签。例如，标有苹果的图像的内容可以是手机、笔记本电脑或只是一个真正的苹果。很难训练单个模型将具有如此多样化内容的图像分类到同一类别中。相反，我们建议为一个复杂的标签学习多个模型，一个用于子概念，并自动决定一个示例属于哪个子概念。每个子概念的模型要简单得多，并且可能更容易训练以适应数据。
$f_{l}(mathbf{x})=max _{k=1 cdots K} f_{l, k}(mathbf{x})=max _{k=1 cdots K} mathbf{w}_{l, k}^{top} W_{0} mathbf{x}$
在这样的处理方式下，实例 $x$ 的分类模型也改变了， $mathbf{w}_{l, k}$ 是标签 $l$ 的第 $k$ 个子概念的 $m$ 维权重向量

依照标准的多示例学习假设，则一个包的分类器如下
$f_{l}(X)=max _{mathbf{x} in X} f_{l}(mathbf{x})$
标签 $l$ 对于包 $X$ 的预测值取 $l$ 对包中实例的最大预测值。
我们将具有最大预测的实例称为标签 $l$ 上 $X$ 的关键实例。使用上述模型，对于示例 X 及其相关标签 l 之一，我们将 R(X; l) 定义为
$l)=sum_{j in bar{Y}} Ileft[f_{j}(X)>f_{l}(X)right]$
其中 $\overset{ˉ}{Y}$ 表示 $X$ 的不相关标签集， $I [.]$ 是指示函数，如果参数为真则返回 1，否则返回 0。本质上 $R (X, l)$ 计算了在包 $X$ 上的预测值大于标签 $l$ 的不相关标签的数量。（可以理解为， $R (X, l)$ 越大，则在整个标签集合的排序中， $X$ 与 $l$ 越不相关。）

基于 $R (X, l)$ ，原文又提出了排名误差：
$l)=sum_{i=1}^{R(X, l)} frac{1}{i}$
很明显，对于较低的 $l$ 排名，排名误差更大。最后，整个数据集的排名误差如下：
$}=sum_{i=1}^{n} sum_{l in Y_{i}} epsilon(X, l)$