有一种不同类型的分类问题,称为多标签分类问题,与每个图像相关联的地方可能有多个标签。
如果你正在制造一辆自动驾驶汽车或者驾驶辅助系统,然后给你一张车前的照片,你可能想问,比如有没有一辆车或者至少有一辆车还是有公共汽车,还是有行人,所以在这种情况下有一辆车,没有公共汽车,至少有一名行人,或者在第二张照片中,没有车,没有公共汽车,有行人,第三张照片中,有汽车和公共汽车,没有行人,这些是多标签分类问题的例子,因为与单个输入图像x相关联,有三个标签,分别是汽车,公共汽车或行人,所以在这种情况下,目标输出y实际上是一个向量,三个数字,这与多类分类不同,手写数字分类Y只是一个数字,即使这个数字可以有十个不同的可能值。
如何构建多标签分类的神经网络
一种方法是把它看作三个完全独立的机器学习问题,可以建立一个神经网络来决定,第一个检测汽车,第二个检测公交车,第三个是检测行人,这其实不是一个不合理的做法,第一个是检测汽车的神经网络,第二个是检测公交车,第三个检测行人,还有另一种方法,就是训练一个神经网络同时检测三辆车,公共汽车,汽车和行人,如果你的神经网络结构是这样的,X第一隐藏层输出1,第二个隐藏层输出一个2,在这种情况下,最后的输出层会有三个输出神经元,并将输出一个3,它将是一个由三个数字组成的向量,因为正在解决三个二进制分类问题,可以对这三个节点中的每一个节点在输出层使用Z状结肠激活函数,所以在这种情况下,a3分为a31,a32,a33,对应图像中有一辆汽车和一辆公共汽车和行人,因此,多类分类和多标签分类有时会混淆在一起,所以此篇文章只是多标签分类问题的定义。