Label Enhancement
条评论标记增强将逻辑标记转化为标记分布。相比于逻辑标记空间,标记分布空间包含了更多监督信息,如示例在空间中的拓扑关系、标记在空间中的相关性等。
以往工作
- 依靠对数据的先验知识: 年龄估计中,假设年龄标记分布以高斯分布。
- 基于传统的模糊方法:基于C均值模糊聚类算法FCM,模糊SVM算法。
- 基于图模型:标记传播[1],流形学习[2]。
对于多义性对象而言,标记分布比逻辑标记更接近其监督信息的本质。描述度表示该标记对示例的描述程度在所有类别标记里所占比例。
- 区别于概率标记[3],概率标记在无法直接确定该对象的正确标记的情况下,用概率进行描述。
- 区别于模糊分类中的隶属度[4],隶属度反应的是部分真实的状态,其变化范围为完全的正确到完全错误。
学习方法
- 基于先验知识:通过对数据的了解,知道标记分布满足的参数模型,如年龄估计[5]中,假设标记分布服从高斯分布,采用自适应方法确定先验分布中的参数,即标准差。
- 基于模糊方法:利用模糊数学的思想,通过模糊聚类、模糊运算和核隶属度等方法,挖掘标记间相关信息,将逻辑标记转化为标记分布。
- 模糊C-均值聚类(Fuzzy C-Means Algorithm, FCM)
- 核隶属度(模糊支持向量机)
- 基于图的标记增强
参考文献:
[1] Yu-Kun Li, Min-Ling Zhang, and Xin Geng. Leveraging implicit relative labelingimportance information for effective multi-label learning. In Proceedings of the 15th IEEE International Conference on Data Mining, pages 251–260, Atlantic City, NJ, 2015.
[2] Peng Hou, Xin Geng, and Min-Ling Zhang. Multi-label manifold learning. In Proceedings of the 30th AAAI Conference on Artificial Intelligence, pages 1680–1686, Phoenix, AZ, 2016.
[3] Benjamin Quost and Thierry Denœux. Learning from data with uncertain labels by boosting credal classifiers. In Proceedings of the 1st ACM SIGKDD Workshop on Knowledge Discovery from Uncertain Data, pages 38–47, Paris, France, 2009.
[4] Xiufeng Jiang, Zhang Yi, and Jian Cheng Lv. Fuzzy svm with a new fuzzy membership function. Neural Computing & Applications, 15(3-4):268–276, 2006.
[5] Xin Geng, Qin Wang, and Yu Xia. Facial age estimation by adaptive label distribution learning. In Proceedings of the 22nd International Conference on Pattern Recognition, pages 4465–4470, Stockholm, Sweden, 2014.