深度长尾学习研究综述

自动化学报

ISSN：0254-4156

2025年第51卷第5期

关注

韩佳艺¹,刘建伟¹,陈德华²,徐璟东¹,代琪¹,夏鹏飞²

1.中国石油大学(北京)人工智能学院自动化系北京 102249;2.东华大学计算机科学与技术学院上海 201620

English

深度学习是一门依赖于数据的科学, 传统深度学习方法假定在平衡数据集上训练模型, 然而, 现实世界中大规模数据集通常表现出长尾分布现象, 样本数量众多的少量头部类主导模型训练, 而大量尾部类样本数量过少, 难以得到充分学习. 近年来, 长尾学习掀起学术界的研究热潮. 本文综合梳理和分析近年来发表在高水平会议或期刊上的文献, 对长尾学习进行全面综述. 具体而言, 根据深度学习模型设计流程, 将图像识别领域的长尾学习算法分为丰富样本数量与语义信息的优化样本空间方法, 关注特征提取器、分类器、logits和损失函数这四个基本组成部分的优化模型方法, 以及通过引入辅助任务来帮助模型训练并在多个空间共同优化长尾学习模型的辅助任务学习3大类, 根据提出的分类方法综合对比分析每类长尾学习方法的优缺点. 然后, 进一步将基于样本数量的狭义长尾学习概念推广至多尺度广义长尾学习. 此外, 对文本数据、语音数据等其他数据形式下的长尾学习算法进行简要评述. 最后, 讨论目前长尾学习面临的可解释性较差、数据质量较低等挑战, 并展望如多模态长尾学习、半监督长尾学习等未来具有潜力的发展方向.

关键词: 深度长尾学习；长尾分布；不平衡学习；深度学习

下载

HTML

认领

认领进度

0 %

深度长尾学习研究综述

深度长尾学习研究综述

发表评论

用户信息设置