音乐推荐中的流行偏见
随着越来越多的音乐可以通过音乐流媒体服务获得,音乐推荐系统已经成为帮助用户搜索、分类和过滤大量音乐收藏的关键。
非主流听众收到的音乐推荐比主流听众差
然而,一个众所周知的问题是,推荐系统倾向于流行偏差,这导致长尾项目(即用户互动很少的项目)很少有机会被推荐。
我们通过测量算法生成的音乐推荐给主流和非主流音乐听众的准确性来验证这一效果。
我们使用了一个数据集,其中包含音乐流媒体平台Last的4,148个用户(每组2,074个用户)的收听历史。主要听非主流音乐的FM (BeyMS)或主要是主流音乐(女士).
图1显示了非主流听众收到的音乐推荐比主流听众差。
非主流音乐听众的子群体
我们应用无监督聚类算法HDBSCAN*来识别非主流音乐听众中的子组。
根据他们最常听的音乐类型,我们确定了四个子群体:(i)只使用原声乐器(如folk)的音乐类型的用户(U_folk)、(ii)使用劲爆音乐如硬摇滚或街舞(U_hard)、(iii)使用有原声乐器的音乐和(几乎)没有人声的音乐,例如环境音乐(U_ambi),以及(iv)使用(几乎)没有人声的高能音乐,如电子音乐(U_elec).
对音乐推荐的影响
用户收听自己音乐偏好之外的音乐的意愿对音乐推荐的质量有积极的影响
通过比较每个小组的听音乐历史,我们确定哪些用户最可能听他们喜欢的类型之外的音乐。
那些主要听原声音乐,(几乎)没有人声的人(U_ambi)被发现最有可能听其他小组喜欢的音乐。
那些主要听硬摇滚或嘻哈音乐的人(U_hard)最不可能听其他小组喜欢的音乐。
在下面的图2中我们可以看到U_ambi收到的推荐比U_hard,即用户收听自己主要音乐偏好之外的音乐的意愿对音乐推荐的质量有正向影响。
公平的音乐推荐
我们相信,我们的发现为开发改进的用户模型和推荐方法提供了有价值的见解,以更好地服务于非主流音乐听众。
然而,我们也认为,仍然需要大量的研究,以提供公平的音乐推荐模型,一般化,并避免任何用户群体的不公平待遇。
我们希望我们的数据集(https://doi.org/10.5281/zenodo.3784764)及源代码(https://github.com/pmuellner/supporttheunderground),对科学界将来的分析是有用的。
评论