个性化联邦小样本学习|Personalized Federated Few-Shot Learning
摘要
个性化联邦学习(PFL)以分散的方式为每个客户学习个性化的模型,其中每个客户拥有不共享的私人数据,客户之间的数据是非独立同分布的(i.i.d.)。然而,现有的PFL解决方案假设客户有足够的训练样本来共同诱导个性化的模型。因此,现有的PFL解决方案不能在少数情况下表现良好,在这种情况下,大多数或所有的客户只有少量的样本用于训练。此外,现有的小样本学习(FSL)方法通常需要集中的训练数据;因此,这些FSL方法并不适用于分散的场景。如何在每个客户的训练样本有限的情况下实现PFL是一个实际但未被充分研究的问题。在这篇文章中,作者们提出了一个解决方案,称为个性化的联邦小样本学习(pFedFSL)来解决这个问题。具体来说,pFedFSL通过识别哪些模型在哪些客户身上表现良好,在不向服务器和其他客户暴露客户的本地数据的情况下,为每个客户学习一个个性化的、有鉴别力的特征空间,并且选择应该合作的客户与目标客户。在学习到的特征空间中,每个样本与同一类别的样本更接近,与不同类别的样本距离更远。在四个基准数据集上的实验结果表明,pFedFSL在不同的设定下都优于baseline。
背景
不同客户端的数据异质性使得整个局部数据难以与单一全局模型进行拟合,进而影响了模型的性能和收敛速度。因此,个性化联邦学习(Personalized Federated Learning, PFL) 被提出来解决上述问题。PFL的目标是为每个参与的客户共同学习一个个性化的模型,学习到的局部模型的目标是能够很好地拟合客户的不同局部数据。大多数现有的PFL方法可以大致分为基于数据和基于模型的方法。
问题
现有的PFL方法要求大多数或所有参与的客户有足够的训练数据来诱导个性化模型。它们在小样本场景中表现不佳。然而,大多数或所有参与客户在每个类别中只有很少的训练样本。且对小样本学习(FSL)而言,大多数现有的FSL方法通常需要集中的数据来诱导FSL模型。关键的两个问题:
- 由于每个客户的训练样本很少,很难归纳出个性化的模型
- 在多个客户之间存在数据异质性,个体客户的数据分布无法用这种稀缺的本地数据进行可靠估计
方法及贡献
pFedFSL旨在通过鼓励拥有更多相似分布的客户进行更多合作,为每个客户学习一个个性化的和有区别的特性空间。在这些新的特征空间中,每个样本都更接近属于同一类别的样本,而远离属于其他类别的样本。通过确定哪些模型参数在哪些客户机上表现良好,而不向服务器或其他客户机公开本地客户机的数据,可以促进具有类似分布的客户机之间的协作。
贡献:
- 作者关注的是一个实用的且具一般性的PFL设置,其中每个客户的训练样本是少数的,具有不同数量的标签,而且客户的数据集是非i.i.d.。这两个问题都没有被现有的PFL和FSL方法解决。有鉴于此,作者们引入了pFedFSL方法,为每个客户端诱导出一个个性化的特征空间,它可以将注释有相同标签的样本相互靠近,而不同标签的样本则在该空间中相距甚远。
- pFedFSL旨在通过鼓励具有更多相似分布的客户进行更多的合作,为每个客户学习一个具有鉴别力的特征空间。 这减少了单个客户的数据稀缺性,提高了FL的性能。作者们进一步设计了一种策略,适应性地选择合作的客户,以减少通信负荷并提高训练效果。
模型
pFedFSL主要有模型融合、局部更新和局部模型选择和分享的三大阶段:
- 模型融合阶段: 与典型的FL不同,pFedFSL以分布式的方式在各个客户端进行模型融合。
- 局部更新阶段:
- 选择和共享局部模型:FL服务器从所有客户端接收到模型参数和聚合权重后,首先评估哪些模型对目标客户端最有利,然后有选择地将收到的模型中的一个子集发送给目标客户端。如果FL服务器简单地将所有接收到的模型发送到每个客户机,将会增加巨大的通信开销。作为一种替代方案,FL服务器可以随机抽样模型参数的子集,然后发送给客户端。然而,由于客户之间的数据是非i.i.d.的。,随机抽样可能不会收敛。因此,pfedsl使用了一个采样框架,旨在估计哪些模型对目标客户端最有利,然后将尽可能多的有用模型发送到目标客户端。
设Q为亲和矩阵,其中Q_ij度量theta_j在前几轮对客户端c_i数据的执行。在每一轮,pFedFSL给每个客户端c_i发送Q的第i行前m个值对应的m个模型的参数。我们最初设Q = diag(-inf,…, -inf),其中inf表示无穷大;因此,在一开始,除模型theta_i外,每个模型都有相同的机会被发送到客户端c_i。然后,在第t轮,使用聚合阶段计算的权值更新Q,如下所示:
算法
链接
论文:https://ieeexplore.ieee.org/document/9837001
代码:http://www.sdu-idea.cn/codes.php?name=pFedFSL