基于数据共享合同激励机制的联邦学习研究

发布者:张哲雨发布时间:2024-06-14浏览次数:10

主讲人:曲大鹏

主讲时间:2024年6月12日(星期三),15:00-16:00

主讲人简介:曲大鹏,辽宁大学副教授,工学博士,辽宁大学信息学部科创中心主任,美国弗吉尼亚大学国家公派访问学者,中国计算机学会计算机教育执行委员、互联网专委委员、YOCSEF沈阳AC委员。

主讲内容:

1.联邦学习研究背景。随着设备采集性能的大幅度提升,导致大量数据对中心服务器处理性能要求增加,需要大量网络资源开销,同时导致大量数据隐私泄漏等问题。联邦学习可以缓解集中式训练网络资源消耗大、数据隐私大量泄露问题以及单体训练的“数据孤岛”等问题。在联邦学习中,可能因为用户行为的多样性、地理位置的差异、设备类型的不同、时间因素的影响、数据丰富度的不均衡等原因,造成数据非独立同分布(Non-IID)问题,进而导致模型识别精度下降。

2.基于数据共享合同激励机制的联邦学习相关工作。在训练泛化能力强的全局模型基础上缓解Non-IID问题的工作主要分为两类,一类是局部微调的方法,一类是数据共享的方法。局部微调方法采用对比学习的方式(MOON),通过比较不同样本之间的相似性和差异性来学习表示。对于正样本对(相似的图片),拉近其特征向量映射在向量空间中的距离;对于负样本对(不相似的图片),推远其特征向量映射在向量空间中的距离。数据共享方法是从节点抽取少量数据样本到联邦学习平台,构建全局共享数据集,并将全局共享数据集中的部分数据发送给各节点,以此来降低用户节点中的数据分布偏度,从而降低用户节点间的Non-IID程度。

3.基于数据共享合同激励机制的联邦学习研究内容和关键技术。主要研究内容为采用数据共享策略的优势和目前数据共享策略存在的问题两个方面;关键技术主要从构建基于合同理论的激励机制展开。

4.本研究在医疗图像识别上的应用。医疗科技机构通过本研究成果可以利用本地数据训练自己的医疗图像识别模型,以此来提高效率、节省人力资源。

讲座现场:


欢迎光临天津财经大学珠江学院!
您是访问本网站的第位访客
  • 官方微信
  • 官方微博