首页 / 新闻动态 / 学院新闻 / 正文
《大数据计算新范式--非MapReduce计算框架》报告会在物理与光电工程学院-中国核能与安全高等研究院顺利召开
发布时间:2022-12-01

 

 20221130日中午,应物理与光电工程学院刘永院长邀请,我校大数据技术与应用研究所所长黄哲学教授,在中国核能与安全高等研究院开展了题为“大数据计算新范式--MapReduce计算框架”的学术报告。本次报告由刘永院长主持,并结合当前疫情实际情况线上线下同步进行,吸引了罗景庭副院长、孙慧斌教授等30余名师生积极参加。

黄哲学教授课题组针对MapReduce分布式计算系统面临的计算效率低、数据扩展性差和复杂算法无法实现的窘境,提出了一种新的logo计算框架,突破了大数据计算的瓶颈。logo计算框架将分布式计算分成局部操作和全局操作两个步骤。局部操作用串行算法在计算节点上对局部存储的随机样本数据块做独立计算,全局操作将多个节点独立计算的随机样本的结果做集成计算,得出全局结果,作为整个大数据的近似计算结果。logo计算框架只在全局操作需要数据通信,消除了MapReduce计算中重复Reduce操作的通信开销,计算效率和数据扩展能力大幅提高;同时,在局部操作中直接运行串行算法,不再需要按MapReduce操作重写。实现logo计算框架的核心技术是随机样本划分大数据表达模型,即RSP数据模型。该模型将大数据集表示成一组小的随机样本数据集做分布式存储,每个随机样本集在局部操作步骤独立计算,产生独立的估计值。全局操作将局部分布式并行计算生成的大量随机样本估计值做集成,得到大数据计算的近似结果。logo计算框架可以解决大数据计算的许多问题,包括:算法约束,内存约束,计算效率,计算成本等。同时可以实现多集群协同的分布式计算。

在会议过程中及互动交流环节,师生们踊跃提问、气氛活跃,黄教授给予了耐心细致的解答。该报告为我院核数字化与系统工程方向的老师提供了大数据处理的理论指导,为我院与大数据工程中心开展后续合作打下了坚实基础。



主讲嘉宾简介:

 深圳大学特聘教授、大数据技术与应用研究所所长、大数据系统计算技术国家工程实验室副主任,瑞典皇家理工大学博士,首批广东省领军人才,深圳孔雀计划高层次人才。符号值和混合值数据快速聚类算法研究的开拓者,发表了k-modes等一系列著名聚类算法,被纳入国内外教科书和专著,进入软件产品。荣获亚太地区知识发现和数据挖掘国际会议首个最有影响论文奖。发表学术论文250多篇,主要论文被引用超万次,单篇独立作者论文最高引用超3000次,入选斯坦福大学2020年和2022年全球前2%顶尖科学家“终身科学影响力排行榜”。近年来主要研究大数据并行与分布式计算技术,提出了随机样本划分(RSP)分布式大数据表达模型,创新性地融合了分布式计算、统计抽样和近似计算方法,有效地解决了超大数据计算的内存约束问题,研究成果荣获多个创新大赛奖,成功用于实际应用。

 


 

 

 

 

上一篇:中国核能与安全高等研究院2022年度工作总结大会顺利召开
下一篇:深圳大学中国核能与安全高等研究院多项成果在核博会上展出

联系我们

地址:深圳市南山区南海大道3688号L6-11层

电话:0755-86938537

邮箱:asnes.nuclear@szu.edu.cn

微信公众号

版权所有©深圳大学中国核能与安全高等研究院