理学院学术预告

来源:理学院  作者:韩莉莉  编辑:王琳  发布时间: 2025-05-27 浏览数:

讲座主题:基于边云协同的AI大模型轻量化部署

主要内容:随着深度学习,尤其是AI大语言模型的广泛应用,如何在资源受限的物联网设备上高效部署这些计算密集型模型成为一大挑战。由于大模型的参数量达到数十亿甚至数千亿级别,其在物联网设备上的部署不仅计算成本高昂,而且推理时间长。本次报告聚焦于基于边云协同的轻量化部署方案,通过将深度学习模型按计算任务进行分割,较大的模型卸载到云服务器,较小的部分则交由边缘服务器处理。通过结合云端训练与本地推理的方法,既能满足物联网设备对高能效和低延迟的要求,又能有效减少模型体积和推理计算量,从而显著提升推理效率。该方案为物联网环境中的AI大模型部署提供了一种新的高效路径。

主讲人简介:吴华明,男,天津大学应用数学中心教授、博士研究生导师。主要研究方向为移动云计算、物联网、移动边缘计算、深度学习等。研究成果主要发表在NCS、TPDS、TMC、TSC、TCYB、Globecom、ICC等知名国际期刊与会议上。曾主持国家自然科学基金项目、天津市自然科学基金项目、华为创新研究计划、阿里活水计划课题项目等若干项。曾获得斯坦福大学评选的2020-2024年全球前2%科学家;Elsevier JSA、VEHCOM和COMCOM顶级同行审稿人;IEEE网络科学与工程学报(TNSE)优秀审稿人;IEEE通信学报(TCOM)模范审稿人等荣誉。

讲座时间:2025年6月11日14:00-16:00

讲座地点:理学院1-806会议室

最新更新