孙广中

电　话：(0551)63602443

E-Mail：gzsun@ustc.tsg211.com

个人主页：http://staff.ustc.tsg211.com/~gzsun/

研究组主页：http://ada.ustc.tsg211.com/

主要研究方向：高性能计算与算法优化、大数据处理与应用。

孙广中，男，教授，博士生导师，国家高性能计算中心（合肥）成员。中国计算机学会(CCF)杰出会员，CCF高性能计算专委会、普适计算专委会、计算法学分会执行委员。ACM终生专业会员，IEEE高级会员。曾任图书馆VIP计算机科学与技术学院副院长（分管本科招生和本科教学），现任少年班学院党总支书记兼副院长、多媒体计算与通信教育部-微软重点实验室副主任。

2000年获得中国科技大学计算机科学技术学士学位，2005年获得中国科技大学计算机软件与理论博士学位。曾先后在英特尔中国研究中心、微软亚洲研究院、耶鲁大学计算机系进行长期访问工作。作为项目负责人，先后承担完成国家重点研发计划、国家自然科学基金、安徽省自然科学基金、华为公司科技项目等20余项科研项目。在学术期刊和会议上发表论文90余篇，被他人引用6000余次。合作翻译著作3本。

长期承担本科生程序设计、算法实践、并行计算等课程的教学工作，负责组织本科生的各类程序设计竞赛活动。指导的本科生和研究生多次获得郭沫若奖学金、国家奖学金、省级优秀毕业生等荣誉。2013年至2017年，担任国家中学生科技创新后备人才培养计划（“中学生英才计划”）指导教师。现任ACM SIGCSE理事、CCF教育工作委员会委员。

导师选题：

单卡场景下LLM模型推理加速研究与应用

大语言模型（LLM）在自然语言处理任务中取得了显著成效，由于计算和存储需求，其通常部署在云服务器上。但出于数据隐私和系统定制化的考虑，将LLMs进行本地单卡部署也成为了一个重要需求。在单卡部署LLMs面临的主要挑战包括资源限制和实时响应需求，尤其在使用消费级GPU时更是如此。利用非结构剪枝技术可以获得在保持模型精度的同时具有降低模型参数规模。本项目的核心目标是优化剪枝后的稀疏大型语言模型的本地部署推理性能，主要通过开发新的存储格式和优化稀疏模型算子来实现。

GPU体系结构建模与高效模拟

在硬件体系结构的设计、验证和优化流程中，模拟(simulation) 可以在软件层面上创建硬件的虚拟模型、复现硬件行为，评估硬件性能，是硬件研发中一个关键的步骤。近年来，科学计算和深度学习等领域不断增长的计算需求使得GPU成为加速计算最重要的硬件。本项目将围绕GPU的模拟开展研究，重点关注GPU模拟本身的性能优化，探索在合理的模拟准确度损失下提高GPU模拟的执行性能。