从Ascend C到大模型训练,国产AI技术链路走进课堂
发布人:华夏 上传时间:2026-04-30 阅读次数:

    425-26日,哈尔滨工业大学(深圳)实验与创新实践教育中心CANN开源社区、 SwanLab 联合打造了企业创新实验课《Ascend C算子开发与LLM微调实践》。为期两天的课程在充实的实操与交流后,于26日圆满结束。本次课程紧扣国产大模型与国产算力,将“产业前沿”第一时间引入课堂,实现了教学内容与技术演进的同频共振

 

1D246


    课程围绕国产AI技术栈,构建国产算力(CANN+ 国产工具(SwanLab+ 国产模型(Qwen等)的全栈教学体系,从底层算子开发到大模型微调,贯通人工智能关键技术链条,提升学生工程实践能力。课程面向具备C语言基础的本科生开设,吸引了来自计算机、通信、机器人、材料、数学等多个专业的学生参与。

    课程首日由华为CANN技术专家李鹏主讲。在理论环节,系统讲解昇腾NPU硬件架构CANN计算架构Ascend C算子编码范式。在实践环节,同学们基于CANNLab一站式开发平台完成Sigmoid算子开发,并且通过最新提供的CANNBot智能体有效提升算子开发效率。课程让同学们亲身体验AI计算底层引擎的构建过程,完成从调用模型开发算子的能力跃迁。


1DF74


    课程第二天聚焦大模型原理与微调工程实践。SwanLab AI解决方案架构师韩翔宇介绍了Transformer架构、KV CacheMoELoRA等关键技术,并结合DeepSeek V4等前沿模型的发展动态,分析国产大模型在昇腾平台上的适配与优化趋势。在实验环节,同学们基于昇腾NPU环境,使用Qwen3系列模型开展微调实践,将自定义SwanRmsNorm Ascend C算子编译并集成到昇腾CANN算子库,在NPU上高效执行加速Qwen系列模型微调训练,并通过SwanLab平台对训练过程中的Loss曲线、超参数等进行实时可视化跟踪。



    本次课程的一大特点在于理论紧跟前沿、实践立足工程。通过两天的高强度实践训练,同学们不仅加深了对昇腾NPUCANN生态的理解,也系统掌握了大语言模型的基本原理与工程实现路径,在真实算力环境中完成了从算子开发到模型微调的完整实践。课堂互动积极,实验完成度高,教学效果显著。


277EB


    作为学校推进引企入教、深化产教融合的重要举措,企业创新实验课程持续引入产业一线技术与工程实践。未来,哈尔滨工业大学(深圳)将进一步加强与企业合作,围绕国产算力与人工智能关键技术,构建更加开放、更高水平的实践教学体系,助力培养服务国家战略需求的创新型人才。


附:《Ascend C算子开发与LLM微调实践》课程核心大纲

课程模块

主要教学内容

学时

Ascend C算子开发

CANN架构、昇腾NPU原理、算子基础、Ascend C编程范式与API、核函数、算子编译部署

4

aclnn和pybind调用、泛化Tiling设计、vector算子开发示例讲解、sigmoid算子开发实验

4

大语言模型(LLM)微调

神经网络、深度学习、前向传播、反向传播、文本处理、Self-Attention与多头、Transformer Block拆解、Embedding 与语义空间

4

Decoder-Only,KV Cache、旋转位置编码、Scaling Laws、Moe稀疏专家、Swanlab 训练过程可视化、

微调工程实战(自定义Ascend C算子加速Qwen3微调)

4

 

 

(图文/郑海刚,审核/苏婷 薛睿 张彦峰)

 

最新发布