综合新闻
学生工作部(处)举办“DeepSeek语言模型技术与实践”主题讲座
发布时间:2025-03-12 09:10:30 338

【哈工大(深圳)宣】(李金润/文 张迤岚/图)为进一步推动人工智能领域的学术交流与技术探讨,日前,哈工大深圳校区学生工作部(处)举办“树人讲堂”首期讲座,邀请信息学部计算机科学与技术学院陈科海教授以“DeepSeek语言模型技术与实践”为主题做讲座。

陈科海介绍了自然语言处理的发展历史,并结合ChatGPT和DeepSeek等大语言模型详细讲解了关键核心技术原理,重点阐述了情境学习、思维链、指令学习以及人类反馈强化学习四项关键技术。陈科海介绍到,与业界其他大模型相比,DeepSeek通过多项创新技术实现了性能跃升,例如MoE架构、多头潜在注意力机制、多Token预测目标以及自主研发训练框架等,这些创新成果不仅展现了DeepSeek的技术实力,也为大模型领域的未来发展提供了重要参考。

如何用好Deepseek?陈科海分享说,可以通过调用API简化开发或本地部署以方便日常使用,从而更好完成论文润色、发言稿撰写、数据分析等功能。“大模型的应用不仅依赖于模型本身的能力,还需要使用者结合实际场景撰写明确指令、提供参考资料、分解复杂问题,并给予大模型一定的思考时间。” 陈科海说到。(编辑 谢梁晖 审核 张惠屏)

1.png

2.jpg

讲座现场