深圳市南山区桃源街道深圳大学城哈尔滨工业大学校区 电话:0755-26033876 Copyright@2002-2016 HITSZ.EDU.CN 哈尔滨工业大学(深圳) 粤ICP备 15069706号-1
技术支持:网络与计算中心
【哈工大(深圳)宣】(李金润/文 张迤岚/图)为进一步推动人工智能领域的学术交流与技术探讨,日前,哈工大深圳校区学生工作部(处)举办“树人讲堂”首期讲座,邀请信息学部计算机科学与技术学院陈科海教授以“DeepSeek语言模型技术与实践”为主题做讲座。
陈科海介绍了自然语言处理的发展历史,并结合ChatGPT和DeepSeek等大语言模型详细讲解了关键核心技术原理,重点阐述了情境学习、思维链、指令学习以及人类反馈强化学习四项关键技术。陈科海介绍到,与业界其他大模型相比,DeepSeek通过多项创新技术实现了性能跃升,例如MoE架构、多头潜在注意力机制、多Token预测目标以及自主研发训练框架等,这些创新成果不仅展现了DeepSeek的技术实力,也为大模型领域的未来发展提供了重要参考。
如何用好Deepseek?陈科海分享说,可以通过调用API简化开发或本地部署以方便日常使用,从而更好完成论文润色、发言稿撰写、数据分析等功能。“大模型的应用不仅依赖于模型本身的能力,还需要使用者结合实际场景撰写明确指令、提供参考资料、分解复杂问题,并给予大模型一定的思考时间。” 陈科海说到。(编辑 谢梁晖 审核 张惠屏)
讲座现场