学校AI赋能科研能力提升系列培训讲座第三期——司继春博士解读“大语言模型简介及应用”

文章来源：科研处作者：发布时间：2024-11-22 浏览次数：10

2024年11月19日，科研处举办的“AI赋能科研能力提升系列培训讲座”迎来了第三期活动，统计与信息学院司继春博士以 “大语言模型简介及应用”为题，为大家带来了一场引人深思、发人深省的专题讲座。本次讲座由科研处处长闫海洲主持，学校60余名教师参与。

作为开场，司继春首先展示了如何在VSCode中使用人工智能工具Copilot辅助编程，强调人工智能对于我们现有的生活、工作、生产方式产生了巨大的冲击，善于使用人工智能是未来的核心竞争力之一。他从当前大语言模型的基础——Transformer架构开始，从直觉上介绍了注意力机制的工作原理以及能达到的效果。为了打开大语言模型的黑盒，依次介绍了BERT和GPT两种模型的训练过程及InstructGPT的训练过程和原理，系统梳理了大语言模型的发展脉络。

在掌握大语言模型原理的基础上，司继春介绍了开源大模型的使用方法，通过Ollama工具的部署，可以直接在本地运行通义千问、Llama3等多种开源大语言模型，并可以通过Python等代码工具调用Ollama接口分别完成嵌入、补全和聊天等不同任务。

最后，司继春介绍了不需要编程基础即可轻易上手的大语言模型开发平台，如Dify的部署和使用方法。并以具体实例的方式，展示了如何使用大语言模型帮助进行网页爬虫的数据整理、政策不确定性指数的构建、情感分析以及知识库的创建和使用等。

本次讲座有效激发了教师提升AI技术应用素养、辅助科研选题及科研论文撰写的意识。教师也可以通过人工智能技术在科研中的应用，更好地满足科研的个性化需求，提高科研质量。