学校AI赋能科研能力提升系列培训讲座第三期——司继春博士解读“大语言模型简介及应用”

文章来源:科研处 作者: 发布时间:2024-11-22 浏览次数:10


20241119日,科研处举办的“AI赋能科研能力提升系列培训讲座”迎来了第三期活动,统计与信息学院司继春博士以 “大语言模型简介及应用”为题,为大家带来了一场引人深思、发人深省的专题讲座。本次讲座由科研处处长闫海洲主持,学校60余名教师参与。

作为开场,司继春首先展示了如何在VSCode中使用人工智能工具Copilot辅助编程,强调人工智能对于我们现有的生活、工作、生产方式产生了巨大的冲击,善于使用人工智能是未来的核心竞争力之一。他从当前大语言模型的基础——Transformer架构开始,从直觉上介绍了注意力机制的工作原理以及能达到的效果。为了打开大语言模型的黑盒,依次介绍了BERTGPT两种模型的训练过程及InstructGPT的训练过程和原理,系统梳理了大语言模型的发展脉络。



在掌握大语言模型原理的基础上,司继春介绍了开源大模型的使用方法,通过Ollama工具的部署,可以直接在本地运行通义千问、Llama3等多种开源大语言模型,并可以通过Python等代码工具调用Ollama接口分别完成嵌入、补全和聊天等不同任务。

最后,司继春介绍了不需要编程基础即可轻易上手的大语言模型开发平台,如Dify的部署和使用方法。并以具体实例的方式,展示了如何使用大语言模型帮助进行网页爬虫的数据整理、政策不确定性指数的构建、情感分析以及知识库的创建和使用等。

本次讲座有效激发了教师提升AI技术应用素养、辅助科研选题及科研论文撰写的意识。教师也可以通过人工智能技术在科研中的应用,更好地满足科研的个性化需求,提高科研质量。