【浙江大学DeepSeek公开课】DeepSeek的本地化部署与AI通识教育之未来
目录
- 一、人工智能新时代背景
- 时代变迁
- 生成式人工智能(AIGC)盛行
- 人机共存时代来临
- 二、DeepSeek简介
- 产品体系
- 技术优势与成就
- 三、DeepSeek的应用场景
- 多场景全面接入
- 功能丰富多样
- 四、DeepSeek的本地化部署
- 定义与核心
- 优点
- 缺点
- 部署方式
- 模型版本与硬件要求
- 五、DeepSeek与AI通识教育之未来
- 国家战略与高校行动
- 浙江大学的实践探索
- 六、总结
一、人工智能新时代背景
时代变迁
- 从农耕时代、互联网时代过渡到大数据时代,当前正迈向智能化时代
- 互联网大数据推动智能化发展,引发信息技术革命
生成式人工智能(AIGC)盛行
- 文生文、文生图、文生视频等多种形式的生成式AI应用涌现
- 以LumaAI大模型DreamMachine生成的视频为例,展示AIGC的强大能力
人机共存时代来临
- 元宇宙与现实世界融合,数字分身成为趋势
- AI技术广泛应用于智能图像理解、新闻推荐、智能搜索排序、自动驾驶、智能会话、机器翻译、个性化推荐等众多领域
二、DeepSeek简介
产品体系
- DeepSeek-Math:专注于数学领域
- DeepSeek-Coder:代码生成与补全
- DeepSeek-VL、VL2:视觉与语言处理
- DeepSeek-V2、V2.5、V3:不断迭代升级的大语言模型
- DeepSeek-R1、R1-Zero:高性能模型,擅长处理复杂任务,推理能力强
技术优势与成就
- 性能对标:DeepSeek-R1在数学、代码、自然语言推理等任务上性能比肩OpenAI o1正式版
- 榜单排名:DeepSeek-V3在目前大模型主流榜单开源模型中位列榜首,与世界最先进的闭源模型表现相当
- 蒸馏技术:基于DeepSeek-V3训练的DeepSeek-R1-Zero和DeepSeek-R1,蒸馏出的6个小模型开源给社区,其中32B和70B模型在多项能力上实现对标OpenAI o1-mini的效果
- 全球影响力:DeepSeek开源AI大模型和相关技术火爆全球,在140多个国家的应用商店下载排行首位,成为有史以来最快获得1亿注册用户的APP
三、DeepSeek的应用场景
多场景全面接入
- 基础运营商:三大基础运营商接入
- 芯片厂家:超过15家芯片厂家合作
- 企业:200多家企业涉及云服务、网络科技、金融等领域
- 手机厂商与车企:多家手机厂商和车企合作
- 政务系统:地方政府政务系统接入
- 云计算巨头:微软、英伟达、亚马逊等世界级云计算巨头宣布接入DeepSeek
功能丰富多样
- 涵盖智能对话、文本生成、语义理解、计算推理、代码生成补全等应用场景
- 支持联网搜索与深度思考模式,以及文件上传功能,能够扫描读取各类文件及图片中的文字内容
- 具体功能包括但不限于简历修改、解题助手、撰写产品痛点分析、语法纠正、写工作汇报等众多方面
四、DeepSeek的本地化部署
定义与核心
- 将人工智能系统部署在用户指定的本地服务器或基础设施中,而非依赖云端服务
- 核心目标是实现数据主权掌控、文化适配优化和合规性保障,满足特定区域、行业或机构的个性化需求
优点
- 数据隐私安全:确保数据存储与处理在本地,降低泄露风险
- 法律合规性:
- 满足GDPR、HIPAA等法规对数据存储位置的要求
- 适应金融、政务等行业的本地化数据监管政策,避免法律纠纷
- 性能优化与低延迟:
- 实现本地处理,消除网络延迟,提升高频交互场景的体验
- 硬件资源专用于模型推理,避免云服务多租户环境下的资源争抢
- 高度定制化:
- 可根据企业垂直领域调整模型参数,提升专业场景的准确性
- 灵活对接内部数据库、ERP等系统,实现个性化功能
- 自由选择或回滚模型版本,避免云服务强制更新导致的兼容性问题
- 长期成本效益:
- 减少云服务依赖,避免持续支付API调用费用,尤其在高频使用场景下成本优势显著
- 硬件自主规划,可按需选择服务器配置,平衡性能与预算,长期摊销硬件投入
- 稳定性和可靠性:
- 规避云服务风险,不受供应商服务中断、API限制或政策变动影响,保障业务连续性
- 可自主设计备份和容灾方案,提升系统鲁棒性
- 技术自主性:
- 避免供应商锁定,掌握核心技术栈,减少对第三方平台的依赖,保障长期战略灵活性
- 降低知识产权外流风险,适合医疗、金融、政府等敏感领域
- 数据无需上传至第三方云端,避免传输和存储过程中的泄露风险
- 企业自主管理数据访问权限,降低外部攻击或内部滥用风险
- 本地环境更容易满足严格的安全审计要求
缺点
- 成本相对较高
部署方式
- 基于ollama的本地run:
- 安装ollama包:pip install ollama
- 运行不同版本的DeepSeek模型,如1.5b、7b、8b等
模型版本与硬件要求
- R1-1.5b:显存4GB+,内存8GB+,本地存储5GB,可在个人普通机上运行
- R1-7b:显存12GB+,内存16GB+,本地存储10GB,个人普通机可运行
- R1-8b:显存16GB+,内存32GB+,本地存储15GB,个人普通机可运行
- R1-14b:显存24GB+,内存64GB+,本地存储30GB,需要专用服务器
- R1-32b:显存48GB+,内存128GB+,本地存储60GB,需要GPU服务器
- R1-70b:显存80GB+,内存256GB+,本地存储120GB,需要GPU服务器
- V3\R1-671B(MoE):需要4块A100 GPUs(320GB显存),内存512GB,本地存储500GB+,需高端GPU服务器
- DeepSeek R1蒸馏版:均可进行本地化部署,小规模的1.5b-8b可部署在普通机,其余需要GPU;全量版MoE671b无法直接本地部署,但有压缩的动态量化版本实现本地化,需高端GPU服务器
五、DeepSeek与AI通识教育之未来
国家战略与高校行动
- 国家战略:2024年政府工作报告明确提及“人工智能+”行动,凸显人工智能技术在国家战略中的重要地位
- 高校响应:
- 南京大学:2024年2月宣布面向全体新生开设人工智能通识核心课程
- 浙江大学:2024年6月19日发布《大学生人工智能素养红皮书》《教师人工智能素养红皮书》,成立大学人工智能教育创新联盟,2025年2月面向全校开设人工智能通识课
- 复旦大学:2024-2025学年推出至少100门AI领域课程,加快AI+融合创新人才培养新局面
- 教育部:2024年7月29日,教育部副部长吴岩在座谈会上提到要打造人工智能通识课程体系
浙江大学的实践探索
- 成立研究中心:
- 2024年3月,浙江大学成立人工智能教育教学研究中心,统筹全校教育、科技、人才优势,整体规划和协调人工智能通识教育教学改革
- 目标是打造人工智能通识课程体系和实训范式,直面“智能时代、教育何为”的挑战,让更多人成为人工智能技术的受益者
- 构建课程体系:
- 开设多层次的人工智能基础A/B/C通识必修课程,2024-2025学年春夏学期面向2024级学生全面开设58个教学班
- 开设人工智能与其他学科专业深度交叉融合的AI交叉类课程,已建设158门
- 开设人工智能微专业,其中华五“AI+X微专业”项目入选教育部“人工智能+高等教育”应用场景典型案例,2025年将推出2.0版本
- 建设人工智能专业核心课程,牵头计算机“101计划”核心课程《人工智能引论》
- 师资队伍建设:
- 举办人工智能通识教育师资培训班、人工智能基础通识课程教材建设研讨会、集体备课会等
- 自2024-2025学年春夏学期起,每年面向全校本科生开设人工智能通识课程,各学院(系)设立人工智能教育教学工作牵头教师,组建百人以上教师的跨学科教学团队
- 教材编写:
- 2024年6月16日,在教育部101计划核心课程《人工智能引论》的基础上,设置面向全校所有学生的人工智能通识必修课程群,包括《人工智能基础A》(理工农医类)、《人工智能基础B》(社会科学类)、《人工智能基础C》(人文艺术类)
- 实行标准化教学管理,统一各教学班知识点、成绩构成、考试标准,出版配套教材
- 2024-2025学年秋冬学期,开设人工智能通识教育试点班,探索完善教学资源、优化教学方法
- 2024-2025学年春夏学期,已面向2024级学生开出58个教学班
- “浙大先生”智能体应用门户:
- 以“学生成长”为中心,打造教育领域大模型应用(智能体)生态系统解决方案“大先生”
- 构建低代码技术门槛为特色的智能体开发平台与高校领域智能交互为场景的智能服务门户,面向学校教学、科研、服务等多种场景提供AI应用服务
- 打通在校师生、毕业校友双重认证体系,对接CARSI高校联盟认证,面向800余所高校开放服务
- 本地化部署DeepSeek V3、R1模型(满血版),汇集师生共创的校园多场景智能体
- 数据统计截至2025年2月27日,累计用户6672315,当天用户106258,峰值活跃用户4906,累计tokens消耗8652365124,日消耗tokens1897269979,峰值消耗tokens(小时)207356605,总会话数(日)172387,浙大在线师生用户(日)9176,浙大校友用户(日)2925,CARSI用户(日)3206
- DeepSeek赋能浙大人工智能通识教育:
- 教学革新:实现个性化和精准化教学
- 教师减负与专业成长:助力教师提升教学效率和专业水平
- 素养与创造力培养:培养学生的人工智能素养和创造力
- 教育生态重构:提升教育公平与效率
- 具体应用:在浙大通识课程内容中融入DeepSeek本地化部署实验、微调+业务数据实验、综合应用大作业等;在教材内容中增加DeepSeek介绍、部署和微调;在教材案例中增加DeepSeek部署和微调案例
- 支撑浙江省本科高校人工智能通识课程“名师名课”建设:
- 浙江大学负责一批研究型层次优质线上课程资源建设,推动共建共享,助力2025年秋季学期浙江省省属本科高校人工智能通识教育全覆盖
- 课程包括《人工智能引论》《人工智能基础A》《人工智能基础B》《人工智能基础C》《计算思维与人工智能》《人工智能伦理与安全》《人工智能数学基础》《人工智能产业应用与实践》《人工智能大模型前沿与应用》等,分别由浙江大学的吴飞、陈建海、许端清、吴超、何钦铭、杨子凄、黄正行、张寅、孙凌云等专家牵头
六、总结
- 深入探讨了DeepSeek AI在新时代的背景下应运而生,其本地化部署实践为各行业提供了数据主权掌控、文化适配优化和合规性保障的解决方案
- 浙江大学在AI通识教育领域的积极探索和实践,为培养适应未来社会发展需求的新型人才提供了宝贵经验
- 展望未来,DeepSeek将继续助力AI通识教育的发展,推动教育革新、提升教育公平与效率,培养具有AI素养和创造力的新一代人才