
探秘 DeepSeek 落地进展,腾讯云携手业界专家共话 AI 生产力
活动在各种奇思妙想的碰撞中圆满结束。邵浩最后提到"广深高速进出行",“广”是指市场的广阔性;“深”是指创新的深厚性;“高”是指团队的高配性(团队本身的能力包括了情商、智商和逆商);“速”是指成长的快速性;后面三个字就是投资所关注的财务层面,“进”是指选择合适的进入时点,是 A 轮、B 轮还是 C 轮,“出”是指在什么时候退出,再加上“行”-综合判断可行性,就形成了“广深高速进出行”的要诀,但实际上
引言
踏入 2025 年,AI 技术已深度融入社会发展的脉络。DeepSeek 的崛起不仅成功唤醒了国人对 AI 的全新认知,更如一条行业的“鲇鱼”,充分激活了国内科技公司潜藏的巨大能量。此刻,AI 领域中创新与实践的中国加速度,再度毫无保留地展现在全世界眼前。那么,在 AGI 技术突破与产业智能化转型的交汇点上,哪些落地场景应用最值得我们期待?未来,这一波新的 AI 浪潮又将走向何方,为行业带来怎样长期的影响?
近日,由腾讯云 TVP 主办的 TVP AI 创变研讨会「DeepSeek 探技术创新与未来风向」活动在上海成功举办。此次活动特邀了 NLP、知识图谱、AIOps、AI 办公应用等多个领域的学界专家和企业高管,通过主题分享和模拟路演的方式,深入探讨了以 DeepSeek 为代表的生成式 AI 技术的落地与发展,分享行业前沿动态与企业实战经验。
开场致辞
vivo 高级专家、腾讯云 TVP 邵浩
本次活动由 vivo 高级专家、腾讯云 TVP 邵浩主持。他在开场时表示:在过去的三个月里,DeepSeek 以周均 240% 的代码提交增速展现出惊人的技术演进速度,并获得各类企业在不同应用场景竞相接入,技术迭代的加速度正在转化为实实在在的生产力提升。本次活动的举办,正是希望在 AGI 技术突破与产业智能化转型的交汇点上,汇聚各方贤达,共同探讨最值得期待的落地场景应用,挖掘 AI 浪潮的趋势深远的行业影响。
DeepSeek技术路径与创新价值解读
《知识增强大模型》作者、前达观数据副总裁、腾讯云 TVP 王文广发表了题为《DeepSeek 开始的中国式全球化机遇》的演讲。他介绍,DeepSeek 通过算法-模型架构-数据-计算机工程的垂直整合创新,验证了“极致优化现有技术链”的可行路径。其开源策略不仅打破技术黑箱,更推动行业建立全球生态,不仅使得国产大模型成为全球顶尖模型,更带来了中国式全球化的新机遇。
《知识增强大模型》作者、前达观数据副总裁、腾讯云 TVP 王文广
算法创新上,DeepSeek 提出 R1-ZERO 强化学习算法,将类似训练围棋 AI Alphago zero 所使用的纯强化学习机制迁移到大语言模型领域,通过设计 GRPO 实现推理过程的奖励机制,将复杂推理任务分解为规则可量化的多步决策过程,持续迭代优化推理路径选择。这使得 DeepSeek-R1 在复杂推理任务中达到接近 o1 水平,尤其在数学问题求解场景表现突出,支撑其成为首个具备国际竞争力的大模型。
模型架构上,DeepSeek 结合多头潜在注意力(MLA)技术和混合专家(MoE)框架,采用微型专家网络,通过动态路由激活机制降低激活参数量的数量,激活参数量仅为模型参数的 1/18,在同等算力下获得更高吞吐量,大幅降低推理成本;并首创专家参数共享方案,实现通用知识复用效率提升。
工程实践上,DeepSeek 配套开发 FlashMLA 框架优化专家网络并行计算,结合 GEMM 算子重构较 NVIDIA 原生实现提升 2.7 倍性能,采用 DualPipe 双流水线加速训练吞吐,并构建自动化数据合成管道解决数据碎片化、标注成本高的短板,最终支撑 DeepSeek-R1 版本低成本强复杂推理能力突破。
此外,通过一系列开源动作,DeepSeek 已经吸引全球顶尖实验室参与模型评测验证和复现,推动 R1-Zero 的训练方法成为行业主流方案,可以说建立了首个可复现的千亿参数推理模型的新基准。
Agentic RAG范式演进与挑战
同济大学特聘研究员、博导、OpenKG 发起人、腾讯云 TVP 王昊奋带来了《Agentic RAG 时代:DeepSeek 引领推理模型升级下的知识检索增强》主题演讲。他表示,RAG(检索增强生成)作为大模型落地的核心手段,经历了从朴素 RAG(基础索引-检索-生成流程)到模块化 RAG (融合搜推技术、组件化编排)的演进。DeepSeek 带来推理专用模型,通过数学推理强化和形式化验证能力,克服了模型幻觉问题突出、信息时效性不足、参数化知识表达低效、领域适配能力弱、复杂推理能力待提升等挑战,为 Agentic RAG 提供了关键基座能力。
同济大学特聘研究员、博导、OpenKG 发起人、腾讯云 TVP 王昊奋
针对传统 RAG 的碎片化检索局限,王昊奋解析了 Graph RAG 的核心价值:1)基于图结构实现知识全局关联,解决分散信息整合难题;2)通过实体-关系网络提升检索可解释性;3)支持多跳推理路径动态规划。然而,原生 Graph RAG 存在资源消耗过大问题——如 300 篇文档处理需 2000 倍 Token 消耗,而 DeepSeek 通过高效 RLHF 框架和路径动态剪枝算法,将图推理成本降低至工业可用水平。
王昊奋提出了推理模型与 RAG 三重协同优化方法论:
-
推理主体分层:通用模型(如 DeepSeek-R1)负责意图理解,专用模型/符号系统执行确定性推理;
-
检索策略动态化:采用蒙特卡洛树搜索(MCTS)实现检索-生成多路径优化,结合强化学习反馈机制;
-
知识原子化重构:通过 PIKE RAG 框架将知识分层为事实层-信息层-知识层,匹配不同复杂度查询需求。
在此框架中,DeepSeek 提供数学验证基座,确保推理链逻辑严密性。
王昊奋举了金融场景复杂推理任务+高频更新的外部专业知识,以及医疗场景复杂推理任务+强领域知识+低幻觉容忍的例子,说明推理模型与 RAG 的结合,兼顾了外部知识依赖和复杂推理的需求,使得大模型更加胜任复杂的真实场景。
DeepSeek技术突破加速AI原生云治理
腾讯云顾问产品总监 刘庆兴在《腾讯云顾问 x DeepSeek:云上治理应用趋势探索及实践》主题演讲中介绍,腾讯云顾问产品平台正在基于 DeepSeek 构建“智能体协同治理”体系,推动云上治理从规则驱动向 AI 原生演进。
腾讯云顾问产品总监 刘庆兴
云计算时代,IT 研发和运营团队面临三大挑战,一是架构复杂,信息孤岛多;二是治理零散,协作效率低;三是背靠业务,价值呈现难,腾讯云顾问平台定位为一站式可视化治理平台,致力于向用户提供高效绘云、正确用云、精益管云三大核心能力,实现“被看见的价值”。
基于腾讯云卓越架构“3层×6支柱”理念(3层:应用层、架构层、资源层,6支柱:安全、性能、成本、可持续、卓越运营、可靠性),腾讯云顾问平台构建了「可视化-协同化-度量化」三位一体的云治理方法论体系:首先通过智能绘图将云上架构可视化;然后将风险巡检、容量监测、混沌演练等丰富的垂直应用能力一站式集成,围绕云架构进行高效协同治理;最后,云顾问还提供卓越架构评估能力,全方位量化和追踪架构治理的旅程和成效,并支持归档治理报告,让治理价值看得见。
随着 DeepSeek 等 AI 大模型技术的发展,云顾问也迎来了“AI 原生”大升级,以大模型强大的推理能力,重点解决了传统运维无法解决的复杂场景问题:
-
调用链路生图:通过学习多模态数据,重构 AI 架构拓扑推理算法,提升架构链路生成准确率,支持跨 VPC 业务的上下游调用链路自动发现,架构图绘制效率大大提升
-
Multi-agent 协同:基于 Multi-agent 框架构建上层 AI 应用生态,用户可通过自然语言和运维工具交互,完成隐患发现、容量预测、混沌验证等一系列复杂任务。云上治理从传统规则驱动进阶为意图驱动,提升了人机协作效率,多智能体之间无缝协同,共同打造智能化的“聊天作战室”
-
ChatBI:整合用云隐患数据、监控日志、专家经验等多模态数据,构建云顾问统一数仓,支持用户 NL2SQL 自然语言实时查询架构图节点的指标情况,并生成智能洞察结论,最终形成千人千面的自定义报表,提高架构治理效率。
刘庆兴强调,AI 大模型落地到 AIOps 生产必然存在强知识依赖、低幻觉容忍等挑战,所以一定要构建一套自己的知识库,作为智能体的外置大脑。
目前,腾讯云顾问平台已服务 13000+ 企业,累计生成 10000+ 架构图,有效助力了数以万计的腾讯云客户提升云上系统的稳定性。
基于DeepSeek的WPS AI办公应用实践
金山办公高级产品总监 赵九州发表了《基于 DeepSeek 的 WPS AI 办公应用实践》的主题演讲。他介绍,金山办公通过“大模型生成+工程化函数调用+场景化应用切片”的应用路径,将 DeepSeek 能力与办公工具深度耦合,验证了 Agent 框架在复杂任务调度、格式保留等场景的技术可行性。
金山办公高级产品总监 赵九州
金山办公采用“不造大模型,专注应用集成”的策略,与 DeepSeek 等主流模型厂商深度合作,构建了技术架构。在应用层面,面向企业客户提供 Office 协作功能,通过统一网关实现多模型调度,并支持模型私有化部署。工程化调度层面,将大模型输出与传统工具 API(如格式引擎、虚拟机、按键模拟)结合,解决纯模型能力无法覆盖的格式保留、多模态处理等问题。
推理模型给办公带来了新的应用范式,但推理模型并非万能。赵九州强调了模型选型逻辑:在确定性任务,如翻译,要选择通用模型;复杂工作流场景则采用 DeepSeek-R1 的 Agent 框架优化任务拆解效率,如 PPT 生成场景。
在产品设计上,考虑到用户不擅长 Prompt 输入,WPS 推出了“AI 写作助手”模式:
-
上下文感知:将用户输入的上文作为隐式 Prompt,通过 DeepSeek-V3 实时生成联想内容(灰色字体),用户可通过快捷键采纳建议,避免交互中断。
-
格式保留技术:在修订模式中注入 AI 能力,记录修改轨迹并说明原因,确保用户对格式与内容的双重控制权。
-
场景化切片:聚焦办公最小切片(如 PPT 风格克隆、表格数据清洗),通过 Agent 框架串联 RAG、语料库与工具 API。
赵九州总结了 WPS AI 用户级产品的五大原则:
-
不要让用户输入 Prompt,让 AIGC 回归创作本身
-
聚焦用户的办公、效率场景的最小切片
-
避开不能接受幻觉的领域
-
增强召回,减少噪音
-
围绕小切片做上下游工作流产品
目前,WPS AI 办公助手系列已成为金山办公的年度活跃度最高的产品线,沉浸式交互设计使 AI 采纳率提升,加上 PPT 风格克隆、多模态滤镜等功能,此类 AI 应用为 WPS 贡献了亿元规模的年收入。而在政务材料生成场景中,文本规范性、诗词典故引用准确率都得到提高。
金山办公的实践表明,AI 办公应用需以用户体验为锚点,通过工程化能力弥补大模型短板,最终实现技术价值与商业价值的闭环。
头脑风暴:DeepSeek落地畅想
活动的分组讨论模拟路演中,与会者还针对 DeepSeek 多个相关热点话题展开激烈的辩论,并就看好的应用场景进行模拟路演,直观展现了 DeepSeek 技术成果转化为生产力的不同可能。
话题一:DeepSeek 会加速人才流动,还是形成大厂垄断
「架构师之路」主理人、腾讯云TVP 沈剑
一组代表「架构师之路」主理人、腾讯云TVP 沈剑表示,技术迭代天然促进市场细分和新领域出现,加速人才流动是必然结果,DeepSeek 也不例外。他解释说,DeepSeek 降低技术门槛,使中小厂无需依赖硬件资源即可参与 AI 竞争,人才不再因资源限制而被迫蹲在大厂。同时,对于人才追求技术实现和职业发展机会,DeepSeek 生态可以提供更多创新赛道,当前小公司创新产品频出就是证据。另一方面,AI 效率提升也导致岗位需求出现变化,倒逼人才被动流动以适应新领域。
《知识增强大模型》作者、前达观数据副总裁、腾讯云TVP 王文广
二组代表《知识增强大模型》作者、前达观数据副总裁、腾讯云TVP 王文广则从历史案例论证:新技术会通过人才聚集形成垄断而形成大厂,大模型领域也会重复这一路径。在资源与生态方面,大厂不仅通过高薪、稳定性吸引人才聚集,形成技术壁垒,还通过开源、生态合作扩大影响力,中小厂难以与之竞争。大模型基模领域头部效应显著。DeepSeek 可视为“新大厂”,自身从人数上看规模还小,但生态庞大。
话题二:DeepSeek 应用趋势下,企业是否应该考虑建设 AI 中台?
ClickPaaS CPO、腾讯云TVP 马俊
三组代表ClickPaaS CPO、腾讯云TVP 马俊从标准化、降本增效、以应用场景为中心,说明了建设 AI 中台的重要性,并以腾讯等大厂的实践作为背书。具体而言,AI 能力是企业的核心能力,也是成本比较高的能力(如 API 调用、模型训练)标准化程度高,集中管理中台可避免重复开发,降低资源浪费,提升企业AI治理能力。对于私有化部署定制模型(如结合内部数据微调),以及未来的多模型共存,中台可也提供 RAG 等工具链支持,以及统一调度和模型优化能力。利用企业构建的数据中台和业务中台,打造企业完整的能力共享中心。
《软件研发效能提升之美》作者、腾讯云TVP 吴骏龙
四组代表《软件研发效能提升之美》作者、腾讯云TVP 吴骏龙则从业务不确定性、成本与灵活性矛盾、组织管理挑战等角度提出相反的观点。对于中小企业和单一业务线,公司无需中台,定制化需求可通过轻量工具解决。对于大企业,中台需业务稳定性支撑,而 AI 领域“破坏性创新”频发,技术迭代非常快,场景不成熟,建设中台可能因业务变化而失效。同时中台建设成本高且周期长,可能拖累业务响应速度。此外,中台还会限制业务部门创新自由度,与 AI 领域快速试错的需求冲突。
项目路演一:365智慧学伴
Microtop AI CTO 齐国峰
Microtop AI CTO 齐国峰带来了「365 智慧学伴」助教助管项目路演。该项目面向中小学生,试图用 AI 引导和激发学习兴趣与特长,解决教育内卷下个性化学习需求。产品形态是软硬件结合提供给学生,终端覆盖平板、智能音箱、智能手表,通过大模型分析学生特长,用思维链引导学习,如拆解作文框架,主打将思考逻辑带给学生,而不是直接提供答案。商业模式上兼顾 2B 和 2C,前者与地方政府、学校合作,后者是家长付费。市场推广策略则是通过中小学科普、公益走入校园,以及举办学科竞赛提升产品影响力。
金山办公高级产品总监 赵九州
对于该项目,金山办公高级产品总监 赵九州点评认为,项目定位过于模糊,同时做 2B 和 2C 会导致资源分散,影响推广效果,建议聚焦单一场景。同时,学生需求间歇性,家长付费意愿低,需找到更刚需的切入口,类似拍照搜题。此外,思维链功能非常容易被大厂复制,需强化独特体验才能保证产品竞争力。
项目路演二:AI与寺庙文化
上海安畅网络架构师 孙家卿
第五组代表上海安畅网络架构师 孙家卿带来的项目,核心是结合 AI 与寺庙文化,面向海外年轻人及有信仰人群,连接到不同的寺庙,基于 RAG 技术对寺庙特色文化进行层层探索与解析,提供线上虚拟方丈/主持/小师傅的信仰指导服务,并计划与寺庙合作推出文化周边。商业模式上,项目分三个等级订阅制服务,联动寺庙资源进行线上线下推广。
《知识增强大模型》作者、前达观数据副总裁、腾讯云TVP 王文广
《知识增强大模型》作者、前达观数据副总裁、腾讯云TVP 王文广点评认为首先就项目合规性提出疑问,认为国内寺庙多为非营利机构,商业合作难度大,且宗教内容宣传受限。另一个问题是需求不明确。不过,他建议参考 AI 算命类产品,出海东南亚、港台市场。
项目路演三:AI 国产化单机数据库
杭州云贝数据技术有限公司 CTO 郭一军
杭州云贝数据技术有限公司 CTO 郭一军带来一个 AI 国产化单机数据库的路演。项目针对中小企业及需国产化替代的政企客户需求,基于 DeepSeek 技术打造单机分布式一体化数据库,主打“四高两低”(高可用、高性能、高扩展、高安全;低成本、低风险),通过 AI 实现智能化运维,支持弹性扩缩容。商业模式上,项目按节点收费,3 节点起售,100 万/套,主打国产化政策红利市场,预估 500 亿规模。
腾讯云顾问产品总监 刘庆兴
腾讯云顾问产品总监 刘庆兴表示,项目商业逻辑可行,因为国产化替代需求明确,价格优势吸引中小企业,但存在两大挑战:一是相对云厂商的成熟方案,还需解决单机数据库的运维 Know how,二是自动索引、弹性扩展等功能需证明技术壁垒。
项目路演四:软件智能化 Agent
描路科技创始人、腾讯云TVP 施德来
第八组是描路科技创始人、腾讯云TVP 施德来的路演。他首先分享了一个 AI 应用的三个核心要素:数据(Data)→处理(Insight)→执行(Action),目前的大模型主要在最后的执行部分发挥作用。他根据其公司现有的成熟先进的手机软件界面和操作流程数据的收集能力,提出来利用这些数据结合包括大模型在内的多种 AI 模型,推出 AI 生成产品原型的产品。它的优势是:使用门槛更低、更契合实际设计迭代的产品。
腾讯云顾问产品总经理 许小川
嘉宾腾讯云顾问产品总经理 许小川点评认为,项目的关键在于,B 端软件公司是否愿意为实现智能化改造而付费使用第三方 SDK。客户普遍关注 SDK 是否能真正解决他们的核心痛点、带来实际 ROI 回报。同时,是否具备差异化的技术优势、低门槛的集成体验、可信的服务能力以及清晰的价值主张。
结语
活动在各种奇思妙想的碰撞中圆满结束。邵浩最后提到"广深高速进出行",“广”是指市场的广阔性;“深”是指创新的深厚性;“高”是指团队的高配性(团队本身的能力包括了情商、智商和逆商);“速”是指成长的快速性;后面三个字就是投资所关注的财务层面,“进”是指选择合适的进入时点,是 A 轮、B 轮还是 C 轮,“出”是指在什么时候退出,再加上“行”-综合判断可行性,就形成了“广深高速进出行”的要诀,但实际上判断项目是非常难的,尤其是对于早期的 AI 项目。
DeepSeek 的成功,源于技术理想主义者对边界的无畏突破,以科技重塑世界的信念。他相信,在 TVP AI 创变研讨会的牵引下,与会嘉宾们,不管来自大厂还是创业公司,如果能坚守对 AI 技术的理想与热忱,持续探索创新,推动技术与场景向极致演进,必将创造更美好的未来。
TVP,即腾讯云最具价值专家(Tencent Cloud Valuable Professional),是腾讯云授予云计算领域技术专家的一个奖项。TVP 致力打造与行业技术专家的交流平台,促进腾讯云与技术专家和用户之间的有效沟通,从而构建云计算技术生态,实现“用科技影响世界”的美好愿景。
更多推荐
所有评论(0)