从函数到神经网络：AI大模型入门到精通（超详细教程）程序员必学，一篇搞定所有知识点！

DeepSeek最近火出圈了，连我姥姥都知道了。既不想一直看那些几分钟的快餐视频，因为不论看多少，很多问题还是搞不明白但又不想花太多时间从头开始学，因为整个AI的知识体系实在是太庞大了所以，我决定做一个小系列，把DeepSeek以及背后的机器学习、深度学习知识从头讲一遍。做到既快又慢，既深入又肤浅，既有趣又严肃。现在，请你清空大脑，忘掉所有曾经熟悉或不熟悉的概念。在你脑海中只留一个词——函数。这就

努力的光头强

657人浏览 · 2025-12-02 11:50:20

努力的光头强 · 2025-12-02 11:50:20 发布

文章以"函数"为起点，介绍了AI从符号主义到连接主义的演变。早期试图用精确函数描述世界，但面临困境；现代AI则通过"猜"和逼近寻找近似解，引入激活函数实现从线性到非线性的转变，最终形成神经网络结构。神经网络的本质是复杂函数的图形化表达，核心是根据已知数据计算最优参数，构成了现代AI的基础。

🎯 写在前面

DeepSeek最近火出圈了，连我姥姥都知道了。但很多朋友可能陷入了这样的两难困境：

既不想一直看那些几分钟的快餐视频，因为不论看多少，很多问题还是搞不明白
但又不想花太多时间从头开始学，因为整个AI的知识体系实在是太庞大了

所以，我决定做一个小系列，把DeepSeek以及背后的机器学习、深度学习知识从头讲一遍。做到既快又慢，既深入又肤浅，既有趣又严肃。

现在，请你清空大脑，忘掉所有曾经熟悉或不熟悉的概念。在你脑海中只留一个词——函数。这就是我们这趟AI之旅的起点。

📐 第一站：函数描述世界

相信这个世界上的所有逻辑或知识，都可以用一个函数来表示。

Functions Describe The World

我们只需要将现实世界抽象为符号，再设置好一些运算规则（也就是函数），最后算出结果，反过来解释现实世界就可以了。

举几个例子：

输入直角三角形的两个边长，根据勾股定理就可以得到斜边的边长
输入物体的质量和加速度，根据牛顿第二定律就可以得到物体施加的力

这就是人工智能早期的思路——符号主义。

🚫 符号主义的困境

但这条路走到头了。很多问题，人类实在是想不出怎么写成一个明确的函数。

从上帝视角看，就是人类还是太菜了。

比如一个简简单单的"识别一张图片是否是猫"，对人类来说可能简单到爆炸，但要让计算机运行一段程序来识别，一下子就变成了史诗级难题。就连有着明确语法规则和词典的翻译函数，尚且没有办法做到足够丝滑，那更别说复杂多变的人类智能了。

🎲 第二站：人类的"摆烂"策略

既然不知道这个函数长什么样，怎么办呢？那就别硬找了，换个思路。

我们从一个简单的例子入手。比如我们知道一些X和Y的值，想找到Y和X的函数关系。你有什么办法？

有人说：“这不就是Y=2X吗？傻子都能看出来！”

没错，这就是符号主义的思想，觉得世间万物都能找到背后明确的规律。

🔮 "猜"的智慧

但假如我们一开始没有找到这个规律呢？那就用人类有史以来最具智慧的办法——猜。

具体做法：

把X、Y放到坐标轴上
先随便猜一下，比如函数关系是Y=X（W=1，B=0）
然后一点点调整W和B，使得这条直线越来越贴近真实数据
最后发现完全吻合了，行，就它了！

有时候可能很难找到完全吻合的函数，怎么办？没事，大差不差，能近似就行了，别要求那么多。

💡 连接主义的诞生

这就是现代人工智能的思路：猜和简化问题。

说白了，实际上就是人类摆烂了，承认自己太菜了，找不到精确的函数了。那就找一个从结果上看大差不差的函数，然后连蒙带猜，逐渐逼近真实答案就好了。

这种区别于早期人工智能符号主义的新思想，叫做连接主义。

有人说：“这连蒙带猜的靠谱吗？一看就不是什么正路子。”

但就是这样靠连蒙带猜的办法，我们居然可以用很少的参数，轻松实现手写数字识别这样的任务。正是这种方式在很多地方证明了它的有效性，人们才开始重视起来。

🌀 第三站：从线性到非线性

刚刚举的例子都比较简单，只用直线方程就可以表示了。但假如数据稍稍变化一下，你会发现不论怎么调整W和B，好像都无法接近真实的数据。

这个时候就需要让这条直线弯一弯了。换句话说，我们需要从线性函数进化到非线性函数。

⚡ 激活函数：让直线"活"起来

怎么把原本线性的函数变成非线性的呢？很简单，在这个函数最外层，再套一个非线性的运算就可以了。比如：

平方
sin函数
e的幂次

这就是激活函数。它的目的，就是把原本死气沉沉的线性关系给盘活了，变成了变化能力更强的非线性关系。

听到"非线性关系"千万不要害怕，常用的激活函数都简单到爆炸，但就是能起到很好的效果。

🔄 无限套娃的力量

实际上可能有很多输入，所以每一个X都要对应一个W。有的时候只套一层激活函数，还是没有办法达到很好的效果——这个曲线弯得还不够灵活。

怎么办？很简单，我们把刚刚这一大坨当做一个整体，在此基础之上再进行一次线性变换，然后再套上一个激活函数。这样就可以无限套娃下去了。

通过这样的方式，我们就可以构造出非常复杂的非线性关系，而且理论上可以逼近任意的连续函数。

🧠 第四站：神经网络的诞生

这样写下去实在是太让人头大了，普通人看个两层，估计脑子就炸了。所以我们得换一种更傻瓜、更直观的形式。

🎨 从函数到图形

我们把"线性变换+激活函数"画成这样：

左边是输入层，有输入X
右边是输出层，有输出Y
把每一个小圈圈叫做一个神经元

⚠️ 注意：不建议你把它跟生物的神经元类比，因为它们两个其实一毛钱关系都没有。看似很形象，但实际上反而会影响理解。

🌐 神经网络的结构

两个圈圈一连，就表示一个函数关系。那么：

输入可能有多个 → 输入层变成多个神经元
可以不断套娃 → 水平方向扩展层数
中间这一层看不到 → 叫做隐藏层

整个这一大坨神经元互相连接形成的网络结构，就叫做神经网络。

🚀 前向传播

让我们看一下函数和神经网络的对应关系：

两个输入变量X1、X2构成输入层
进行一次线性变换+激活函数 → 得到隐藏层A
把A当做整体，再进行一次线性变换+激活函数 → 得到输出Y

从神经网络的图来看，就像是一个信号从左到右传播过去。这个过程就叫做神经网络的前向传播。但实际上，就是一点点分步骤把一个函数的值计算出来了而已。

神经网络的每一层神经元都可以无限增加，同时隐藏层的层数也可以无限增加，进而就可以构成一个非常复杂的非线性函数了。

虽然这个函数可能非常复杂，但我们的目标却非常简单和明确：根据已知的一组X和Y的值，猜出所有这里的W和B都是多少。

🎊 总结回顾

让我们回顾一下这趟旅程：

函数是起点 → 相信函数可以描述世界
符号主义的困境 → 很多问题找不到精确函数
连接主义的智慧 → 承认人类太菜，转而寻找近似解
从线性到非线性 → 引入激活函数让函数"弯"起来
神经网络的诞生 → 用图形化方式表达复杂函数

恭喜你！从函数到神经网络的这条路已经被你搞懂了。剩下的所有乱七八糟的知识，都仅仅是为了算出这个W和B而已。

那如何算出W和B呢？欲知后事如何，且听下回分解。😉

如何学习AI大模型？

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。【保证100%免费】🆓

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

对于0基础小白入门：

如果你是零基础小白，想快速入门大模型是可以考虑的。

一方面是学习时间相对较短，学习内容更全面更集中。
二方面是可以根据这些资料规划好学习计划和方向。

👉1.大模型入门学习思维导图👈

要学习一门新的技术，作为新手一定要先学习成长路线图，方向不对，努力白费。

对于从来没有接触过AI大模型的同学，我们帮你准备了详细的学习成长路线图&学习规划。可以说是最科学最系统的学习路线，大家跟着这个大的方向学习准没问题。（全套教程文末领取哈）
在这里插入图片描述

👉2.AGI大模型配套视频👈

很多朋友都不喜欢晦涩的文字，我也为大家准备了视频教程，每个章节都是当前板块的精华浓缩。
在这里插入图片描述

在这里插入图片描述

👉3.大模型实际应用报告合集👈

这套包含640份报告的合集，涵盖了AI大模型的理论研究、技术实现、行业应用等多个方面。无论您是科研人员、工程师，还是对AI大模型感兴趣的爱好者，这套报告合集都将为您提供宝贵的信息和启示。（全套教程文末领取哈）

在这里插入图片描述

👉4.大模型实战项目&项目源码👈

光学理论是没用的，要学会跟着一起做，要动手实操，才能将自己的所学运用到实际当中去，这时候可以搞点实战项目来学习。（全套教程文末领取哈）
在这里插入图片描述

👉5.大模型经典学习电子书👈

随着人工智能技术的飞速发展，AI大模型已经成为了当今科技领域的一大热点。这些大型预训练模型，如GPT-3、BERT、XLNet等，以其强大的语言理解和生成能力，正在改变我们对人工智能的认识。那以下这些PDF籍就是非常不错的学习资源。（全套教程文末领取哈）
在这里插入图片描述

👉6.大模型面试题&答案👈

截至目前大模型已经超过200个，在大模型纵横的时代，不仅大模型技术越来越卷，就连大模型相关的岗位和面试也开始越来越卷了。为了让大家更容易上车大模型算法赛道，我总结了大模型常考的面试题。（全套教程文末领取哈）
在这里插入图片描述

为什么分享这些资料?

只要你是真心想学AI大模型，我这份资料就可以无偿分享给你学习，我国在这方面的相关人才比较紧缺，大模型行业确实也需要更多的有志之士加入进来，我也真心希望帮助大家学好这门技术，如果日后有什么学习上的问题，欢迎找我交流，有技术上面的问题，我是很愿意去帮助大家的！

这些资料真的有用吗?

这份资料由我和鲁为民博士共同整理，鲁为民博士先后获得了北京清华大学学士和美国加州理工学院博士学位，在包括IEEE Transactions等学术期刊和诸多国际会议上发表了超过50篇学术论文、取得了多项美国和中国发明专利，同时还斩获了吴文俊人工智能科学技术奖。目前我正在和鲁博士共同进行人工智能的研究。

资料内容涵盖了从入门到进阶的各类视频教程和实战项目，无论你是小白还是有些技术基础的，这份资料都绝对能帮助你提升薪资待遇，转行大模型岗位。

在这里插入图片描述

CSDN粉丝独家福利

这份完整版的 AI 大模型学习资料已经上传CSDN，朋友们如果需要可以扫描下方二维码&点击下方CSDN官方认证链接免费领取 【保证100%免费】

读者福利： 👉👉CSDN大礼包：《最新AI大模型学习资源包》免费分享 👈👈

（👆👆👆安全链接，放心点击）

腾讯云开发者社区

腾讯云面向开发者汇聚海量精品云计算使用和开发经验，营造开放的云计算技术生态圈。

更多推荐

终极指南：Flink SQL连接器版本管理从混乱到有序的升级之路

Apache Flink作为流处理领域的佼佼者，其SQL连接器的版本管理一直是开发者面临的核心挑战。本文将系统讲解Flink SQL连接器版本管理的最佳实践，帮助你轻松应对版本兼容性问题，实现从混乱到有序的升级之旅。## 连接器版本管理的常见痛点 😫在Flink应用开发中，连接器版本管理常常让开发者头疼不已。不同版本的连接器可能导致各种兼容性问题，例如API变更、功能差异甚至运行时错误。

腾讯云开发者社区

Elasticsearch复杂数据类型终极指南：从入门到精通

Elasticsearch作为功能强大的搜索引擎，支持多种复杂数据类型，让开发者能够灵活处理各种结构化和非结构化数据。本文将带你全面了解Elasticsearch中的复杂数据类型，从基础概念到实际应用，助你轻松掌握数据建模的核心技巧。## 内部对象：构建层级化数据结构在Elasticsearch中，对象类型（Object）是最基础的复杂数据类型之一，用于表示具有嵌套关系的数据。例如，我们可

腾讯云开发者社区

如何快速搭建Neon无服务器PostgreSQL：面向初学者的完整指南

Neon是一款革命性的无服务器PostgreSQL解决方案，它通过分离存储和计算层，实现了自动扩缩容、类代码式数据库分支以及零级扩展能力。本指南将帮助你从零开始搭建Neon开发环境，体验这款创新数据库的强大功能。## 准备工作：环境要求与依赖项在开始搭建Neon环境前，请确保你的系统满足以下要求：- Linux操作系统（推荐Ubuntu 20.04+或Debian 11+）- Git