一文彻底搞懂大模型 - 人工神经网络与贝叶斯网络

*。每一层都包含多个神经元（或称为节点），这些神经元通过带权重的连接相互连接。**

Python_金钱豹

2360人浏览 · 2024-09-20 20:07:11

Python_金钱豹 · 2024-09-20 20:07:11 发布

ANN History

大模型，特别是那些拥有数十亿甚至更多参数的深度学习模型，往往是以人工神经网络为基础的。这些模型通过堆叠多个隐藏层、增加神经元数量和使用复杂的非线性激活函数，来构建能够处理复杂任务（如自然语言处理、图像识别等）的深度神经网络。

大语言模型

一、大模型与人工神经网络的关系

什么是人工神经网络（ANN）？人工神经网络（ANN）是一种模仿生物神经网络结构和功能的计算模型。它由多个层组成，包括输入层、隐藏层（可能有多层）和输出层**。每一层都包含多个神经元（或称为节点），这些神经元通过带权重的连接相互连接。**

ANN

输入层接收外部数据，隐藏层对数据进行处理，输出层则产生最终的输出。神经元的激活通常通过一个非线性函数（如sigmoid、ReLU等）来实现，这使得网络能够学习复杂的非线性关系。

ANN

**大模型与人工神经网络的关系：LLM的核心是ANN（人工神经网络），基于人工神经网络构建更大规模和复杂度更高的深度学习模型。

PLM（预训练模型）：预训练语言模型通常使用互联网上的海量文本数据作为训练语料，这些语料库可能包含数十亿甚至数千亿个单词。这些模型通过在大量的未标注文本数据上进行学习，掌握了语言的共性和规律，进而能够应用于各种NLP下游任务。
数据 + 算力：算力作基础，数据为驱动；无监督预训练（Pre-training），有监督微调（Fine-tuning）。
权重w和偏置b：模型参数包括每一层的权重(weight)和偏置项(bias)。这些参数在训练过程中通过反向传播算法进行调整，以最小化损失函数。

LLM 》DL 》ANN

二、人工神经网络与贝叶斯网络的关系

什么是贝叶斯网络（BN）？贝叶斯网络（Bayesian Network，简称BN）是一种基于概率推理的图形模型，用于表示变量之间的依赖关系。它由一个有向无环图（Directed Acyclic Graph，DAG）和条件概率表（Conditional Probability Table，CPT）组成。

Bayesian Network

有向无环图（DAG）：用于表示变量之间的依赖关系。图中的节点代表变量，有向边（或称为弧）则表示变量之间的依赖关系。如果两个节点之间存在有向边，则意味着一个节点的状态会影响另一个节点的状态。
条件概率表（CPT）：与DAG中的每个节点相关联，用于描述节点与其父节点之间的概率关系。条件概率表详细列出了在给定父节点状态下，当前节点取各个可能值的概率。

Bayesian Network

人工神经网络与贝叶斯网络的关系：两者都是有向图模型，其中每个节点的取值或状态仅依赖于其直接前驱节点，即遵循马尔可夫假设。这种结构使得模型能够清晰地表示变量之间的依赖关系。

ANN vs Bayesian Network

有向图模型：一种使用有向图来表示变量之间关系的数学模型。在有向图中，节点代表变量，而有向边则代表变量之间的依赖关系。

Direction Graph

马尔可夫假设：一种简化模型复杂性的假设，它指出一个节点的状态（或取值）仅依赖于其直接前驱节点的状态（或取值），而与更前面的节点状态无关。

如何学习大模型 AI ？

由于新岗位的生产效率，要优于被取代岗位的生产效率，所以实际上整个社会的生产效率是提升的。

但是具体到个人，只能说是：

“最先掌握AI的人，将会比较晚掌握AI的人有竞争优势”。

这句话，放在计算机、互联网、移动互联网的开局时期，都是一样的道理。

我在一线互联网企业工作十余年里，指导过不少同行后辈。帮助很多人得到了学习和成长。

我意识到有很多经验和知识值得分享给大家，也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑，所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限，很多互联网行业朋友无法获得正确的资料得到学习提升，故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。

在这里插入图片描述