Understanding Deeplearning归档 - 第2页共3页

理解深度学习：第十一章残差网络

103

|

0

|

AI,Understanding Deeplearning

11890 字

|

46 分钟

上一章节阐述了随着卷积网络从八层（AlexNet）增加到十八层（VGG）而带来的图像分类性能的显著提升。这一发现激发了对更深层网络的探索。然而，随着层数的继续增加，网络性能反而开始下降。本章将介绍残差块的概念。在残差网络中，每一层不是直接对输入进行转换，而是计算一个加性的变更，即残差，以此修改当前的数据表示。这种设计使得我们能够训练更深的网络，但…

人工智能深度学习论文阅读

理解深度学习：第十章卷积网络

102

|

0

|

AI,Understanding Deeplearning

11961 字

|

47 分钟

第 2 至 9 章详细介绍了深度神经网络在监督学习中的应用流程。然而，这部分内容仅涉及了具有单一路径从输入到输出的全连接网络。第 10 至 13 章则转向介绍更为专业化的网络构件，这些构件特征为更稀疏的连接、权重共享以及并行的处理途径。本章着重讲述了卷积层，它主要被用于图像数据的处理。图像的三个特性指出了专门模型架构的必要性。首先，图像是高维的，…

人工智能深度学习

理解深度学习：第九章正则化

122

|

0

|

AI,Understanding Deeplearning

11968 字

|

47 分钟

第 8 章描述了如何测量模型的性能，并指出了训练数据与测试数据之间可能存在的显著性能差异。这种差异可能的原因包括：（一）模型只描述了训练数据的统计特征，这些特征并不代表从输入到输出的真实映射关系（即过拟合现象）；（二）模型在没有训练样本的区域内行为不受约束，导致预测结果不理想。本章将讨论正则化技术，一系列旨在减少训练与测试性能之间泛化差距的方法…

人工智能深度学习

理解深度学习：第八章性能评估

103

|

0

|

AI,Understanding Deeplearning

10320 字

|

40 分钟

前文介绍了神经网络模型、损失函数和训练算法。本章将探讨如何评估训练好的模型性能。对于具备足够容量（即隐藏单元数量）的神经网络模型而言，它们在训练数据上的表现往往是完美无瑕的。但这并不保证模型能够同样出色地适用于新的测试数据。我们会发现，测试误差主要由三种不同的原因造成，它们各自的影响程度依赖于：（i）任务本身的固有不确定性，（ii）训练数据的量，…

人工智能深度学习

理解深度学习：第七章梯度和初始化

125

|

0

|

AI,Understanding Deeplearning

11672 字

|

49 分钟

第 6 章介绍了迭代优化算法，这是一类用于找到函数最小值的通用算法。在神经网络的背景下，它们用于寻找能够最小化损失函数的参数，使模型能够根据输入准确预测训练数据的输出。基本方法是随机选择一组初始参数，然后逐步进行微小调整，平均而言这些调整会降低损失。每一次的调整都是基于当前参数位置对损失函数梯度的计算结果。本章将讨论两个神经网络特有的问题。首先，…

人工智能深度学习

理解深度学习：第六章训练模型

109

|

0

|

AI,Understanding Deeplearning

8225 字

|

33 分钟

第 3 章和第 4 章详细讨论了浅层和深层神经网络，它们构成了分段线性函数族，函数的具体形式由各自的参数确定。第 5 章引入了损失概念 —— 一个反映网络预测与训练集真实值差异的单个数值。损失与网络参数有关，本章着重于探讨如何确定能使损失最小化的参数值。这个过程称为网络参数的学习，或更通俗地说，是模型的训练或拟合。该过程首先是选取一组初始参数值，…

人工智能深度学习

理解深度学习：第五章损失函数

227

|

0

|

AI,Understanding Deeplearning

8668 字

|

37 分钟

前三章分别介绍了线性回归、浅层神经网络和深度神经网络。这些都属于函数家族，能够实现从输入到输出的映射，其具体的函数取决于模型参数 $\phi$。在训练这些模型时，我们的目标是找到能够为特定任务提供最优输入输出映射的参数。本章将详细阐述“最优映射”的含义。要定义“最优映射”，首先需要一组训练数据集 ${x_i, y_i}$，即输入和输出的配对。损失…

人工智能深度学习

理解深度学习：第四章深度神经网络

159

|

0

|

AI,Understanding Deeplearning

7767 字

|

32 分钟

前面一章我们讨论了只有一个隐藏层的浅层神经网络。本章，我们将转向深度神经网络，这种网络拥有多个隐藏层。无论是浅层还是深层网络，当使用 ReLU (Rectified Linear Unit) 激活函数时，它们都能实现从输入到输出的分段直线式的变换。浅层神经网络的能力随着隐藏单元数量的增加而提升。实际上，如果隐藏单元足够多，这些网络甚至能够模拟高维…

LLM 人工智能深度学习

理解深度学习：第三章浅层神经网络

173

|

0

|

AI,Understanding Deeplearning

7757 字

|

32 分钟

第二章我们学习了使用一维线性回归的监督学习方法，但这种模型只能表示出输入与输出之间简单的线性关系。在这一章里，我们将接触到浅层神经网络。这种网络可以表达分段线性函数，并且能力强大到足以近似任何复杂度的多维输入和输出之间的关系。 3.1 神经网络示例浅层神经网络是带有参数 $\phi$ 的函数 $y = f[x, \phi]$，它将多变量输入 $x…

人工智能深度学习

理解深度学习: 第二章监督学习

169

|

0

|

AI,Understanding Deeplearning

5112 字

|

20 分钟

监督学习模型就是将一个或多个输入转化为一个或多个输出的方式。比如，我们可以将某部二手丰田普锐斯的车龄和行驶里程作为输入，预估的车辆价格则是输出。这个模型其实只是个数学公式；当我们把输入放入这个公式进行计算，我们得到的结果就是所谓的“推理”。这个公式还包含一些参数。改变参数值会改变计算的结果；这个公式其实描述了输入和输出之间所有可能关系的“家族”，…

人工智能深度学习

分类： Understanding Deeplearning