Understanding Deeplearning – 叶子的技术碎碎念

理解深度学习中文版PDF发布

83

|

2

|

AI,Understanding Deeplearning

341 字

|

2 分钟

之前翻译的Understanding DeepLearning 这本书最近花了些时间用latex重写了一遍，因为原书有很多图片，用md实在太不方便，之前也答应过粉丝的留言要提供pdf版本的，因为md直接导出的pdf太丑了，就一直拖到了现在。项目地址在： https://github.com/careywyr/UnderstandingDeepLe…

LLM

理解深度学习：第二十一章深度学习与伦理

212

|

0

|

AI,Understanding Deeplearning

12533 字

|

48 分钟

本章由 Travis LaCroix 和 Simon J.D. Prince 编写。人工智能 (AI) 正在成为改变社会的力量，这种改变可能带来好处也可能带来弊端。这些技术在促进社会福祉方面拥有巨大的潜力（Taddeo & Floridi, 2018; Tomašev et al., 2020），尤其体现在医疗保健（Rajpurkar …

人工智能深度学习

理解深度学习：第二十章为什么深度学习有效？

178

|

0

|

AI,Understanding Deeplearning

12669 字

|

49 分钟

本章不同于前面的章节。它不展示已确立的结果，而是探讨了深度学习为何和如何取得显著成功的问题，这些问题在教科书里很少被提及。然而，需明白（尽管本书的标题所示），我们对深度学习的理解还很有限。我们发现，深度网络之所以易于训练及其泛化能力强，都是令人惊异的现象。接下来，我们将逐一分析这些议题。我们将探讨影响训练成功的各种因素，并讨论深度网络损失函数的已…

人工智能深度学习

理解深度学习：第十九章强化学习

387

|

0

|

AI,Understanding Deeplearning

18013 字

|

1.2 小时

强化学习（RL）是一个序贯决策框架，智能体在此框架中通过在环境内执行动作来学习，旨在最大化获得的奖励。例如，RL 算法可以控制视频游戏中角色（智能体）的移动（动作），以最大化分数（奖励）。在机器人领域，RL 算法能控制机器人（智能体）在现实世界（环境）内的活动，执行特定任务以赚取奖励。在金融领域，RL 算法或许会控制一个虚拟交易员（智能体），在交易…

人工智能深度学习

理解深度学习：第十八章扩散模型

229

|

0

|

AI,Understanding Deeplearning

11799 字

|

52 分钟

第 15 章描述了生成对抗模型（Generative Adversarial Models, GANs），这些模型可以生成逼真样本，但不为数据定义概率分布。第 16 章讨论了归一化流（Normalizing Flows），它们确立了特定的概率分布，但须对网络架构施加限制：每层都必须可逆，且其雅可比矩阵的行列式计算要简便。第 17 章介绍的变分自编码…

人工智能深度学习

理解深度学习：第十七章变分自编码器

146

|

0

|

AI,Understanding Deeplearning

10174 字

|

43 分钟

生成对抗网络 (Generative Adversarial Networks) 学习了一种机制，可以生成与训练数据 {x_i} 在统计上无法区分的样本。与此相对，像归一化流（normalizing flows）、变分自编码器 (Variational Autoencoders, VAEs) 这类的概率生成模型 (probabilistic gen…

人工智能深度学习

理解深度学习：第十六章标准化流

175

|

0

|

AI,Understanding Deeplearning

10926 字

|

46 分钟

第 15 章介绍了生成对抗网络（GANs）。这些生成模型通过深度网络处理潜在变量来生成新的样本。GANs 的训练原则是让样本与真实数据难以区分。然而，它们并没有定义在数据样本上的分布，因此不容易评估新样本属于同一数据集的概率。本章将讨论标准化流（Normalizing Flows）。这种方法通过深度网络将简单的分布转化为复杂的分布，从而学习概率模…

人工智能深度学习

理解深度学习：第十五章生成对抗网络

133

|

0

|

AI,Understanding Deeplearning

13713 字

|

55 分钟

生成对抗网络（GAN）是一种无监督学习模型，其目标是创造出与训练样本集难以区分的新样本。GAN 主要是用来生成新样本的一种机制，它并不建立模型数据的概率分布，因此无法判断一个新数据点是否属于同一分布。在 GAN 框架中，生成器网络通过将随机噪声映射到输出数据空间来生成样本。若鉴别器网络无法区分生成样本与真实样本，则可认为这些样本是合理的。若鉴别器…

人工智能深度学习

理解深度学习：第十四章无监督学习

146

|

0

|

AI,Understanding Deeplearning

3525 字

|

14 分钟

第 2 章至第 9 章详细讲解了监督学习的流程。在这些章节中，我们定义了模型，这些模型能将观测数据 x 映射到输出值 y，并引入了损失函数来衡量这种映射对于训练数据集 ${x_i , y_i }$ 的准确性。随后，我们讨论了如何对这些模型进行拟合及评估其性能。第 10 章到第 13 章则引入了采用参数共享和支持并行计算路径的更为复杂的模型架构。无…

人工智能深度学习

理解深度学习：第十三章图神经网络

118

|

0

|

AI,Understanding Deeplearning

15832 字

|

1 小时

第10章介绍了卷积网络，它擅长处理规则的数据阵列（如图像）。第12章则讲述了 Transformer，它擅长处理长度可变的序列（如文本）。本章将讨论图神经网络。正如其名，这些神经网络架构专门用于处理图结构（即，由边连接的节点集）。在处理图数据时，面临三大挑战。首先，图的拓扑结构多变，要设计出既有强大表达能力又能适应这种变化的网络十分困难。其次，图…

人工智能深度学习

分类： Understanding Deeplearning