Transformer 网络解读
终于到序列模型课程最后一周的内容了,本篇博客依然是基于Andrew Ng的深度学习专项课程的序列模型来编写的,本篇内容不会很多,主要就是Transformer网络相关的知识点,Transformer网络是一种基于注意力机制的神经网络架构,被广泛应用于自然语言处理领域,尤其是机器翻译任务中。本文将详细介绍Transformer网络的关键概念和工作原理…
揭秘序列到序列模型:从机器翻译到语音识别
Sequence to Sequence Model是NLP领域非常核心的模型,这类模型使用编码器-解码器的结构,可以实现输入和输出不相同长度序列之间的变换。本篇博客将全面介绍序列到序列模型的基础概念、工作机制,尤其是其中注意力机制的技术更是当前大模型技术的根基之一,最后也会捎带介绍一些序列模型在语音处理的应用。本文也是基于Andrew Ng教授D…
浅谈 Word Embeddings
词嵌入(Word Embeddings)是自然语言处理(NLP)和深度学习中的一个核心概念。它通过将词汇映射到连续的向量空间,为计算机提供了一种直观和强大的方式来理解语言。本篇博客基于Andrew Ng教授的Deep Learning 专项课程中序列模型这门课第二周的内容,那我们开始吧! Word Embeddings 介绍 词嵌入的概念 词嵌入是…
循环神经网络介绍
机器学习策略详解
循环神经网络(Recurrent Neural Network, RNN)是一种能够处理序列数据的神经网络,在自然语言处理、语音识别、手写识别等领域发挥着重要作用。相比普通的前馈神经网络,RNN可以捕捉时间序列数据中的时序信息和长距离依赖关系。本篇博客将详细介绍RNN的工作原理、常见模型如门控循环单元(GRU)、长短期记忆(LSTM)以及如何应用于…
机器学习已然成为当今科技发展的重要驱动力之一。如何建立一个系统的机器学习策略,使机器学习项目能够高效推进并取得预期成果,是每一位机器学习从业者都需要思考的问题。每个机器学习项目的核心都涉及到目标设定,模型选择,数据处理和结果评估等多个关键步骤。在这篇博客中,我们将深入讨论这些步骤,特别是关于如何有效地设置机器学习目标,评估模型性能,并进行优化的具体…
超参数调优、批量归一化以及深度学习框架
本篇博客的内容主要是超参数调优,批量归一化以及常见的深度学习框架,也是深度学习专项课程第二门课的最后一周课程内容,Let’s Go! 超参数调优 在深度学习中,超参数调优是一个非常关键的过程。合适的超参数设置将直接影响深度学习模型的性能。本节将详细探讨深度学习中超参数调优的重要性、主要影响模型性能的超参数以及超参数选择的方法与策略。 超参数调优的重…
深度学习的优化算法
本周的内容主要是一些优化算法的知识点,这些优化算法可以帮助我们更好更快速的训练一个深度学习模型,Let’s Go! 1. 优化算法的重要性 优化算法在机器学习和深度学习领域起着关键的作用,特别是在训练深度神经网络时。它们是用于最小化(或最大化)函数的一种策略或者说是方法。在深度学习中,这个函数通常是损失函数,优化的目标是找到使得这个函数值最小的参数…
深度学习实践基础
在深度学习的学习过程中,我们会接触到大量的理论知识,如梯度下降,反向传播,损失函数等。然而,真正理解并应用这些理论知识,才能使我们在解决实际问题时如鱼得水,运用自如。本篇博客根据吴恩达教授的Deep Learning Specialization中的Course2第一周的内容,从深度学习的实践角度出发,深入解读一些至关重要的概念和方法,例如如何划分…
深度学习与神经网络入门
随着ChatGPT的爆火以及最近各种爆发的大模型竞争,人工智能行业逐渐走入了大众的眼球。作为喜欢折腾各种技术的爱好者,自然也希望能了解一些其中的原理。但想要更好的了解AI领域的知识,我想从深度学习开始是不为过的,因为早前已经学习过吴恩达教授的Machine Learning课程,因此本次也是通过他的另一门专项课程,Deep Learning Specialization来学习深度学习。本文主要以第一门课为参考,尝试通俗的带大家入门深度学习。