人工智能归档 - 第4页共7页 - 叶子的技术碎碎念

【转】局部余弦相似度大，全局余弦相似度一定也大吗？

172

|

0

|

AI

1815 字

|

8 分钟

本文转自苏神的博客在分析模型的参数时，有些情况下我们会将模型的所有参数当成一个整体的向量，有些情况下我们则会将不同的参数拆开来看。比如，一个7B大小的LLAMA模型所拥有的70亿参数量，有时候我们会将它当成“一个70亿维的向量”，有时候我们会按照模型的实现方式将它看成“数百个不同维度的向量”，最极端的情况下，我们也会将它看成是“七十亿个1维向量”…

人工智能数学深度学习

论文分享：Chain of LoRA

265

|

0

|

论文分享

5234 字

|

20 分钟

Metadata Title: Chain of LoRA: Efficient Fine-tuning of Language Models via Residual Learning Authors: [[Wenhan Xia]], [[Chengwei Qin]], [[Elad Hazan]] Date: [[2024-01-08]] Ta…

LLM 人工智能深度学习

理解深度学习：第三章浅层神经网络

173

|

0

|

AI,Understanding Deeplearning

7757 字

|

32 分钟

第二章我们学习了使用一维线性回归的监督学习方法，但这种模型只能表示出输入与输出之间简单的线性关系。在这一章里，我们将接触到浅层神经网络。这种网络可以表达分段线性函数，并且能力强大到足以近似任何复杂度的多维输入和输出之间的关系。 3.1 神经网络示例浅层神经网络是带有参数 $\phi$ 的函数 $y = f[x, \phi]$，它将多变量输入 $x…

人工智能深度学习

理解深度学习: 第二章监督学习

168

|

0

|

AI,Understanding Deeplearning

5112 字

|

20 分钟

监督学习模型就是将一个或多个输入转化为一个或多个输出的方式。比如，我们可以将某部二手丰田普锐斯的车龄和行驶里程作为输入，预估的车辆价格则是输出。这个模型其实只是个数学公式；当我们把输入放入这个公式进行计算，我们得到的结果就是所谓的“推理”。这个公式还包含一些参数。改变参数值会改变计算的结果；这个公式其实描述了输入和输出之间所有可能关系的“家族”，…

人工智能深度学习

理解深度学习: 第一章介绍

193

|

0

|

AI,Understanding Deeplearning

9829 字

|

37 分钟

原书地址：https://udlbook.github.io/udlbook/ 人工智能（AI）旨在打造模仿智能行为的系统。它覆盖了众多方法，涵盖了基于逻辑、搜索和概率推理的技术。机器学习是 AI 的一个分支，它通过对观测数据进行数学模型拟合来学习决策制定。这个领域近年来迅猛发展，现在几乎（虽不完全准确）与 AI 同义。深度神经网络是一类机器学习…

人工智能深度学习

OpenAI官方给出的Prompt工程建议

150

|

0

|

AI

5904 字

|

32 分钟

OpenAI在自己的官方网站上之前发布了关于如何进行提示工程的指导文档，这份文档可以帮助我们更好的对AI发起提问，从而得到更有效的答案。以下是针对原文的翻译，主要使用ChatGPT4进行机翻，人工也会做一些微调，主要排版做了一点调整，此外有一些翻译不准确的地方请多见谅，但也希望大家看看原文，一起学习。本文主要提供的六个策略我这里直接列出来，方便大家…

LLM 人工智能

复习一下时间检验奖：Word2Vec

128

|

0

|

AI

3780 字

|

16 分钟

不久前，NeurIPS 官方公布了 2023 年度的获奖论文，其中时间检验奖颁发给了10年前的论文「Distributed Representations of Words and Phrases and their Compositionality」。这篇论文可以看做是Word2Vec的第二篇论文。第一篇是「Efficient Estimatio…

NLP 人工智能

又一个提升大模型反馈效果的思路：黑盒Prompt优化

92

|

0

|

AI

2712 字

|

11 分钟

长期潜水在各个LLM技术群的小透明今天看到了智谱AI和清华团队又整了一篇有意思的论文，叫做Black-Box Prompt Optimization: Aligning Large Language Models without Model Training 主要是解决大模型的"对齐问题"。啥叫对齐问题呢？指的是确保人工智能（…

LLM RAG 人工智能

LLM也要反思自己了？Self-RAG框架介绍

88

|

0

|

AI

4215 字

|

16 分钟

今天又看了一篇好玩的关于RAG玩法的论文，叫做 SELF-RAG: LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION 。核心思想很有意思，让LLM自己对自己说的话反思反思（脑海里不由得就想起前不久某知名主播说的让我们反思的话了）。接下来我就大致介绍一下这个方法…

LLM RAG 人工智能

检索增强生成 (RAG)：是什么、为什么、怎么做？

86

|

0

|

AI

3340 字

|

13 分钟

今天看了一篇来自于llmstack的创始人及CTO写的关于RAG的文章，正好最近在研究怎么玩本地知识库来着，感觉这篇文章很有帮助，这里翻译一下分享给大家，不过有时间的话更建议大家去看原文。什么是检索增强生成？如果你一直在向量存储或其他数据库中查找数据，并在生成输出时将相关信息作为上下文传递给 LLM，那么你已经在进行检索增强生成了。检索增强生成…

LLM 人工智能

标签： 人工智能

标签：人工智能