人工智能 – 叶子的技术碎碎念

每周AI论文速递（241111-241115）

272

|

0

|

AI,每周AI论文速递

3332 字

|

13 分钟

LLM2CLIP: Powerful Language Model Unlock Richer Visual Representation LLM2CLIP: 强大的语言模型解锁更丰富的视觉表示 CLIP 是当今最重要的多模态基础模型之一。自然语言提供的丰富监督信号，作为人类知识的载体，塑造了一个强大的跨模态表示空间，这是 CLIP 能力的核心。然…

人工智能

每周AI论文速递（240429-240503）

702

|

0

|

AI,每周AI论文速递

3977 字

|

16 分钟

PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning PLLaVA：图像至视频无参数扩展的 LLaVA 模型，用于视频详细描述视觉-语言预训练显著提升了各种图像-语言应用的性能。然而，视频相关任务的预训练过程需巨大的计算和数…

人工智能深度学习论文阅读

论文解读：KAN: Kolmogorov–Arnold Networks

2,723

|

0

|

论文分享

9829 字

|

38 分钟

五一假期刚开始没两天的时候，刷到了一篇火遍国内外AI圈的论文，叫做 KAN: Kolmogorov–Arnold Networks , 尤其国内某些科技媒体铺天盖地的宣传更是让我提起了兴趣，在假期结束之前，抽个空读一下看看是怎么个事。读了之后发现，仅仅只是高数、线代和概率论这些数学知识是看不懂的，最好还需要了解一点数分方面的知识，反正我是借助了Ch…

LLM 人工智能深度学习论文阅读

每周AI论文速递（240415-240419）

1,249

|

0

|

AI,每周AI论文速递

3170 字

|

13 分钟

Pre-training Small Base LMs with Fewer Tokens 使用更少的 Token 对小型基础 LMs 进行预训练我们研究了一种简单方法来开发一个小型基础语言模型 (LM)，从一个现有的大型基础 LM 开始：首先从较大的 LM 继承一些 Transformer 块，然后在这个较小的模型上使用一个非常小的子集 (0.…

人工智能深度学习论文阅读

一文带你了解当前主流PEFT技术

1,730

|

0

|

AI,大模型微调实战

11427 字

|

45 分钟

随着LLaMA3的发布，大模型开源社区的战力又提升了一分，国内目前应该已经有不少大佬已经开始着手对LLaMA3进行研究或微调，对于微调技术，目前比较常见的就是Peft系列的技术，那么什么是PEFT，有哪些分类，为什么这么受大家欢迎呢？今天我们就好好聊聊这个话题。什么是PEFT？有哪些技术？ PEFT的全称叫做 Parameter-Efficie…

LLM 人工智能深度学习

问答AI模型训练前的必做功课：数据预处理

700

|

0

|

AI,大模型微调实战

4185 字

|

23 分钟

翻译完了UDL这本书之后放松了一个多礼拜没有更新文章了，主要最近也在学习一些微调上面的知识，平时晚上还需要跑跑代码看看视频啥的，因此也一直没太有空写文章，UDL的翻译整理成PDF的工作都没空整。（虽然实际最近也花了很长时间在打游戏(。・＿・。)）。又到周末了，再拖着不干点正事我也过意不去了，今天就写点关于最近学习的一些关于微调方面的东西好了，因为我…

LLM 人工智能深度学习

每周AI论文速递（240401-240405）

1,637

|

0

|

AI,每周AI论文速递

5596 字

|

22 分钟

Jamba: A Hybrid Transformer-Mamba Language Model Jamba：混合 Transformer-Mamba 语言模型我们推出了 Jamba，这是一种基于创新的混合 Transformer-Mamba 混合专家 (MoE) 架构的大型基础语言模型。Jamba 特别地将 Transformer 和 Mamb…

人工智能论文阅读

每周AI论文速递（240325-240329）

1,879

|

0

|

AI,每周AI论文速递

3314 字

|

13 分钟

Can large language models explore in-context? 大语言模型能进行上下文探索吗？我们研究了当代大语言模型（LLMs）在多大程度上能够进行探索，这在强化学习和决策制定中是一个核心能力。我们专注于现有LLMs的本质性能，不借助训练干预。我们在简单的多臂赌博机（multi-armed bandit）环境中部署L…

人工智能深度学习论文阅读

每周AI论文速递（240311-240315）

1,658

|

0

|

AI,每周AI论文速递

4717 字

|

19 分钟

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context Gemini 1.5：跨数百万Token实现多模态理解在本报告中，我们展示了 Gemini 系列最新的模型，Gemini 1.5 Pro，这是一个计算高效的多模态混合专家模型。它能…

人工智能深度学习

每周AI论文速递（240304-240308）

1,663

|

0

|

AI,每周AI论文速递

6586 字

|

25 分钟

VisionLLaMA: A Unified LLaMA Interface for Vision Tasks VisionLLaMA: 视觉任务的统一 LLaMA 接口大语言模型基于 Transformer 架构构建，主要处理文本输入。其中，LLaMA 是众多开源实现中的佼佼者。那么，相同的 Transformer 能否用于处理 2D 图像呢？…

人工智能深度学习论文阅读

标签： 人工智能

标签：人工智能