每周AI论文速递 – 第 5 页 – 叶子的技术碎碎念

每周AI论文速递（240617-240621）

1,563

|

0

|

AI,每周AI论文速递

6004 字

|

24 分钟

XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning XLand-100B: 一个大规模多任务数据集用于上下文强化学习在大规模语言模型和计算机视觉模型中，上下文学习范式取得了巨大成功，最近基于上下文的强化学习领域也迅速崛起。然而，由于缺…

论文阅读

每周AI论文速递（240610-240614）

1,113

|

0

|

AI,每周AI论文速递

5370 字

|

21 分钟

Mixture-of-Agents Enhances Large Language Model Capabilities Mixture-of-Agents 增强大语言模型能力最近在大语言模型 (LLMs) 方面的进展显示了其在自然语言理解和生成任务中的显著能力。随着LLMs数量的增加，如何利用多个LLMs的集体智慧成为一个令人期待的研究方向。为…

论文阅读

每周AI论文速递（240603-240607）

430

|

0

|

AI,每周AI论文速递

3876 字

|

15 分钟

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality Transformer 是广义模型与高效算法：通过结构化状态空间对偶实现虽然 Transformer 是深度学习在语言建模成功的主要架构…

论文阅读

每周AI论文速递（240527-240531）

298

|

0

|

AI,每周AI论文速递

2924 字

|

12 分钟

Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models Meteor: 基于 Mamba 的大型语言和视觉模型的推理遍历大型语言和视觉模型 (LLVMs) 的快速发展得益于视觉指令调优的进步。最近，开源的 LLVMs 整理了高质量的视觉指令调优…

论文阅读

每周AI论文速递（240429-240503）

726

|

0

|

AI,每周AI论文速递

3977 字

|

16 分钟

PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning PLLaVA：图像至视频无参数扩展的 LLaVA 模型，用于视频详细描述视觉-语言预训练显著提升了各种图像-语言应用的性能。然而，视频相关任务的预训练过程需巨大的计算和数…

人工智能深度学习论文阅读

每周AI论文速递（240422-240426）

883

|

0

|

AI,未分类,每周AI论文速递

6184 字

|

24 分钟

AutoCrawler: A Progressive Understanding Web Agent for Web Crawler Generation AutoCrawler: 一个为 Web 爬虫生成的渐进式理解 Web 智能体 Web 自动化是一种重要技术，它通过自动执行常见网页动作来处理复杂的网页任务，从而提高操作效率并减少手动干预。传统…

每周AI论文速递（240415-240419）

1,276

|

0

|

AI,每周AI论文速递

3170 字

|

13 分钟

Pre-training Small Base LMs with Fewer Tokens 使用更少的 Token 对小型基础 LMs 进行预训练我们研究了一种简单方法来开发一个小型基础语言模型 (LM)，从一个现有的大型基础 LM 开始：首先从较大的 LM 继承一些 Transformer 块，然后在这个较小的模型上使用一个非常小的子集 (0.…

人工智能深度学习论文阅读

每周AI论文速递（20240408-20240412）

740

|

0

|

AI,每周AI论文速递

6958 字

|

27 分钟

Direct Nash Optimization: Teaching Language Models to Self-Improve with General Preferences 直接纳什优化：教授语言模型通过通用偏好自我提升本文研究如何利用强大神谕的偏好反馈，对大语言模型 (大语言模型) 进行后训练，以帮助模型迭代地自我改进。传统的大语言模…

每周AI论文速递（240401-240405）

1,660

|

0

|

AI,每周AI论文速递

5596 字

|

22 分钟

Jamba: A Hybrid Transformer-Mamba Language Model Jamba：混合 Transformer-Mamba 语言模型我们推出了 Jamba，这是一种基于创新的混合 Transformer-Mamba 混合专家 (MoE) 架构的大型基础语言模型。Jamba 特别地将 Transformer 和 Mamb…

人工智能论文阅读

每周AI论文速递（240325-240329）

1,916

|

0

|

AI,每周AI论文速递

3314 字

|

13 分钟

Can large language models explore in-context? 大语言模型能进行上下文探索吗？我们研究了当代大语言模型（LLMs）在多大程度上能够进行探索，这在强化学习和决策制定中是一个核心能力。我们专注于现有LLMs的本质性能，不借助训练干预。我们在简单的多臂赌博机（multi-armed bandit）环境中部署L…

人工智能深度学习论文阅读

分类： 每周AI论文速递

分类：每周AI论文速递