2024 年 6 月 – 叶子的技术碎碎念

每周AI论文速递（240624-240628）

1,475

|

0

|

AI,每周AI论文速递

5079 字

|

20 分钟

LongRAG: Enhancing Retrieval-Augmented Generation with Long-context LLMs LongRAG: 使用长上下文大语言模型增强检索增强生成在传统的检索增强生成 (RAG) 框架中，基本的检索单元通常都很短。常见的检索器如 DPR 通常处理100字的 Wikipedia 段落。这种设计…

论文阅读

每周AI论文速递（240617-240621）

1,568

|

0

|

AI,每周AI论文速递

6004 字

|

24 分钟

XLand-100B: A Large-Scale Multi-Task Dataset for In-Context Reinforcement Learning XLand-100B: 一个大规模多任务数据集用于上下文强化学习在大规模语言模型和计算机视觉模型中，上下文学习范式取得了巨大成功，最近基于上下文的强化学习领域也迅速崛起。然而，由于缺…

论文阅读

每周AI论文速递（240610-240614）

1,123

|

0

|

AI,每周AI论文速递

5370 字

|

21 分钟

Mixture-of-Agents Enhances Large Language Model Capabilities Mixture-of-Agents 增强大语言模型能力最近在大语言模型 (LLMs) 方面的进展显示了其在自然语言理解和生成任务中的显著能力。随着LLMs数量的增加，如何利用多个LLMs的集体智慧成为一个令人期待的研究方向。为…

论文阅读

每周AI论文速递（240603-240607）

440

|

0

|

AI,每周AI论文速递

3876 字

|

15 分钟

Transformers are SSMs: Generalized Models and Efficient Algorithms Through Structured State Space Duality Transformer 是广义模型与高效算法：通过结构化状态空间对偶实现虽然 Transformer 是深度学习在语言建模成功的主要架构…

论文阅读

每周AI论文速递（240527-240531）

303

|

0

|

AI,每周AI论文速递

2924 字

|

12 分钟

Meteor: Mamba-based Traversal of Rationale for Large Language and Vision Models Meteor: 基于 Mamba 的大型语言和视觉模型的推理遍历大型语言和视觉模型 (LLVMs) 的快速发展得益于视觉指令调优的进步。最近，开源的 LLVMs 整理了高质量的视觉指令调优…

论文阅读

月度归档： 2024 年 6 月