每周AI论文速递 – 第 6 页 – 叶子的技术碎碎念

每周AI论文速递（240318-240322）

769

|

0

|

AI,每周AI论文速递

5210 字

|

20 分钟

Uni-SMART: Universal Science Multimodal Analysis and Research Transformer Uni-SMART: 通用科学的多模态分析研究 Transformer 在科学研究及其应用领域，科学文献分析极为重要，它使研究人员得以在前人的基础上发展自己的工作。然而，科学知识的快速发展导致学术文章数…

论文阅读

每周AI论文速递（240311-240315）

1,681

|

0

|

AI,每周AI论文速递

4717 字

|

19 分钟

Gemini 1.5: Unlocking multimodal understanding across millions of tokens of context Gemini 1.5：跨数百万Token实现多模态理解在本报告中，我们展示了 Gemini 系列最新的模型，Gemini 1.5 Pro，这是一个计算高效的多模态混合专家模型。它能…

人工智能深度学习

每周AI论文速递（240304-240308）

1,684

|

0

|

AI,每周AI论文速递

6586 字

|

25 分钟

VisionLLaMA: A Unified LLaMA Interface for Vision Tasks VisionLLaMA: 视觉任务的统一 LLaMA 接口大语言模型基于 Transformer 架构构建，主要处理文本输入。其中，LLaMA 是众多开源实现中的佼佼者。那么，相同的 Transformer 能否用于处理 2D 图像呢？…

人工智能深度学习论文阅读

每周AI论文速递（240226-240301）

1,710

|

0

|

AI,每周AI论文速递

4966 字

|

20 分钟

MobileLLM: Optimizing Sub-billion Parameter Language Models for On-Device Use Cases MobileLLM: 针对移动设备使用场景优化的亚十亿参数语言模型本文针对在移动设备上部署高效的大型语言模型（LLMs）的迫切需求进行研究，这一需求源于云计算成本的上升和延迟问题的…

LLM 人工智能深度学习

每周AI论文速递（240219-240223）

1,175

|

0

|

AI,每周AI论文速递

5555 字

|

21 分钟

Linear Transformers with Learnable Kernel Functions are Better In-Context Models 具有可学习核函数的线性 Transformer 是更优的上下文学习模型在自然语言处理领域快速进展之中，发展语言模型（LMs）的次方级别架构至关重要。当前的创新，包括状态空间模型（SSMs…

人工智能论文阅读

每周AI论文速递（240212-240216）

1,248

|

0

|

AI,每周AI论文速递

4614 字

|

18 分钟

Aya Dataset: An Open-Access Collection for Multilingual Instruction Tuning Aya 数据集：多语言指令微调的公开获取资源数据集对于现代人工智能的众多重大进展至关重要。许多自然语言处理（NLP）领域的最新成就得益于在多元任务集上进行的预训练模型微调，这一过程使得大语言模型（L…

人工智能论文阅读

分类： 每周AI论文速递

分类：每周AI论文速递