2025 年 3 月 – 叶子的技术碎碎念

月度归档： 2025 年 3 月

2 篇文章

164

5804 字

22 分钟

Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders 使用稀疏自编码器进行生成文本检测的特征级洞察随着先进的大语言模型的兴起，生成文本检测变得越来越重要。尽管有许多努力，但没有单一算法在不同类型的未见文本上表现一致，或保证对新的大语言模型的有效…

每周AI论文速递（250303-250307）

200

AI,每周AI论文速递

7905 字

31 分钟

Predictive Data Selection: The Data That Predicts Is the Data That Teaches 预测性数据选择：预测的数据即教学的数据语言模型的预训练需要在广泛的语料库上进行训练，其中数据质量起着关键作用。在这项工作中，我们的目标是直接估计预训练期间数据的贡献，并以高效的方式选择预训练数据。具…