月度归档: 2025 年 3 月

2 篇文章

每周AI论文速递(250310-250314)
Feature-Level Insights into Artificial Text Detection with Sparse Autoencoders 使用稀疏自编码器进行生成文本检测的特征级洞察 随着先进的大语言模型的兴起,生成文本检测变得越来越重要。尽管有许多努力,但没有单一算法在不同类型的未见文本上表现一致,或保证对新的大语言模型的有效…
每周AI论文速递(250303-250307)
Predictive Data Selection: The Data That Predicts Is the Data That Teaches 预测性数据选择:预测的数据即教学的数据 语言模型的预训练需要在广泛的语料库上进行训练,其中数据质量起着关键作用。在这项工作中,我们的目标是直接估计预训练期间数据的贡献,并以高效的方式选择预训练数据。具…