前不久李飞飞教授的"我看见的世界"中译版在中国发售了,我也迫不及待买了一本,这两周断断续续的看完了。看完后的感慨颇深,想着好好写一篇文章来分享给大家。 整本书阅读下来,对于我而言,最难以忘记的词汇就是“北极星”这个词,似乎这就是作者一生所努力的关键词,而这,也是普普通通的我们也同样需要追逐的。 波折而又幸运的成长过程 我在阅读这…
PLLaVA : Parameter-free LLaVA Extension from Images to Videos for Video Dense Captioning PLLaVA:图像至视频无参数扩展的 LLaVA 模型,用于视频详细描述 视觉-语言预训练显著提升了各种图像-语言应用的性能。然而,视频相关任务的预训练过程需巨大的计算和数…
论文解读:KAN: Kolmogorov–Arnold Networks
五一假期刚开始没两天的时候,刷到了一篇火遍国内外AI圈的论文,叫做 KAN: Kolmogorov–Arnold Networks , 尤其国内某些科技媒体铺天盖地的宣传更是让我提起了兴趣,在假期结束之前,抽个空读一下看看是怎么个事。读了之后发现,仅仅只是高数、线代和概率论这些数学知识是看不懂的,最好还需要了解一点数分方面的知识,反正我是借助了Ch…