Skip to content

Archives

All the articles I've archived.

2025 40
November 2
  • Nested Learning: The Illusion of Deep Learning Architectures

    Updated: at 17:08

    谷歌新作,号称“深度学习新范式”。提到了异步,具体指的是让模型靠近输入的位置的更新频率高于靠后的位置,这个思路和之前Sakana AI的那个文章有点像。但文章里面的东西感觉全都是Fast Weight Programming的内容,arxiv的文章全文也一直没挂出来。

  • Kimi Linear: An Expressive, Efficient Attention Architecture

    Updated: at 19:10

    Kimi Linear,有比较详细的实验&Scale Up。有Linear Attention可以去掉RoPE这个结论还是比较惊喜的。

October 1
September 4
August 2
July 2
June 9
May 8
April 3
March 3
February 2
  • SpikeCV: Open a Continuous Computer Vision Era

    Updated: at 14:57

    事件相机开源框架。

  • Neuromorphic computing at scale

    Updated: at 14:57

    发在Nature上的一篇review,讨论了SNN/神经模态计算社区现在面临的一些问题、挑战,和一些可能的发展方向。

January 4
  • Titans: Learning to Memorize at Test Time

    Updated: at 14:57

    从TTT改进而来的新架构,尝试通过TTT的方式改进模型的记忆能力。

  • Segment Anything

    Updated: at 14:57

    Meta的SAM。

  • SDiT: Spiking Diffusion Model with Transformer

    Updated: at 14:57

    脉冲Diffusion Transformer,里面的Transformer的结构是RWKV的。

  • 2024

    Updated: at 14:57

    2024.

2024 34
December 4
November 1
  • LoCC工作总结

    Updated: at 15:05

    老板找到idea到交稿只用了两个星期,第一次完整跟着做完一整篇论文的工作。

October 3
August 3
July 3
June 2
May 2
March 16