文章
全部文章列表。
-
DeltaCNN: End-to-End CNN Inference of Sparse Frame Differences in Videos
更新于:利用CNN Layer的“线性”特征在帧之间做feature的差分,并且做了CUDA加速。和ViStream几乎一样的思路,能不能解决我们现在的问题?
-
Phi: Leveraging Pattern-based Hierarchical Sparsity for High-Efficiency Spiking Neural Networks
更新于:ISCA 2025, 基于结构化稀疏的SNN加速器。如果直接用LUT存,可能会出现需要保存的稀疏pattern数量太多,显存占用太严重,所以通过预先校准一级“结构化稀疏”,将Online Spike Activation变成一级可以完全用LUT算的L1 Sparse和稀疏度非常高的L2 Sparse。模仿一下idea搬到GPU上来做?
-
Temporal Flexibility in Spiking Neural Networks: Towards Generalization Across Time Steps and Deployment Friendliness
ICLR2025 Poster,似乎也在做Elastic inference?
-
A Simple Framework for Contrastive Learning of Visual Representations
对比学习SimCLR的论文。对比学习能对齐每一层的Feature吗?
-
QKFormer: Hierarchical Spiking Transformer using Q-K Attention
更新于:QKFormer,NIPS2024 Spotlight,把Direct Training SNN在ImageNet和CIFAR上的点刷的特别高,感觉之后要做就避不开它。
-
Transformers without Normalization
何恺明新作,用DyT代替Norm,把同步操作变成了Element Wise的操作。新文章里面有用到,学习一下。
-
Visualizing and Understanding the Effectiveness of BERT
更新于:最近做SNN训练的过程中在研究怎么可视化训练过程中的Loss,在想新加入的方法会不会对模型的Loss Landscape有影响,一般讲Loss Landscape怎么做可视化的文章都会引用这篇文章对Loss Landscape的分析和做法。
-
One-Minute Video Generation with Test-Time Training
更新于:最近Demo很火的TTT视频生成,可以生成60s级别的长视频。学习一下TTT的东西,SNN的On-Chip Learning和TTT能不能做结合?
-
Evolution Strategies as a Scalable Alternative to Reinforcement Learning
更新于:这两天在弄SNN训练的事情,需要验证一下用的Surrogate Gradient的准确性,老师介绍读一下这篇文章,用Evolution Strategy验证一下现在梯度估计的准确性。
-
SparTA: Deep-Learning Model Sparsity via Tensor-with-Sparsity-Attribute
更新于:sparTA,带稀疏优化的DNN编译器,把tensor的稀疏性作为一种重要属性考虑到编译过程中,生成高效的代码。