文章

全部文章列表。

DeltaCNN: End-to-End CNN Inference of Sparse Frame Differences in Videos

更新于: 23 May, 2025

利用CNN Layer的“线性”特征在帧之间做feature的差分，并且做了CUDA加速。和ViStream几乎一样的思路，能不能解决我们现在的问题？
Phi: Leveraging Pattern-based Hierarchical Sparsity for High-Efficiency Spiking Neural Networks

更新于: 21 May, 2025

ISCA 2025, 基于结构化稀疏的SNN加速器。如果直接用LUT存，可能会出现需要保存的稀疏pattern数量太多，显存占用太严重，所以通过预先校准一级“结构化稀疏”，将Online Spike Activation变成一级可以完全用LUT算的L1 Sparse和稀疏度非常高的L2 Sparse。模仿一下idea搬到GPU上来做？
Temporal Flexibility in Spiking Neural Networks: Towards Generalization Across Time Steps and Deployment Friendliness

21 May, 2025

ICLR2025 Poster，似乎也在做Elastic inference？
A Simple Framework for Contrastive Learning of Visual Representations

20 May, 2025

对比学习SimCLR的论文。对比学习能对齐每一层的Feature吗？
QKFormer: Hierarchical Spiking Transformer using Q-K Attention

更新于: 8 May, 2025

QKFormer，NIPS2024 Spotlight，把Direct Training SNN在ImageNet和CIFAR上的点刷的特别高，感觉之后要做就避不开它。
Transformers without Normalization

7 May, 2025

何恺明新作，用DyT代替Norm，把同步操作变成了Element Wise的操作。新文章里面有用到，学习一下。
Visualizing and Understanding the Effectiveness of BERT

更新于: 6 May, 2025

最近做SNN训练的过程中在研究怎么可视化训练过程中的Loss，在想新加入的方法会不会对模型的Loss Landscape有影响，一般讲Loss Landscape怎么做可视化的文章都会引用这篇文章对Loss Landscape的分析和做法。
One-Minute Video Generation with Test-Time Training

更新于: 22 Apr, 2025

最近Demo很火的TTT视频生成，可以生成60s级别的长视频。学习一下TTT的东西，SNN的On-Chip Learning和TTT能不能做结合？
Evolution Strategies as a Scalable Alternative to Reinforcement Learning

更新于: 21 Apr, 2025

这两天在弄SNN训练的事情，需要验证一下用的Surrogate Gradient的准确性，老师介绍读一下这篇文章，用Evolution Strategy验证一下现在梯度估计的准确性。
SparTA: Deep-Learning Model Sparsity via Tensor-with-Sparsity-Attribute

更新于: 15 Apr, 2025

sparTA，带稀疏优化的DNN编译器，把tensor的稀疏性作为一种重要属性考虑到编译过程中，生成高效的代码。

文章

DeltaCNN: End-to-End CNN Inference of Sparse Frame Differences in Videos

Phi: Leveraging Pattern-based Hierarchical Sparsity for High-Efficiency Spiking Neural Networks

Temporal Flexibility in Spiking Neural Networks: Towards Generalization Across Time Steps and Deployment Friendliness

A Simple Framework for Contrastive Learning of Visual Representations

QKFormer: Hierarchical Spiking Transformer using Q-K Attention

Transformers without Normalization

Visualizing and Understanding the Effectiveness of BERT

One-Minute Video Generation with Test-Time Training

Evolution Strategies as a Scalable Alternative to Reinforcement Learning

SparTA: Deep-Learning Model Sparsity via Tensor-with-Sparsity-Attribute