文章
全部文章列表。
-
SNN视频流任务调研
更新于:学习一下视频stream上任务的一些工作,大概计划一下后续的工作。
-
SpikeZIP-TF: Conversion is All You Need for Transformer-based SNN
更新于:游康师兄的工作,ANN2SNN的Transformer。
-
SpikingJelly: An open-source machine learning infrastructure platform for spike-based intelligence
更新于:北大惊蛰,非常有影响力的SNN框架,实现了从数据编码、数据集整合到训练、硬件部署的全流程,SNN的torch级别的工作。发表在Science Advanced上。
-
I-LLM: Efficient Integer-Only Inference for Fully-Quantized Low-Bit Large Language Models
更新于:LLM的Interger-Only PTQ量化工作。
-
程序语言理论笔记
更新于:程序语言理论课程的复习笔记。
-
The Minimum Equivalent DNF Problem and Shortest Implicants
更新于:证明MIN-DNF问题是完全的
-
I-ViT: Integer-only Quantization for Efficient Vision Transformer Inference
更新于:对ViT的纯整型量化,W8A8,中科院2023 ICCV
-
Efficient and Effective Methods for Mixed Precision Neural Network Quantization for Faster, Energy-efficient Inference
更新于:EAGL,声称只要用CPU在3秒内就能完成对ResNet的量化,效率远高于HAWQ等其他传统的方法
-
Towards spike-based machine intelligence with neuromorphic computing
更新于:Nature上关于SNN的综述
-
FlashAttention: Fast and Memory-Efficient Exact Attention with IO-Awareness
更新于:Flash Attention,利用硬件结构加速Attention计算速度、减少内存占用的算法。核心是Tiling,Online Softmax和Kernel Fusion。