柒号客栈
首页
生活随笔
编程记录
游戏心得
蒜头山
动态
相册
关于
柒叁
累计撰写
10
篇文章
累计创建
5
个分类
累计收到
0
条评论
导航
首页
生活随笔
编程记录
游戏心得
蒜头山
动态
相册
关于
目录
分类
编程记录
最好的矩阵乘——CUTLASS核函数解读(1)
2024-03-21 18:00
441
2
72.1℃
编程记录
CUTLASS的api CUTLASS库是NVIDIA的开源库,能够通过调节各种参数逼近甚至超越传统cuBLAS库的矩阵乘性能,但是其C++风格式的源码晦涩难懂,通常需要联系多个类才能看懂源码,本文从CUTLASS的表层api入手,逐层递进,对最终的核函数进行解释分析。注意,本文看重的是大矩阵乘法最
工业级大规模图计算系统
2024-03-18 18:00
19
0
25.9℃
编程记录
图是什么 图表示数据之间关系的抽象模型,广度深度优先搜索,增加权重(搜广推),路径规划,最短路径 图和矩阵 可以用矩阵描述点与点之间是否有连线(稀疏矩阵) 乘加 reduction 转置 按位apply 关联规则 欺诈检测 图
弹