最好的矩阵乘——CUTLASS核函数解读(1)


CUTLASS的api CUTLASS库是NVIDIA的开源库,能够通过调节各种参数逼近甚至超越传统cuBLAS库的矩阵乘性能,但是其C++风格式的源码晦涩难懂,通常需要联系多个类才能看懂源码,本文从CUTLASS的表层api入手,逐层递进,对最终的核函数进行解释分析。注意,本文看重的是大矩阵乘法最

工业级大规模图计算系统


图是什么 图表示数据之间关系的抽象模型,广度深度优先搜索,增加权重(搜广推),路径规划,最短路径 图和矩阵 可以用矩阵描述点与点之间是否有连线(稀疏矩阵) 乘加 reduction 转置 按位apply 关联规则 欺诈检测 图