TA 关注的仓库 - wangtongyu6 (TonyWang222)

wangtongyu6的个人主页

关注的仓库(36)

Watch wangtongyu6/cutlass

CUDA Templates and Python DSLs for High-Performance Linear Algebra

最近更新: 13天前

Watch wangtongyu6/Megatron-Bridge

HuggingFace conversion and training library for Megatron-based models

最近更新: 13天前

Watch wangtongyu6/DeepGEMM

DeepGEMM: clean and efficient FP8 GEMM kernels with fine-grained scaling

最近更新: 13天前

Watch wangtongyu6/TransformerEngine

A library for accelerating Transformer models on NVIDIA GPUs, including using 8-bit floating point (FP8) precision on Hopper, Ada and Blackwell GPUs, to provide better performance with lower memory utilization in both training and inference.

最近更新: 13天前

Watch wangtongyu6/Megatron-LM

Ongoing research training transformer models at scale

最近更新: 13天前

Watch wangtongyu6/lcoc

最近更新: 10个月前

Watch Zhenghao/Kernel-Gen

kernel-gen

最近更新: 11个月前

Watch wangtongyu6/cann-ops forked from Ascend/cann-ops
暂停

cann-ops，是基于昇腾硬件的基础算子库，同时接受外部基础算子贡献。

最近更新: 11个月前

Watch wangtongyu6/MindSpeed-RL forked from Ascend/MindSpeed-RL
暂停

昇腾强化学习加速库

最近更新: 12个月前

Watch Zhenghao/MindSpeed-LLM forked from Ascend/MindSpeed-LLM
暂停

昇腾LLM分布式训练框架

最近更新: 1年前

wangtongyu6

Watch wangtongyu6/cutlass

Watch wangtongyu6/Megatron-Bridge

Watch wangtongyu6/DeepGEMM

Watch wangtongyu6/TransformerEngine

Watch wangtongyu6/Megatron-LM

Watch wangtongyu6/lcoc

Watch Zhenghao/Kernel-Gen

Watch wangtongyu6/cann-ops forked from Ascend/cann-ops暂停

Watch wangtongyu6/MindSpeed-RL forked from Ascend/MindSpeed-RL暂停

Watch Zhenghao/MindSpeed-LLM forked from Ascend/MindSpeed-LLM暂停

搜索帮助

Watch wangtongyu6/cann-ops forked from Ascend/cann-ops
暂停

Watch wangtongyu6/MindSpeed-RL forked from Ascend/MindSpeed-RL
暂停

Watch Zhenghao/MindSpeed-LLM forked from Ascend/MindSpeed-LLM
暂停