@ustc_zl
高山临溪谷 暂无简介
imitation_learning, diffusion policy, idp3
imitation learning, diffusion policy
讯飞星火开源-13B(iFlytekSpark-13B)拥有130亿参数,在经过累计超过3万亿以上tokens海量高质量数据集上进行预训练,然后在精调得多元化对齐数据上进行微调得到。iFlytekSpark-13B在多个标准评估中展现出了卓越的性能,其表现优于同参数量级的开源模型。
ZL博客
收集了相关的Unity插件,供大家学习使用,如果用于商业活动,请购买相关版权
Lightweight, stable, efficient PyTorch implement of reinforcement learning. I want to call this PyTorch implement as "3-Python-file-RL".
图床