太通透了!大模型训练和推理优化技术最全汇总!1、关键内容:DeepSpeed的ZeRO技术能够减少单卡的内存负担,通过数据并行和零冗余优化模型存储,提高训练效率。TorchFSDP+CPUOffloa...