事件背景
分析处理过程
问题处理以及分析
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/129689.html
摘要:我们在协助某客户排查一个文件存储的性能时发现,其使用的训练性能和硬件的能力有很大的差距后面内容有具体性能对比数据。但直接缓存数据在集群规模上升之后肯定是不现实的,我们初步只缓存各个训练文件的句柄信息,以降低元数据访问开销。我们在协助某AI客户排查一个UFS文件存储的性能case时发现,其使用的Pytorch训练IO性能和硬件的IO能力有很大的差距(后面内容有具体性能对比数据)。让我们感到困惑...
阅读 1359·2023-01-11 13:20
阅读 1709·2023-01-11 13:20
阅读 1215·2023-01-11 13:20
阅读 1911·2023-01-11 13:20
阅读 4167·2023-01-11 13:20
阅读 2762·2023-01-11 13:20
阅读 1402·2023-01-11 13:20
阅读 3675·2023-01-11 13:20