tomlingtm的专栏列表 - UCloud云社区

128块Tesla V100 4小时训练40G文本，这篇论文果然很英伟达

摘要：近日，英伟达发表了一篇大规模语言建模的论文，他们使用块在小时内使得可以收敛，值得注意的是，他们使用的数据集包含的文本，这在以前通常需要花费数周的时间进行训练。表示训练出现发散。近日，英伟达发表了一篇大规模语言建模的论文，他们使用 128 块 GPU 在 4 小时内使得 mLSTM 可以收敛，值得注意的是，他们使用的 Amazon Reviews 数据集包含 40GB 的文本，这在以前通常需...

tomlingtm 发布于人工智能 2019-04-25 18:28