Просмотр исходного кода

Merge pull request #312 from sharathts/patch-6

Fix case with one training shard only
PrzemekS 6 лет назад
Родитель
Сommit
dc63c016cf
1 измененных файлов с 3 добавлено и 1 удалено
  1. 3 1
      PyTorch/LanguageModeling/BERT/run_pretraining.py

+ 3 - 1
PyTorch/LanguageModeling/BERT/run_pretraining.py

@@ -471,7 +471,9 @@ def main():
             overflow_buf = None
             if args.allreduce_post_accumulation:
                 overflow_buf = torch.cuda.IntTensor([0])
-
+            
+            if len(files) == 1:
+                f_start_id = -1
             for f_id in range(f_start_id + 1 , len(files)):