3 anni fa · d46a356f06
--- a/PyTorch/Translation/Transformer/fairseq/log_helper.py
+++ b/PyTorch/Translation/Transformer/fairseq/log_helper.py
@@ -8,6 +8,7 @@ from collections import OrderedDict
 
															 import dllogger
														
 
															 from dllogger import Backend, JSONStreamBackend
														
 
															 from tensorboardX import SummaryWriter
														
 
															+import torch
														
 
															 class AverageMeter():
														
@@ -43,6 +44,7 @@ class PerformanceMeter():
 
															     def reset(self):
														
 
															         self.updated = False
														
 
															+        torch.cuda.synchronize()
														
 
															         self.start = time.time()
														
 
															         self.n = 0
														
@@ -56,6 +58,7 @@ class PerformanceMeter():
 
															     @property
														
 
															     def elapsed_time(self):
														
 
															+        torch.cuda.synchronize()
														
 
															         return time.time() - self.start
														
@@ -70,6 +73,7 @@ class AggregatorBackend(Backend):
 
															         self.metrics.flushed = True
														
 
															         self.step = 0
														
 
															         self.epoch = 0
														
 
															+        torch.cuda.synchronize()
														
 
															         self.start_time = time.time()
														
 
															     @property
														
@@ -115,6 +119,7 @@ class AggregatorBackend(Backend):
 
															                 result_string += _name + ' {:.3f} |'.format(agg.value)
														
 
															                 agg.reset()
														
 
															+        torch.cuda.synchronize()
														
 
															         result_string += 'walltime {:.3f} |'.format(time.time() - self.start_time)
														
 
															         self.metrics.flushed = True
														
 
															         print(result_string)
														
--- a/PyTorch/Translation/Transformer/fairseq/meters.py
+++ b/PyTorch/Translation/Transformer/fairseq/meters.py
@@ -6,6 +6,7 @@
 
															 # can be found in the PATENTS file in the same directory.
														
 
															 import time
														
 
															+import torch
														
 
															 class AverageMeter(object):
														
@@ -33,12 +34,14 @@ class TimeMeter(object):
 
															     def reset(self, init=0):
														
 
															         self.init = init
														
 
															+        torch.cuda.synchronize()
														
 
															         self.start = time.time()
														
 
															         self.n = 0
														
 
															         self.last_update = time.time()
														
 
															     def update(self, val=1):
														
 
															         self.n += val
														
 
															+        torch.cuda.synchronize()
														
 
															         self.last_update = time.time()
														
 
															     @property
														
@@ -47,6 +50,7 @@ class TimeMeter(object):
 
															     @property
														
 
															     def elapsed_time(self):
														
 
															+        torch.cuda.synchronize()
														
 
															         return self.init + (time.time() - self.start)
														
 
															     @property
														
@@ -61,9 +65,11 @@ class StopwatchMeter(object):
 
															         self.intervals = []
														
 
															     def start(self):
														
 
															+        torch.cuda.synchronize()
														
 
															         self.start_time = time.time()
														
 
															     def stop(self, n=1):
														
 
															+        torch.cuda.synchronize()
														
 
															         if self.start_time is not None:
														
 
															             delta = time.time() - self.start_time
														
 
															             self.intervals.append(delta)
														
--- a/PyTorch/Translation/Transformer/inference.py
+++ b/PyTorch/Translation/Transformer/inference.py
@@ -151,6 +151,7 @@ def main(args):
 
															     use_cuda = torch.cuda.is_available() and not args.cpu
														
 
															+    torch.cuda.synchronize()
														
 
															     processing_start = time.time()
														
 
															     # Load ensemble
														
@@ -229,7 +230,9 @@ def main(args):
 
															             tokens = tokens.cuda()
														
 
															             lengths = lengths.cuda()
														
 
															+        torch.cuda.synchronize()
														
 
															         translation_start = time.time()
														
 
															+
														
 
															         gen_timer.start()
														
 
															         translations = translator.generate(
														
 
															             tokens,
														
@@ -237,6 +240,8 @@ def main(args):
 
															             maxlen=int(args.max_len_a * tokens.size(1) + args.max_len_b),
														
 
															         )
														
 
															         gen_timer.stop(sum(len(h[0]['tokens']) for h in translations))
														
 
															+
														
 
															+        torch.cuda.synchronize()
														
 
															         dllogger.log(step='infer', data={'latency': time.time() - translation_start})
														
 
															         return [make_result(batch.srcs[i], t) for i, t in enumerate(translations)]
														
@@ -262,6 +267,7 @@ def main(args):
 
															     if args.file:
														
 
															         data_descriptor.close()
														
 
															+    torch.cuda.synchronize()
														
 
															     log_dict = {
														
 
															                 'throughput': 1./gen_timer.avg,
														
 
															                 'latency_avg': sum(gen_timer.intervals)/len(gen_timer.intervals),
														
--- a/PyTorch/Translation/Transformer/train.py
+++ b/PyTorch/Translation/Transformer/train.py
@@ -164,6 +164,7 @@ def train(args, trainer, epoch_itr):
 
															     max_update = args.max_update or math.inf
														
 
															     num_batches = len(epoch_itr)
														
 
															+    torch.cuda.synchronize()
														
 
															     begin = time.time()
														
 
															     # reset meters
														
@@ -189,6 +190,7 @@ def train(args, trainer, epoch_itr):
 
															         if trainer.get_num_updates() >= max_update:
														
 
															             break
														
 
															+    torch.cuda.synchronize()
														
 
															     print('Epoch time:', time.time() - begin)
														
 
															     # Print epoch stats and reset training meters
														
@@ -235,6 +237,7 @@ def validate(args, trainer, datasets, subsets):
 
															 def score(args, trainer, dataset, src_dict, tgt_dict, ref_file):
														
 
															+    torch.cuda.synchronize()
														
 
															     begin = time.time()
														
 
															     src_dict = deepcopy(src_dict)  # This is necessary, generation of translations
														
@@ -324,6 +327,7 @@ def score(args, trainer, dataset, src_dict, tgt_dict, ref_file):
 
															             float(args.distributed_world_size)/gen_timer.avg
														
 
															             ))
														
 
															+    torch.cuda.synchronize()
														
 
															     print('| Eval completed in: {:.2f}s | {}CASED BLEU {:.2f}'.format(
														
 
															         time.time()-begin,
														
 
															         '' if args.test_cased_bleu else 'UN',