Szymon Migacz 09a17a0f33 [TXL/PyT] Update for PyT Transformer-XL: hace 5 años
..
img a38deff61e [Transformer-XL/PyT] Large model support; multi-node training; inference with TorchScript hace 6 años
inference 09a17a0f33 [TXL/PyT] Update for PyT Transformer-XL: hace 5 años
scripts 09a17a0f33 [TXL/PyT] Update for PyT Transformer-XL: hace 5 años
utils 09a17a0f33 [TXL/PyT] Update for PyT Transformer-XL: hace 5 años
data_utils.py 533f7444ae [TXL/PyT] Fixed issue with AMP training together with gradient accumulation (#720) hace 5 años
eval.py 09a17a0f33 [TXL/PyT] Update for PyT Transformer-XL: hace 5 años
lamb.py 6b82d3acb3 [TXL/PyT] Minor update for PyTorch Transformer-XL (#688) hace 5 años
mem_transformer.py 09a17a0f33 [TXL/PyT] Update for PyT Transformer-XL: hace 5 años
run.sub f838cf3292 [Transformer-XL/PyT] Added Ampere support hace 5 años
run_enwik8_base.sh ca28f55476 [Transformer-XL/PyT] renaming folders hace 6 años
run_enwik8_large.sh ca28f55476 [Transformer-XL/PyT] renaming folders hace 6 años
run_lm1b_base.sh ca28f55476 [Transformer-XL/PyT] renaming folders hace 6 años
run_lm1b_large.sh ca28f55476 [Transformer-XL/PyT] renaming folders hace 6 años
run_multinode_wt103_large.sh 6b82d3acb3 [TXL/PyT] Minor update for PyTorch Transformer-XL (#688) hace 5 años
run_text8_base.sh ca28f55476 [Transformer-XL/PyT] renaming folders hace 6 años
run_text8_large.sh ca28f55476 [Transformer-XL/PyT] renaming folders hace 6 años
run_wt103_base.sh 6b82d3acb3 [TXL/PyT] Minor update for PyTorch Transformer-XL (#688) hace 5 años
run_wt103_large.sh 6b82d3acb3 [TXL/PyT] Minor update for PyTorch Transformer-XL (#688) hace 5 años
train.py 09a17a0f33 [TXL/PyT] Update for PyT Transformer-XL: hace 5 años
wt103_base.yaml 533f7444ae [TXL/PyT] Fixed issue with AMP training together with gradient accumulation (#720) hace 5 años
wt103_large.yaml 533f7444ae [TXL/PyT] Fixed issue with AMP training together with gradient accumulation (#720) hace 5 años