| .. |
|
img
|
a38deff61e
[Transformer-XL/PyT] Large model support; multi-node training; inference with TorchScript
|
hace 6 años |
|
inference
|
09a17a0f33
[TXL/PyT] Update for PyT Transformer-XL:
|
hace 5 años |
|
scripts
|
09a17a0f33
[TXL/PyT] Update for PyT Transformer-XL:
|
hace 5 años |
|
utils
|
09a17a0f33
[TXL/PyT] Update for PyT Transformer-XL:
|
hace 5 años |
|
data_utils.py
|
533f7444ae
[TXL/PyT] Fixed issue with AMP training together with gradient accumulation (#720)
|
hace 5 años |
|
eval.py
|
09a17a0f33
[TXL/PyT] Update for PyT Transformer-XL:
|
hace 5 años |
|
lamb.py
|
6b82d3acb3
[TXL/PyT] Minor update for PyTorch Transformer-XL (#688)
|
hace 5 años |
|
mem_transformer.py
|
09a17a0f33
[TXL/PyT] Update for PyT Transformer-XL:
|
hace 5 años |
|
run.sub
|
f838cf3292
[Transformer-XL/PyT] Added Ampere support
|
hace 5 años |
|
run_enwik8_base.sh
|
ca28f55476
[Transformer-XL/PyT] renaming folders
|
hace 6 años |
|
run_enwik8_large.sh
|
ca28f55476
[Transformer-XL/PyT] renaming folders
|
hace 6 años |
|
run_lm1b_base.sh
|
ca28f55476
[Transformer-XL/PyT] renaming folders
|
hace 6 años |
|
run_lm1b_large.sh
|
ca28f55476
[Transformer-XL/PyT] renaming folders
|
hace 6 años |
|
run_multinode_wt103_large.sh
|
6b82d3acb3
[TXL/PyT] Minor update for PyTorch Transformer-XL (#688)
|
hace 5 años |
|
run_text8_base.sh
|
ca28f55476
[Transformer-XL/PyT] renaming folders
|
hace 6 años |
|
run_text8_large.sh
|
ca28f55476
[Transformer-XL/PyT] renaming folders
|
hace 6 años |
|
run_wt103_base.sh
|
6b82d3acb3
[TXL/PyT] Minor update for PyTorch Transformer-XL (#688)
|
hace 5 años |
|
run_wt103_large.sh
|
6b82d3acb3
[TXL/PyT] Minor update for PyTorch Transformer-XL (#688)
|
hace 5 años |
|
train.py
|
09a17a0f33
[TXL/PyT] Update for PyT Transformer-XL:
|
hace 5 años |
|
wt103_base.yaml
|
533f7444ae
[TXL/PyT] Fixed issue with AMP training together with gradient accumulation (#720)
|
hace 5 años |
|
wt103_large.yaml
|
533f7444ae
[TXL/PyT] Fixed issue with AMP training together with gradient accumulation (#720)
|
hace 5 años |