feat: gpt-j config

2 years ago · df2d5f7e46
parent 3efc19ebc5
commit df2d5f7e46
1 changed files with 28 additions and 0 deletions
--- a/configs/deepspeed/ds_config_gptj.json
+++ b/configs/deepspeed/ds_config_gptj.json
@ -0,0 +1,28 @@
 {
 	"train_batch_size": "auto",
 	"gradient_accumulation_steps": 4,
 	"train_micro_batch_size_per_gpu": "auto",
 	"fp16": {
 	  "enabled": "auto",
 	  "min_loss_scale": 1,
 	  "loss_scale_window": 1000,
 	  "hysteresis": 2,
 	  "initial_scale_power": 32
 	},
 	"bf16": {
 		"enabled": "auto"
 	},
 	"gradient_clipping": 1.0,
 	"zero_optimization": {
 	  "stage": 2,
 	  "offload_param": {
 		"device": "none"
 	  },
 	  "offload_optimizer": {
 		"device": "none"
 	  },
 	  "allgather_partitions": true,
 	  "allgather_bucket_size": 5e8,
 	  "contiguous_gradients": true
 	}
  }