El error que recibe significa que sagemaker no puede iniciar su imagen acoplable, esto se debe a que no ha definido correctamente el punto de entrada. Puede echar un vistazo a mi repo
. Básicamente, en su dockerfile, debe instalar algunos paquetes, crear una carpeta, digamos /opt/ml/code
y pon en esta carpeta tu script de entrenamiento que se llamará train
. El train
El archivo debe respetar algunas indicaciones que puede leer aquí .