En un post pasado vimos como Google AutoML Tables permite implementar modelos de machine learning de manera automática y transparente sobre datos estructurados.
En este post vamos a ver el servicio de entrenamiento de Google AI Platform, que permite seleccionar diferentes modelos para los trabajos de entrenamiento, habilitar el entrenamiento distribuido, ajustar hiperparámetros y acelerar el proceso con GPU y TPU.
Vamos al menú de AI Platform, crear un nuevo servicio de entrenamiento y elegimos algoritmo predefinido. Seleccionamos el algoritmo que vamos a utilizar, en este caso un modelo lineal.

Seleccionamos los datos de entrenamiento, que deberán tener el formato adecuado, en este caso un fichero CSV sin encabezados y con la primera columna la variable objetivo. Definimos el porcentaje de datos que se destinarán a validación y a test y la carpeta en Google Cloud Storage donde se almacenarán los resultados del entrenamiento.


Después, definimos los argumentos del algoritmo, por ejemplo si es regresión o clasificación, el número de batches, la tasa de aprendizaje y si vamos a buscar los hiperparámetros óptimos. En este caso, tenemos que definir el máximo número de intentos, el máximo número de intentos en paralelo y si queremos que AI Platform pare anticipadamente la búsqueda de un hiperparámetro si el resultado no es satisfactorio.

Le damos a siguiente, lanzamos el entrenamiento y esperamos a que acabe el proceso de entrenamiento. El servicio proporciona multitud de información de salida y muy útil como:
- Detalles del trabajo, como la pérdida y el tiempo empleado en cada intento de búsqueda de hiperparámetros. La utilización de CPU y memoria de los servidores y los logs de todo el proceso.
- En la carpeta de salida de Cloud Storage, una carpeta para cada intento con el modelo y el experimento, un carpeta de artefacto y una carpeta con los datos procesados (entrenamiento, validación y test).
- Se puede lanzar Tensorboard y ver las métricas del proceso, el grafo del modelo y todas las utilidades que proporciona este servicio.


Como hemos visto, el servicio de entrenamiento de AI Platform permite entrenar modelos de machine learning, eligiendo un algoritmo predefinido o utilizando un modelo propio, pero sin tener que provisionar las máquinas y recursos de computación necesarios para el proceso.
Deja una respuesta