Servicio de entrenamiento en Google AI Platform

En un post pasado vimos como Google AutoML Tables permite implementar modelos de machine learning de manera automática y transparente sobre datos estructurados.

En este post vamos a ver el servicio de entrenamiento de Google AI Platform, que permite seleccionar diferentes modelos para los trabajos de entrenamiento, habilitar el entrenamiento distribuido, ajustar hiperparámetros y acelerar el proceso con GPU y TPU.

Vamos al menú de AI Platform, crear un nuevo servicio de entrenamiento y elegimos algoritmo predefinido. Seleccionamos el algoritmo que vamos a utilizar, en este caso un modelo lineal.

Seleccionamos los datos de entrenamiento, que deberán tener el formato adecuado, en este caso un fichero CSV sin encabezados y con la primera columna la variable objetivo. Definimos el porcentaje de datos que se destinarán a validación y a test y la carpeta en Google Cloud Storage donde se almacenarán los resultados del entrenamiento.

Después, definimos los argumentos del algoritmo, por ejemplo si es regresión o clasificación, el número de batches, la tasa de aprendizaje y si vamos a buscar los hiperparámetros óptimos. En este caso, tenemos que definir el máximo número de intentos, el máximo número de intentos en paralelo y si queremos que AI Platform pare anticipadamente la búsqueda de un hiperparámetro si el resultado no es satisfactorio.

Le damos a siguiente, lanzamos el entrenamiento y esperamos a que acabe el proceso de entrenamiento. El servicio proporciona multitud de información de salida y muy útil como:

  • Detalles del trabajo, como la pérdida y el tiempo empleado en cada intento de búsqueda de hiperparámetros. La utilización de CPU y memoria de los servidores y los logs de todo el proceso.
  • En la carpeta de salida de Cloud Storage, una carpeta para cada intento con el modelo y el experimento, un carpeta de artefacto y una carpeta con los datos procesados (entrenamiento, validación y test).
  • Se puede lanzar Tensorboard y ver las métricas del proceso, el grafo del modelo y todas las utilidades que proporciona este servicio.

Como hemos visto, el servicio de entrenamiento de AI Platform permite entrenar modelos de machine learning, eligiendo un algoritmo predefinido o utilizando un modelo propio, pero sin tener que provisionar las máquinas y recursos de computación necesarios para el proceso.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Orgullosamente ofrecido por WordPress | Tema: Baskerville 2 por Anders Noren.

Subir ↑

A %d blogueros les gusta esto: