Si bien la configuración de cada proyecto de Machine Learning pueden ser radicalmente diferentes y personalizadas, hay generalidades que se pueden aplicar para impulsar la calidad de nuestros modelos. A continuación vamos a hablar de algunas de ellas en las diferentes etapas del desarrollo de algoritmos de IA.
Durante el preprocesamiento de los datos
En esta etapa temprana es de vital importancia entender la naturaleza de los datos y sus propósitos. Algunas de las recomendaciones son:
- Buscar datos null o archivos corruptos: Estos datos aportarán basura al modelo y reducirán el rendimiento final si no son excluidos del dataset prematuramente.
- Balancear tu base de datos: Intenta que la cantidad de ejemplos para cada etiqueta sea proporcional porque un desbalanceo terminará en un algoritmo que no clasificará correctamente pero dará (falsamente) buenas métricas.
- Aplicar normalización: Normalizar los datos hará que sean más livianos de procesar y que se estandaricen frente al resto de features.
- Visualizar y entender los datos: La lógica de negocio lo es todo, si logramos entender la naturaleza y el propósito de nuestros datos podremos dar una dirección diferente a nuestros proyectos, nuestro valor como IA devs radicará en esto.
Ajuste de hiperparámetros
Estas configuraciones se hacen durante la creación de la arquitectura y la compilación de nuestro modelo y son más específicas con respecto a valores numéricos. Algunas recomendaciones son:
- Crear convoluciones de tamaño 3x3, de esta manera no perderemos información durante las operaciones.
- Definir la capa de Max Pooling en 2x2 para reducir la complejidad del modelo y no perder abruptamente muchas features por cada convolución.
- Aplanar las imágenes al final del proceso de convolución (capa flatten), esto combinará todos los features obtenidos de las convoluciones en un solo array lineal.
- Inicializar nuestros modelos con arquitecturas pequeñas de pocas neuronas, generalmente empezar desde 32 o 64 neuronas y crecer la cantidad por cada capa según las potencias de 2 (65/128/256/512).