Keras nos ofrece una serie de datasets predeterminados con los cuales alimentar modelos, estas bases de datos son ideales para probar el rendimiento de diferentes algoritmos de machine learning porque sus datos se encuentran bastante limpios y listos para ser digeridos.
En la documentación oficial de Keras puedes encontrar los datasets disponibles, para esta ocasión trabajaremos con CIFAR100, un dataset de 60.000 imágenes de 100 clases diferentes relacionadas a objetos del mundo como vehículos, animales y demás.
Puedes leer la estructura básica y un quickstart de uso en la documentación, si quieres más detalle, puede ir a la página oficial del dataset donde tendrás acceso a información más específica.
Importaremos los módulos a trabajar, donde el protagonista será TensorFlow.
import tensorflow as tf
import numpy as np
%matplotlib inline
import matplotlib.pyplot as plt
Para extraer el dataset, haremos uso del módulo de datasets de Keras (que viene incluido en TensorFlow).
from tensorflow.keras.datasets import cifar100
Cargaremos el dataset con la función load_data y será almacenada en 2 tuplas relacionadas a los datos de entrenamiento (que serán 50.000) y los datos de prueba (los 10.000 restantes).
(x_train, y_train), (x_test, y_test) = cifar100.load_data(label_mode = "fine")