El Proyecto | Sobre nosotros | Contribuir | Donaciones | Licencia

HOME

En este proyecto, aplicaremos técnicas de Machine Learning para clasificar imágenes en diferentes categorías. Utilizaremos un conjunto de datos de imágenes etiquetadas y construiremos un modelo que pueda predecir la categoría de una imagen nueva.

Objetivos del Proyecto

Comprender el flujo de trabajo completo de un proyecto de clasificación de imágenes.
Aplicar técnicas de preprocesamiento de datos específicos para imágenes.
Entrenar y evaluar modelos de clasificación de imágenes utilizando redes neuronales.
Implementar técnicas de mejora del rendimiento del modelo.

Pasos del Proyecto

Recolección y Preparación de Datos

1.1. Recolección de Datos

Utilizaremos el conjunto de datos CIFAR-10, que contiene 60,000 imágenes de 32x32 píxeles en 10 clases diferentes.

1.2. Exploración de Datos

Visualización de algunas imágenes del conjunto de datos.
Análisis de la distribución de clases.

1.3. Preprocesamiento de Datos

Normalización de imágenes.
División del conjunto de datos en entrenamiento, validación y prueba.

Construcción del Modelo

2.1. Selección del Modelo

Utilizaremos una Red Neuronal Convolucional (CNN) para la clasificación de imágenes.

2.2. Definición de la Arquitectura del Modelo

Capas convolucionales.
Capas de agrupamiento (pooling).
Capas completamente conectadas (fully connected).

Entrenamiento del Modelo

3.1. Compilación del Modelo

Selección de la función de pérdida.
Selección del optimizador.
Métricas de evaluación.

3.2. Entrenamiento

Ajuste del modelo con los datos de entrenamiento.
Validación del modelo con los datos de validación.

Evaluación y Mejora del Modelo

4.1. Evaluación del Modelo

Evaluación del modelo con los datos de prueba.
Análisis de las métricas de rendimiento.

4.2. Mejora del Modelo

Ajuste de hiperparámetros.
Implementación de técnicas de regularización.
Uso de técnicas de aumento de datos (data augmentation).

Implementación y Despliegue

5.1. Guardado del Modelo

Guardado del modelo entrenado para su uso futuro.

5.2. Despliegue del Modelo

Implementación del modelo en un entorno de producción.

Ejemplo Práctico

Recolección y Preparación de Datos

import tensorflow as tf
from tensorflow.keras.datasets import cifar10
import matplotlib.pyplot as plt

# Cargar el conjunto de datos CIFAR-10
(x_train, y_train), (x_test, y_test) = cifar10.load_data()

# Normalizar los datos
x_train, x_test = x_train / 255.0, x_test / 255.0

# Visualizar algunas imágenes
class_names = ['airplane', 'automobile', 'bird', 'cat', 'deer', 'dog', 'frog', 'horse', 'ship', 'truck']

plt.figure(figsize=(10,10))
for i in range(25):
    plt.subplot(5,5,i+1)
    plt.xticks([])
    plt.yticks([])
    plt.grid(False)
    plt.imshow(x_train[i])
    plt.xlabel(class_names[y_train[i][0]])
plt.show()

Construcción del Modelo

from tensorflow.keras import layers, models

# Definir la arquitectura del modelo
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(32, 32, 3)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10))

Entrenamiento del Modelo

# Compilar el modelo
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# Entrenar el modelo
history = model.fit(x_train, y_train, epochs=10, 
                    validation_data=(x_test, y_test))

Evaluación y Mejora del Modelo

# Evaluar el modelo
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f'\nPrecisión en el conjunto de prueba: {test_acc}')

# Implementar técnicas de aumento de datos
datagen = tf.keras.preprocessing.image.ImageDataGenerator(
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True)

# Ajustar el modelo con aumento de datos
history = model.fit(datagen.flow(x_train, y_train, batch_size=32),
                    epochs=10, validation_data=(x_test, y_test))

Implementación y Despliegue

# Guardar el modelo
model.save('modelo_clasificacion_imagenes.h5')

# Cargar el modelo
nuevo_modelo = tf.keras.models.load_model('modelo_clasificacion_imagenes.h5')

Ejercicio Práctico

Ejercicio:

Utiliza el conjunto de datos Fashion MNIST en lugar de CIFAR-10.
Construye y entrena una red neuronal convolucional para clasificar las imágenes de ropa.
Evalúa el modelo y mejora su rendimiento utilizando técnicas de aumento de datos.

Solución:

from tensorflow.keras.datasets import fashion_mnist

# Cargar el conjunto de datos Fashion MNIST
(x_train, y_train), (x_test, y_test) = fashion_mnist.load_data()

# Expandir dimensiones para que coincidan con la entrada de la CNN
x_train = x_train[..., tf.newaxis]
x_test = x_test[..., tf.newaxis]

# Normalizar los datos
x_train, x_test = x_train / 255.0, x_test / 255.0

# Definir la arquitectura del modelo
model = models.Sequential()
model.add(layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))
model.add(layers.MaxPooling2D((2, 2)))
model.add(layers.Conv2D(64, (3, 3), activation='relu'))

model.add(layers.Flatten())
model.add(layers.Dense(64, activation='relu'))
model.add(layers.Dense(10))

# Compilar el modelo
model.compile(optimizer='adam',
              loss=tf.keras.losses.SparseCategoricalCrossentropy(from_logits=True),
              metrics=['accuracy'])

# Entrenar el modelo
history = model.fit(x_train, y_train, epochs=10, 
                    validation_data=(x_test, y_test))

# Evaluar el modelo
test_loss, test_acc = model.evaluate(x_test, y_test, verbose=2)
print(f'\nPrecisión en el conjunto de prueba: {test_acc}')

# Implementar técnicas de aumento de datos
datagen = tf.keras.preprocessing.image.ImageDataGenerator(
    width_shift_range=0.1,
    height_shift_range=0.1,
    horizontal_flip=True)

# Ajustar el modelo con aumento de datos
history = model.fit(datagen.flow(x_train, y_train, batch_size=32),
                    epochs=10, validation_data=(x_test, y_test))

Conclusión

En este proyecto, hemos cubierto el flujo completo de un proyecto de clasificación de imágenes, desde la recolección y preparación de datos hasta la construcción, entrenamiento, evaluación y despliegue del modelo. Hemos utilizado técnicas avanzadas como el aumento de datos para mejorar el rendimiento del modelo. Este proyecto proporciona una base sólida para abordar problemas de clasificación de imágenes en el mundo real.

Proyecto 2: Clasificación de Imágenes

Objetivos del Proyecto

Pasos del Proyecto

Recolección y Preparación de Datos

1.1. Recolección de Datos

1.2. Exploración de Datos

1.3. Preprocesamiento de Datos

Construcción del Modelo

2.1. Selección del Modelo

2.2. Definición de la Arquitectura del Modelo

Entrenamiento del Modelo

3.1. Compilación del Modelo

3.2. Entrenamiento

Evaluación y Mejora del Modelo

4.1. Evaluación del Modelo

4.2. Mejora del Modelo

Implementación y Despliegue

5.1. Guardado del Modelo

5.2. Despliegue del Modelo

Ejemplo Práctico

Recolección y Preparación de Datos

Construcción del Modelo

Entrenamiento del Modelo

Evaluación y Mejora del Modelo

Implementación y Despliegue

Ejercicio Práctico

Conclusión

Curso de Machine Learning

Módulo 1: Introducción al Machine Learning

Módulo 2: Fundamentos de Estadística y Probabilidad

Módulo 3: Preprocesamiento de Datos

Módulo 4: Algoritmos de Machine Learning Supervisado

Módulo 5: Algoritmos de Machine Learning No Supervisado

Módulo 6: Evaluación y Validación de Modelos

Módulo 7: Técnicas Avanzadas y Optimización

Módulo 8: Implementación y Despliegue de Modelos

Módulo 9: Proyectos Prácticos

Módulo 10: Recursos Adicionales