Introducción al procesamiento de la imagen - Parte 9: Clasificación de hojas con el aprendizaje de la máquina

Introducción al procesamiento de la imagen - Parte 9: Clasificación de hojas con el aprendizaje de la máquina
Introducción al procesamiento de la imagen - Parte 9: Clasificación de hojas con el aprendizaje de la máquina

Introducción al procesamiento de la imagen - Parte 9: Clasificación de hojas con el aprendizaje de la máquina

Foto de Kadri Vosumae de Pexels

Ahora que hemos hecho abordando diferentes técnicas de procesamiento de imágenes, es hora de que nosotros los ponga en un uso más práctico. En esta publicación, aplicaremos los métodos de procesamiento de imágenes que hemos discutido para preparar nuestras imágenes de entrada y capacitar a un modelo de clasificador utilizando el conjunto de datos de hojas.

Dataset

El conjunto de datos que usaremos compuesto por 27 fotos de diferentes hojas en formato de escala de grises. Estas hojas se pueden clasificar en cinco, que están etiquetadas de A a E.

Figura 1. Deja el conjunto de datos

Limpieza de datos

Cada foto se limpió con diferentes técnicas de segmentación de imágenes y operaciones morfológicas. Luego se utilizaron componentes conectados para detectar las hojas de cada foto. La figura 2 muestra las hojas detectadas según lo indicado por la caja del límite rojo.

Figura 2. Imágenes limpiadas con detección de objetos.

Aprendizaje automático

Para la línea de base, utilizaremos el PCC 1.25 * (criterio de probabilidad proporcional), que se calcule para ser del 25.06%, como se muestra en la Figura 3.

Figura 3. 1.25 * Línea de base PCC

Como se discutió en la publicación de detección de objetos, RegiónPROPS nos da varias propiedades de objeto que podemos usar como entrada en nuestro algoritmo de aprendizaje automático (ML). Para esta tarea, utilizaremos las propiedades excentricidad, área, perímetro, extensión y convex_area. Otras propiedades se enumeran en este repositorio de GitHub.

Varios algoritmos de ML fueron capacitados utilizando las imágenes procesadas. La implementación real de estos modelos no se discutirá en esta publicación, pero el resumen de las precisiones de las pruebas se muestra en la Tabla 1.

Tabla 1. Modelo de precisiones

De los ocho modelos capacitados, el bosque aleatorio dio la mejor precisión de aproximadamente el 94%, que es un 72% más alta que nuestra línea de base, el 25%.

A pesar de que ya tenemos una buena precisión de la clasificación, esto aún podría mejorarse utilizando algoritmos ML más avanzados, como redes neuronales y explorando otras propiedades de las Regiones como características de entrada.

Subir