Escrito por
4 minutos de lectura
Pre-procesado: Consiste en estandarizar las imágenes de entrada para así analizarlas de la misma forma, teniendo cada una la misma calidad y detalle que el resto.
Selección de las áreas de interés.
Extracción de características.
Predicción/Reconocimiento de patrones.
Ver “day_night_image_classifier/classifier.ipynb” para observarlo en código
Para hacerlo, podemos proporcionar a la red neuronal un set de imágenes etiquetadas que serán comparadas con la etiqueta del output predicho. Ej.: Si dotamos a la red de la imagen de una persona sonriendo, lo podemos comparar con la respuesta de la que nos dota al modelo al hacer la predicción.
Al hacer esto, la red puede monitorear los errores que hace y auto-corregirse modificando cómo encuentra y prioriza los patrones de la imagen. De esta forma, el modelo podrá caracterizar nuevos datos de imágenes que se encuentren si etiquetar.
Si tenemos una imagen de 639 px de ancho y 426 de alto y queremos obtener un píxel de la imagen podríamos coger el (190, 375) y así su valor, lo cual la red utilizará para ser entrenada.
Muchas veces nos puede ser útil convertir nuestras imágenes a una escala de grises para mejorar el rendimiento de nuestro modelo. Sin embargo, en ocasiones la escala de grises no nos proporciona la suficiente información (Ej. distinguir una línea blanca de una carretera de una amarilla).
Ver “Images as Grids of Pixels.ipynb”.
Consiste en cambiar el color de fondo de un objeto a otro (ej. cuando se cambia la pantalla de fondo verde en un cine por unas imágenes generadas digitalmente).
Seleccionar un umbral con un rango de colores funciona bien cuando el color es estático (utilizar un color picker para ello), sin embargo, si la luz cambia y hay sombras la selección del color fallará.
En el formato de color HSV:
El canal Hue (H) se mantiene consistente ante la presencia de sombras o de un exceso de luminosidad.
El canal Value (V) presenta una gran variación frente a diferentes condiciones de luz.
Por lo tanto, debemos tener presente el formato HSV ante imágenes con gran variación de luminosidad.
Ver “Color Threshold.ipynb”.
Hay gran cantidad de características que se pueden distinguir entre unas imágenes u otras, a estos rasgos los denominamos features. Este es un componente medible de una imagen o un objeto que, idealmente, es único y reconocible bajo ciertas condiciones: La condición puede ser la variación de la luz o del ángulo de la cámara.
Las imágenes pueden estar etiquetadas con valores de categorización (como “perro”, “día”,…) propias principalmente de muchos de los datasets creados o con etiquetas numéricas que permiten ser fácilmente comparadas y guardas en la memoria, además de que muchos algoritmos de ML no usan datos categorizados.
Las etiquetas numéricas se dividen en dos enfoques:
Para cualquier error en la web o en la escritura, porfavor abre un issue en Github.
GithubSiéntete libre de mandarme un tweet con cualquier recomendación o pregunta.
Twitter