Experiencia en Visión por Computadora

Ejemplos de aplicaciones

La visión por computadora abarca una amplia gama de técnicas para analizar y comprender imágenes en diversas formas. Los siguientes ejemplos son solo una muestra de las innumerables aplicaciones posibles: desde el simple reconocimiento de objetos hasta la interpretación detallada de escenas complejas.

La detección de objetos (Image Captioning) consiste en reconocer y localizar automáticamente un elemento en una imagen. Esta operación a menudo proporciona más precisión que la clasificación por sí sola : permite generar un cuadro delimitador (o bounding box) alrededor del objeto detectado. Disponer de esta localización visual puede ser crucial para ciertas aplicaciones, como la videovigilancia o la identificación de productos en tiendas.

La segmentación semántica tiene como objetivo asignar automáticamente una categoría (o una máscara) a cada píxel de una imagen, permitiendo así delimitar con gran precisión diferentes áreas. Un modelo de segmentación es especialmente relevante en campos como la cartografía de precisión para sistemas de navegación o el análisis detallado de tejidos en el sector médico.

La estimación de pose consiste en analizar y localizar los puntos clave del cuerpo humano, como las articulaciones, para establecer la postura y deducir los movimientos. Este enfoque es crucial en numerosos campos : seguimiento de ejercicios deportivos, rehabilitación funcional o la creación de animaciones en tiempo real en el sector del entretenimiento.

El Visual Question Answering consiste en responder automáticamente a una pregunta formulada a partir de una imagen, lo que requiere una combinación de visión por computadora y procesamiento del lenguaje natural. En ciertos contextos, mediante preguntas específicas, un modelo de Visual Question Answering puede extraer información más precisa que la proporcionada por el Image Captioning.

Nuestra experiencia al servicio de su proyecto

Utilizamos los modelos de Deep Learning preentrenados más potentes del mercado, como los clasificadores ResNet, el modelo de detección YOLO o el modelo de segmentación SAM. En función de su producto o de sus necesidades de negocio, seleccionamos el modelo más adecuado y realizamos un ajuste fino (fine-tuning) con sus datos para alcanzar el máximo rendimiento.

¿Su modelo de visión necesita integrarse en una aplicación de negocio? ¿Ser accesible para cientos o miles de usuarios, optimizando al mismo tiempo los costes de alojamiento? ¿Debe ser redimensionado para un sistema embebido con capacidad de cálculo limitada? Galadrim lo acompaña en cada etapa de su proyecto, gracias a ingenieros con experiencia en la integración y el despliegue de modelos de IA complejos.

Equipo

Somos un equipo de 30 ingenieros y consultores apasionados por la inteligencia artificial y la aplicación práctica de los últimos avances en investigación. Nuestra misión: democratizar y simplificar el uso de la IA para todos nuestros clientes.

Hablemos de su proyecto

Pablo, Partner & Head of AI

Graduado de HEC, Pablo está a cargo del desarrollo comercial de Galadrim en el área de IA y asesora a nuestros clientes en los aspectos estratégicos de sus proyectos. Anteriormente, Pablo fue profesor de matemáticas en la educación superior.

Ver el perfil de LinkedIn

Benjamin, Partner & CTO AI

Ingeniero de la École Polytechnique y del Corps des Mines, Benjamin supervisa al equipo técnico y asesora a nuestros clientes sobre las tecnologías más adecuadas para sus necesidades. Tras su paso por la alta función pública, se adentró en el mundo del emprendimiento, donde ha ocupado varios puestos de liderazgo técnico.

Ver el perfil de LinkedIn

Nuestros proyectos

Image

Reconocimiento de modelos de embalaje

Desarrollo y ajuste fino (fine-tuning) de un modelo para reconocer una de las 25.000 referencias de embalaje de Guillin a partir de una imagen.

Desarrollo de una aplicación móvil dedicada a la recopilación de datos y al uso operativo del modelo por los 250 comerciales del Grupo.
Adaptación y ajuste fino (fine-tuning) de modelos de clasificación y detección preentrenados.
Despliegue de la aplicación y los modelos en una infraestructura adecuada.

Vidéo

Detección de robos

Diseño y desarrollo de un sistema de detección de accidentes y robos en tiempo real a partir de vídeos de vigilancia de tiendas autónomas.

Diseño del sistema completo y supervisión de los proveedores encargados de las infraestructuras de hardware (instalación de cámaras, etc.).
Adaptación y ajuste fino (fine-tuning) de modelos de detección y estimación de pose preentrenados.
Desarrollo de una aplicación web que permite al personal de seguridad visualizar alertas en tiempo real e intervenir a distancia en las tiendas.
Orquestación de los flujos de vídeo y despliegue de la solución en una infraestructura adecuada.

Sémantique

Búsqueda de imágenes

En colaboración con YourArt, diseño y desarrollo de una funcionalidad de IA integrada en la plataforma yourart.art, que permite encontrar obras de arte a partir de búsquedas por texto o imagen.

Implementación de modelos de incrustación (embedding) semántica de imagen y texto para generar representaciones vectoriales.
Desarrollo de un algoritmo de búsqueda de vecinos más cercanos (búsqueda ANN).

¿Qué es la Visión por Computadora?

Nuestra experiencia al servicio de su proyecto

Equipo

Nuestros proyectos

Nuestras tecnologías