Desarrollemos su solución de Visión por Computadora a medida
Desarrollamos modelos a medida, diseñados y entrenados para satisfacer sus necesidades de negocio, apoyándonos en los avances más recientes de la investigación científica.
Hablemos de su proyecto
Visión por Computadora

¿Qué es la Visión por Computadora?

La Visión por Computadora es un campo de la inteligencia artificial que consiste en analizar imágenes o vídeos. Permite a los sistemas automatizados realizar tareas complejas, como el reconocimiento de objetos, la detección de movimientos o la lectura de texto (OCR).
Ejemplos de aplicaciones
La visión por computadora abarca una amplia gama de técnicas para analizar y comprender imágenes en diversas formas. Los siguientes ejemplos son solo una muestra de las innumerables aplicaciones posibles: desde el simple reconocimiento de objetos hasta la interpretación detallada de escenas complejas.
Ejemplo de detección de objetos
La detección de objetos consiste en reconocer y localizar automáticamente un elemento en una imagen. Esta operación a menudo proporciona más precisión que la clasificación por sí sola : permite generar un cuadro delimitador (o bounding box) alrededor del objeto detectado. Disponer de esta localización visual puede ser crucial para ciertas aplicaciones, como la videovigilancia o la identificación de productos en tiendas.
La segmentación semántica tiene como objetivo asignar automáticamente una categoría (o una máscara) a cada píxel de una imagen, permitiendo así delimitar con gran precisión diferentes áreas. Un modelo de segmentación es especialmente relevante en campos como la cartografía de precisión para sistemas de navegación o el análisis detallado de tejidos en el sector médico.
Ejemplo de estimación de pose
La estimación de pose consiste en analizar y localizar los puntos clave del cuerpo humano, como las articulaciones, para establecer la postura y deducir los movimientos. Este enfoque es crucial en numerosos campos : seguimiento de ejercicios deportivos, rehabilitación funcional o la creación de animaciones en tiempo real en el sector del entretenimiento.
Ejemplo de Visual Question Answering
El Visual Question Answering consiste en responder automáticamente a una pregunta formulada a partir de una imagen, lo que requiere una combinación de visión por computadora y procesamiento del lenguaje natural. En ciertos contextos, mediante preguntas específicas, un modelo de Visual Question Answering puede extraer información más precisa que la proporcionada por el Image Captioning.

Nuestra experiencia al servicio de su proyecto

Service Picture
Utilizamos los modelos de Deep Learning preentrenados más potentes del mercado, como los clasificadores ResNet, el modelo de detección YOLO o el modelo de segmentación SAM. En función de su producto o de sus necesidades de negocio, seleccionamos el modelo más adecuado y realizamos un ajuste fino (fine-tuning) con sus datos para alcanzar el máximo rendimiento.

¿Su modelo de visión necesita integrarse en una aplicación de negocio? ¿Ser accesible para cientos o miles de usuarios, optimizando al mismo tiempo los costes de alojamiento? ¿Debe ser redimensionado para un sistema embebido con capacidad de cálculo limitada? Galadrim le acompaña en cada etapa de su proyecto, gracias a ingenieros con experiencia en la integración y el despliegue de modelos de IA complejos.

Equipo

Somos un equipo de 30 ingenieros y consultores apasionados por la inteligencia artificial y la aplicación práctica de los últimos avances en investigación. Nuestra misión: democratizar y simplificar el uso de la IA para todos nuestros clientes.
Hablemos de tu proyecto
Fundadores
Pablo, Partner & Head of AI
Graduado de HEC, Pablo está a cargo del desarrollo comercial de Galadrim en el área de IA y asesora a nuestros clientes en los aspectos estratégicos de sus proyectos. Anteriormente, Pablo fue profesor de matemáticas en la educación superior.
Ver el perfil de LinkedIn
Benjamin, Partner & CTO AI
Ingeniero de la École Polytechnique y del Corps des Mines, Benjamin supervisa al equipo técnico y asesora a nuestros clientes sobre las tecnologías más adecuadas para sus necesidades. Tras su paso por la alta función pública, se adentró en el mundo del emprendimiento, donde ha ocupado varios puestos de liderazgo técnico.
Ver el perfil de LinkedIn

Nuestros proyectos

Image
Groupe Guillin
Reconocimiento de modelos de embalaje

Desarrollo y ajuste fino (fine-tuning) de un modelo para reconocer una de las 25.000 referencias de embalaje de Guillin a partir de una imagen.

  • Desarrollo de una aplicación móvil dedicada a la recopilación de datos y al uso operativo del modelo por los 250 comerciales del Grupo.
  • Adaptación y ajuste fino (fine-tuning) de modelos de clasificación y detección preentrenados.
  • Despliegue de la aplicación y los modelos en una infraestructura adecuada.

Vidéo
Gozoki
Detección de robos

Diseño y desarrollo de un sistema de detección de accidentes y robos en tiempo real a partir de vídeos de vigilancia de tiendas autónomas.

  • Diseño del sistema completo y supervisión de los proveedores encargados de las infraestructuras de hardware (instalación de cámaras, etc.).
  • Adaptación y ajuste fino (fine-tuning) de modelos de detección y estimación de pose preentrenados.
  • Desarrollo de una aplicación web que permite al personal de seguridad visualizar alertas en tiempo real e intervenir a distancia en las tiendas.
  • Orquestación de los flujos de vídeo y despliegue de la solución en una infraestructura adecuada.

Sémantique
YourArt
Búsqueda de imágenes

En colaboración con YourArt, diseño y desarrollo de una funcionalidad de IA integrada en la plataforma yourart.art, que permite encontrar obras de arte a partir de búsquedas por texto o imagen.

  • Implementación de modelos de incrustación (embedding) semántica de imagen y texto para generar representaciones vectoriales.
  • Desarrollo de un algoritmo de búsqueda de vecinos más cercanos (búsqueda ANN).

Nuestras tecnologías

TensorFlow
TensorFlow
PyTorch
PyTorch
OpenCV
OpenCV
Tesseract OCR
Tesseract OCR
Segment Anything
Segment Anything
GPT-4o
GPT-4o
¿Tienes un proyecto?
Hablemos