Detección

Imagen

Análisis

Estimador de Poses AI

Estimador de poses AI en el navegador. MoveNet detecta 17 puntos clave COCO en el dispositivo (privado, sin subir), calcula ángulos y exporta a JSON o CSV.

Usa el modelo AI MoveNet para detección de poses en tiempo real. El modelo se descarga automáticamente la primera vez que detectas una pose (~5MB).

Subir Imagen

Selecciona una imagen de tu dispositivo

Usar Webcam

Detección de poses en tiempo real

Desde URL

Cargar imagen desde dirección web

Seleccionar Imagen

Arrastra y suelta una imagen aquí

o haz clic para explorar (JPG, PNG, WebP)

¿Tienes comentarios? Reporta errores, sugiere funciones o comparte tus ideas — leemos todos

Acerca del Estimador de Poses AI

El Estimador de Poses AI ejecuta MoveNet (Lightning y Thunder) de TensorFlow.js completamente en tu navegador sobre el backend WebGL. Detecta una sola persona y devuelve 17 puntos clave 2D en formato COCO — nariz, ojos, orejas, hombros, codos, muñecas, caderas, rodillas y tobillos — cada uno con una puntuación de confianza. El modelo (~5MB para Lightning, ~12MB para Thunder) se descarga una vez y queda en caché. Además de los puntos clave, la herramienta calcula los ángulos de flexión de las articulaciones principales (codo, hombro, cadera, rodilla) y permite exportar todo a JSON o CSV, con coordenadas tanto del lienzo reducido como de la resolución original. Todo el procesamiento ocurre localmente — nunca se suben imágenes, vídeo ni datos de poses a ningún servidor.

¿Este estimador de poses envía mi webcam o foto a un servidor?

No. El Estimador de Poses AI ejecuta todo el pipeline de detección en tu navegador usando MoveNet vía TensorFlow.js. Tu stream de webcam o foto subida se decodifica en un lienzo en memoria, el detector de keypoints MoveNet corre en tu propia GPU (backend WebGL) o CPU, y los 17 keypoints resultantes se dibujan de vuelta en el lienzo — sin que un solo byte salga del dispositivo. No hay subidas, ni telemetría, ni inferencia en la nube. Es esencial para apps de fitness que no deben enviar tus vídeos de entrenamiento a terceros, para detección postural donde importa la privacidad, y para superposiciones en vivo de baja latencia.

¿Qué 17 keypoints detecta MoveNet?

MoveNet devuelve los 17 keypoints en formato COCO: nariz, ojo izquierdo/derecho, oreja izquierda/derecha, hombro izquierdo/derecho, codo izquierdo/derecho, muñeca izquierda/derecha, cadera izquierda/derecha, rodilla izquierda/derecha y tobillo izquierdo/derecho. Cada keypoint lleva una coordenada x/y en píxeles y una puntuación de confianza de 0 a 1. No hay puntos de mano, pie ni malla facial, ni valor z/profundidad — la salida es de una sola persona y solo 2D. El control deslizante de confianza permite ocultar las articulaciones de baja confianza del esqueleto y del cálculo de ángulos.

Lightning vs Thunder — ¿cuál es la diferencia?

Ambos son detectores MoveNet de una sola persona que emiten los mismos 17 keypoints. Lightning (~5MB) está optimizado para velocidad y es el predeterminado — ideal para seguimiento por webcam en tiempo real y móviles, a menudo 30-60 fps en una GPU de portátil reciente. Thunder (~12MB) es un modelo más grande y preciso, mejor para analizar imágenes fijas donde importa la precisión, a costa de velocidad. Puedes alternar entre ellos en Configuración de Detección; el detector se recarga en la siguiente detección.

Estimador de Poses AI — Estimador de poses AI en el navegador. MoveNet detecta 17 puntos clave COCO en el dispositivo (privado, sin subir), calc — **Estimador de Poses AI**

¿Qué tan preciso es MoveNet y cuáles son las advertencias?

MoveNet es preciso y fiable para tomas claras, bien iluminadas y mayormente de frente de una sola persona, por eso es popular para contar repeticiones, revisar técnica y trabajo postural. Las advertencias importan para uso profesional: es DE UNA SOLA PERSONA — localiza un cuerpo por cuadro y no devuelve varias personas; es solo 2D — no hay profundidad 3D real, así que el eje z no se puede medir; y la precisión se degrada con oclusión (extremidades ocultas tras el torso), desenfoque de movimiento, ángulos de cámara extremos, ropa holgada y mala iluminación. Las vistas laterales son más difíciles que las frontales porque cadera y hombro se solapan en 2D. Verifica siempre las articulaciones de baja confianza.

¿Cómo funciona el análisis de ángulos articulares?

Tras la detección, la herramienta calcula los ángulos de flexión de las articulaciones principales totalmente en el dispositivo a partir de los keypoints de MoveNet usando matemática vectorial de 3 puntos (atan2): codo izquierdo/derecho (hombro–codo–muñeca), hombro (codo–hombro–cadera), cadera (hombro–cadera–rodilla) y rodilla (cadera–rodilla–tobillo). Un ángulo solo se reporta cuando sus tres keypoints superan el umbral de confianza, de modo que las articulaciones poco fiables se omiten en lugar de adivinarse. Como los ángulos se miden en el espacio de la imagen, mantén la cámara aproximadamente perpendicular al plano de movimiento para obtener los números más significativos — ideal para seguir la profundidad de sentadilla, la extensión del codo o la flexión de rodilla en el tiempo.

¿Puedo exportar keypoints y ángulos articulares a JSON o CSV?

Sí. Una vez detectada la pose puedes descargar la imagen anotada como PNG, copiar los datos estructurados al portapapeles o descargar un archivo JSON o CSV. Cada exportación contiene los 17 keypoints con sus puntuaciones de confianza, los ángulos articulares calculados en grados, el modelo usado y el umbral de confianza. Lo más importante: las coordenadas se proporcionan TANTO en el espacio del lienzo reducido como en la resolución original (la herramienta guarda el factor de escala aplicado al redimensionar imágenes grandes), de modo que los flujos profesionales de movimiento o biomecánica pueden mapear los resultados directamente sobre la imagen original.

¿Funciona en móvil y qué tamaño tiene la descarga del modelo?

Sí — funciona en cualquier navegador móvil moderno con soporte WebGL. El modelo MoveNet se descarga una vez (unos 5MB para Lightning o 12MB para Thunder) y luego queda en caché del navegador, por lo que las detecciones repetidas son instantáneas y siguen funcionando sin conexión. En móviles se recomienda Lightning para la tasa de fotogramas más fluida en webcam. Si WebGL no está disponible, la herramienta recurre al backend de CPU más lento y muestra un error claro si el modelo no puede cargarse.

Ver también

HERRAMIENTAS IA33

WUTOOLS