Detectar

Imagem

Analisador

Estimador de Poses AI

Estimador de poses AI no navegador. O MoveNet detecta 17 pontos-chave COCO no dispositivo (privado, sem envio), calcula ângulos e exporta JSON ou CSV.

Usa o modelo AI MoveNet para detecção de poses em tempo real. O modelo é baixado automaticamente quando você detecta uma pose pela primeira vez (~5MB).

Enviar Imagem

Selecione uma imagem do seu dispositivo

Usar Webcam

Detecção de poses em tempo real

De URL

Carregar imagem de endereço web

Selecionar Imagem

Arraste e solte uma imagem aqui

ou clique para procurar (JPG, PNG, WebP)

Tem feedback? Reporte bugs, sugira recursos ou compartilhe suas ideias — lemos todos

Sobre o Estimador de Poses AI

O Estimador de Poses AI roda o MoveNet (Lightning e Thunder) do TensorFlow.js inteiramente no seu navegador no backend WebGL. Ele detecta uma única pessoa e retorna 17 pontos-chave 2D no formato COCO — nariz, olhos, orelhas, ombros, cotovelos, pulsos, quadris, joelhos e tornozelos — cada um com um escore de confiança. O modelo (~5MB para Lightning, ~12MB para Thunder) é baixado uma vez e fica em cache. Além dos pontos-chave, a ferramenta calcula os ângulos de flexão das articulações principais (cotovelo, ombro, quadril, joelho) e permite exportar tudo em JSON ou CSV, com coordenadas tanto do canvas reduzido quanto da resolução original. Todo o processamento acontece localmente - nenhuma imagem, vídeo ou dado de pose é enviado a um servidor.

Este estimador de poses envia minha webcam ou foto para um servidor?

Não. O Estimador de Poses AI roda todo o pipeline de detecção de pose no seu navegador usando MoveNet via TensorFlow.js. Seu stream de webcam ou foto enviada é decodificado em um canvas em memória, o detector de keypoints MoveNet roda na sua própria GPU (backend WebGL) ou CPU, e os 17 keypoints resultantes são desenhados de volta no canvas — sem um único byte sair do dispositivo. Sem upload, sem telemetria, sem inferência na nuvem. Isso é essencial para apps de fitness que não devem transmitir seus vídeos de treino a terceiros, para triagem de postura onde a privacidade importa e para sobreposições ao vivo de baixa latência.

Quais 17 keypoints o MoveNet detecta?

O MoveNet retorna os 17 keypoints no formato COCO: nariz, olho esquerdo/direito, orelha esquerda/direita, ombro esquerdo/direito, cotovelo esquerdo/direito, pulso esquerdo/direito, quadril esquerdo/direito, joelho esquerdo/direito e tornozelo esquerdo/direito. Cada keypoint carrega uma coordenada x/y em pixels e um escore de confiança de 0 a 1. Não há pontos de mão, pé ou malha facial, nem valor z/profundidade — a saída é de uma única pessoa e só 2D. O controle deslizante de confiança permite ocultar as articulações de baixa confiança do esqueleto e do cálculo de ângulos.

Lightning vs Thunder — qual a diferença?

Ambos são detectores MoveNet de uma única pessoa que emitem os mesmos 17 keypoints. Lightning (~5MB) é otimizado para velocidade e é o padrão — ideal para rastreamento por webcam em tempo real e celulares, frequentemente 30-60 fps numa GPU de notebook recente. Thunder (~12MB) é um modelo maior e mais preciso, melhor para analisar imagens estáticas onde a precisão importa, ao custo de velocidade. Você pode alternar entre eles nas Configurações de Detecção; o detector recarrega na próxima detecção.

Estimador de Poses AI — Estimador de poses AI no navegador. O MoveNet detecta 17 pontos-chave COCO no dispositivo (privado, sem envio), calcula — **Estimador de Poses AI**

Quão preciso é o MoveNet e quais as ressalvas?

O MoveNet é preciso e confiável para fotos claras, bem iluminadas e majoritariamente frontais de uma única pessoa, por isso é popular para contagem de repetições, checagem de forma e trabalho de postura. As ressalvas importam para uso profissional: é de UMA ÚNICA PESSOA — localiza um corpo por quadro e não retorna várias pessoas; é só 2D — não há profundidade 3D real, então o eixo z não pode ser medido; e a precisão cai com oclusão (membros escondidos atrás do tronco), desfoque de movimento, ângulos de câmera extremos, roupas largas e pouca luz. Vistas laterais são mais difíceis que frontais porque quadril e ombro se sobrepõem em 2D. Sempre confira articulações de baixa confiança.

Como funciona a análise de ângulos articulares?

Após a detecção, a ferramenta calcula os ângulos de flexão das articulações principais inteiramente no dispositivo a partir dos keypoints do MoveNet usando matemática vetorial de 3 pontos (atan2): cotovelo esquerdo/direito (ombro–cotovelo–pulso), ombro (cotovelo–ombro–quadril), quadril (ombro–quadril–joelho) e joelho (quadril–joelho–tornozelo). Um ângulo só é reportado quando os três keypoints dele passam do limite de confiança, então articulações não confiáveis são puladas em vez de adivinhadas. Como os ângulos são medidos no espaço da imagem, mantenha a câmera mais ou menos perpendicular ao plano de movimento para os números mais significativos — ideal para acompanhar profundidade de agachamento, extensão do cotovelo ou flexão de joelho ao longo do tempo.

Posso exportar keypoints e ângulos articulares em JSON ou CSV?

Sim. Uma vez detectada a pose, você pode baixar a imagem anotada em PNG, copiar os dados estruturados para a área de transferência ou baixar um arquivo JSON ou CSV. Cada exportação contém os 17 keypoints com escores de confiança, os ângulos articulares calculados em graus, o modelo usado e o limite de confiança. Mais importante, as coordenadas são fornecidas TANTO no espaço do canvas reduzido quanto na resolução original (a ferramenta salva o fator de escala aplicado ao redimensionar imagens grandes), então fluxos profissionais de movimento ou biomecânica podem mapear os resultados direto na imagem de origem.

Funciona no celular e qual o tamanho do download do modelo?

Sim — funciona em qualquer navegador móvel moderno com suporte a WebGL. O modelo MoveNet é baixado uma vez (cerca de 5MB para Lightning ou 12MB para Thunder) e então fica em cache no navegador, então detecções repetidas são instantâneas e continuam funcionando offline. Em celulares, o Lightning é recomendado para a taxa de quadros mais suave na webcam. Se o WebGL não estiver disponível, a ferramenta recorre ao backend de CPU mais lento e mostra um erro claro se o modelo não puder carregar.

Veja também

FERRAMENTAS DE IA33

WUTOOLS