Mais jogos no WuGames.ioPatrocinadoDescubra jogos de navegador grátis — jogue na hora, sem download nem cadastro.Jogar

Estimador de Profundidade AI

Gerador gratuito de mapa de profundidade no navegador. MiDaS AI estima profundidade relativa de qualquer foto. Mapas de cor, histograma, PNG 16 bits.

AI Usa o modelo AI MiDaS para estimação de profundidade monocular. O modelo é baixado automaticamente quando você estima profundidade pela primeira vez (~66MB).
Upload
Arraste e solte uma imagem aqui
ou clique para procurar (JPG, PNG, WebP)

Sobre o Estimador de Profundidade AI

O Estimador de Profundidade AI usa MiDaS (Monocular Depth Estimation in the Wild), um modelo de aprendizado profundo de última geração que pode estimar profundidade a partir de uma única imagem 2D. Ele cria um mapa de profundidade mostrando distâncias relativas dos objetos na cena. Todo o processamento acontece diretamente no seu navegador - nenhuma imagem é enviada para qualquer servidor.

Minhas fotos são enviadas quando eu rodo a estimativa de profundidade?

Não. O Estimador de Profundidade AI roda inteiramente no seu navegador usando ONNX Runtime Web (sem transformers.js, sem backend). Sua foto é decodificada em um Canvas na memória, redimensionada para 256x256 e passada ao modelo MiDaS rodando na sua CPU (WebAssembly) ou GPU (WebGPU). O mapa de profundidade é renderizado localmente e nunca sai do dispositivo — você pode confirmar na aba Network do DevTools que nenhuma requisição carrega os bytes da sua imagem. Isso importa para fotos pessoais, cenas sensíveis ou qualquer conteúdo que você não queira enviar a uma API na nuvem. Os pesos do modelo (~66MB) ficam em cache na primeira execução, então as estimativas seguintes são mais rápidas e funcionam offline.

Qual modelo e resolução de entrada esta ferramenta usa?

Ela usa o MiDaS v2.1 small (midas_v21_small_256.onnx), a consagrada rede de profundidade monocular da Intel treinada em muitos datasets para generalizar entre cenas internas e externas. O modelo recebe uma entrada RGB fixa de 256x256 normalizada com estatísticas ImageNet (subtrair a média, dividir pelo desvio) antes da inferência, e então o mapa previsto é reescalado para as dimensões da sua imagem para exibição e exportação. É um único modelo fixo — não há seletor de modelo, controle de resolução nem modo webcam. O compromisso é velocidade e download pequeno em troca de uma resolução fixa modesta; detalhes finos nas bordas podem ficar suaves.

A saída é profundidade relativa ou métrica (distância real)?

Apenas profundidade relativa. O MiDaS prevê profundidade inversa (disparidade), então a ferramenta diz quais pixels estão mais perto ou longe que outros, mas não distâncias absolutas em metros. Após a inferência os valores são normalizados por mín-máx para [0,1] com a convenção de que 1,0 = mais perto (primeiro plano) e 0,0 = mais longe (fundo). Profundidade métrica real exigiria câmera estéreo, LiDAR ou um modelo ajustado a métrica, e depende muito de a cena coincidir com a distribuição de treinamento. Trate os percentuais de zona Perto/Média/Longe e o histograma como estimativas relativas, não medições.

Estimador de Profundidade AI — Gerador gratuito de mapa de profundidade no navegador. MiDaS AI estima profundidade relativa de qualquer foto. Mapas de
Estimador de Profundidade AI

Como os mapas de cor, o histograma e as vistas lado a lado/sobreposta ajudam?

Você pode renderizar o mapa de profundidade com seis mapas de cor perceptuais (inferno, viridis, plasma, magma, escala de cinza, turbo) para ler a estrutura num relance, e alternar entre Apenas Mapa de Profundidade, Lado a Lado com o original ou uma Sobreposição semitransparente com opacidade ajustável. O botão Inverter troca o brilho para que Perto=escuro se você preferir essa convenção. O painel de estatísticas reporta profundidade normalizada mín./média/máx., divide a cena em zonas Perto/Média/Longe e desenha um histograma de 32 caixas da distribuição de profundidade — útil para checar a separação primeiro plano/fundo antes de usar o mapa para bokeh ou composição.

Posso exportar um PNG de 16 bits e JSON para Blender, Photoshop ou Nuke?

Sim. Além do PNG colorido e do PNG em escala de cinza de 8 bits, você pode exportar um verdadeiro PNG em escala de cinza de 16 bits. 8 bits só tem 256 níveis e causa bandas visíveis em gradientes suaves (chão, céu); 16 bits dá 65.536 níveis, o verdadeiro entregável para displacement mapping no Blender, desfoque por profundidade no Photoshop e composição DOF/parallax no Nuke. Photoshop, GIMP, Blender e Krita carregam PNG de 16 bits nativamente. Um JSON anexo também é exportado com o nome do modelo, a resolução de entrada 256x256, o mapa de cor, o sinalizador de inversão, as estatísticas mín./média/máx. e os percentuais de zona Perto/Média/Longe, deixando seus resultados reprodutíveis e auditáveis.

Por que a ferramenta mostra um selo WebGPU ou WASM, e qual é mais rápido?

Ao carregar, a ferramenta tenta primeiro o provedor de execução WebGPU e recorre ao WebAssembly (com SIMD e até 4 threads) se o WebGPU não estiver disponível, e então mostra um selo indicando o backend ativo. O WebGPU descarrega a matemática matricial para a sua GPU e costuma ser várias vezes mais rápido que o WASM só de CPU, especialmente em imagens grandes. Em navegadores sem WebGPU (Safari antigo, alguns dispositivos móveis) a ferramenta usa WASM automaticamente para funcionar em todo lugar — só muda a velocidade, não o resultado.

Por que as bordas dos objetos às vezes ficam suaves no mapa?

Porque o MiDaS v2.1 small roda numa entrada fixa de 256x256, estruturas finas como cabelo, cercas, fios, vidro e reflexos podem se misturar ao primeiro plano ou ao fundo, e o mapa reescalado herda essa suavidade. Isso é esperado para um modelo monocular pequeno e rápido. Para parallax e efeitos de profundidade de campo rasa o resultado costuma ser consistente o bastante; para bordas mais nítidas você pode pós-processar o mapa de 16 bits exportado com filtragem que preserva bordas (guiada/bilateral) no seu software 3D ou de composição.