Estimateur de Profondeur AI
Générateur gratuit de carte de profondeur dans le navigateur. MiDaS IA estime la profondeur relative d'une photo. Palettes, histogramme, export PNG 16 bits.
À Propos de l'Estimateur de Profondeur AI
L'Estimateur de Profondeur AI utilise MiDaS (Monocular Depth Estimation in the Wild), un modèle d'apprentissage profond de pointe qui peut estimer la profondeur à partir d'une seule image 2D. Il crée une carte de profondeur montrant les distances relatives des objets dans la scène. Tout le traitement se fait directement dans votre navigateur - aucune image n'est envoyée à un serveur.
Mes photos sont-elles téléversées quand je lance l'estimation de profondeur ?
Non. L'Estimateur de Profondeur AI s'exécute entièrement dans votre navigateur via ONNX Runtime Web (sans transformers.js, sans backend). Votre photo est décodée dans un Canvas en mémoire, redimensionnée en 256x256, puis passée au modèle MiDaS exécuté sur votre CPU (WebAssembly) ou GPU (WebGPU). La carte de profondeur est rendue localement et ne quitte jamais l'appareil — vous pouvez le vérifier dans l'onglet Network des DevTools : aucune requête ne transporte les octets de votre image. C'est important pour les photos personnelles, les scènes sensibles ou tout contenu que vous ne voulez pas envoyer à une API cloud. Les poids du modèle (~66 Mo) sont mis en cache au premier lancement, donc les estimations suivantes sont plus rapides et fonctionnent hors ligne.
Quel modèle et quelle résolution d'entrée cet outil utilise-t-il ?
Il utilise MiDaS v2.1 small (midas_v21_small_256.onnx), le réseau de profondeur monoculaire éprouvé d'Intel, entraîné sur de nombreux jeux de données pour généraliser entre scènes intérieures et extérieures. Le modèle prend une entrée RGB fixe de 256x256 normalisée selon les statistiques ImageNet (soustraction de la moyenne, division par l'écart-type) avant l'inférence, puis la carte prédite est rééchelonnée aux dimensions de votre image pour l'affichage et l'export. C'est un modèle unique et fixe — pas de sélecteur de modèle, pas de curseur de résolution, pas de mode webcam. Le compromis : vitesse et petit téléchargement contre une résolution fixe modeste ; les détails fins aux bords peuvent être adoucis.
La sortie est-elle une profondeur relative ou métrique (distance réelle) ?
Profondeur relative uniquement. MiDaS prédit une profondeur inverse (disparité), donc l'outil indique quels pixels sont plus proches ou plus loin que d'autres, mais pas de distances absolues en mètres. Après l'inférence, les valeurs sont normalisées par min-max sur [0,1] avec la convention 1,0 = le plus proche (premier plan) et 0,0 = le plus loin (arrière-plan). Une vraie profondeur métrique nécessiterait une caméra stéréo, du LiDAR ou un modèle fine-tuné pour la métrique, et dépend fortement de la ressemblance de la scène avec la distribution d'entraînement. Traitez les pourcentages de zone Proche/Médiane/Loin et l'histogramme comme des estimations relatives, pas des mesures.

En quoi les palettes, l'histogramme et les vues côte à côte/superposée aident-ils ?
Vous pouvez rendre la carte de profondeur avec six palettes perceptuelles (inferno, viridis, plasma, magma, niveaux de gris, turbo) pour lire la structure d'un coup d'œil, et basculer entre Carte de Profondeur Seule, Côte à Côte avec l'original ou une Superposition semi-transparente à opacité réglable. Le bouton Inverser inverse la luminosité pour que Proche=sombre si vous préférez cette convention. Le panneau de statistiques indique la profondeur normalisée min/moyenne/max, découpe la scène en zones Proche/Médiane/Loin et trace un histogramme de 32 classes de la distribution de profondeur — utile pour vérifier la séparation premier plan/arrière-plan avant d'utiliser la carte pour du bokeh ou du compositing.
Puis-je exporter un PNG 16 bits et un JSON pour Blender, Photoshop ou Nuke ?
Oui. Outre le PNG de profondeur coloré et le PNG en niveaux de gris 8 bits, vous pouvez exporter un véritable PNG en niveaux de gris 16 bits. Le 8 bits n'a que 256 niveaux et provoque des bandes visibles sur les dégradés doux (sols, ciel) ; le 16 bits donne 65 536 niveaux, le vrai livrable pour le displacement mapping dans Blender, le flou par profondeur dans Photoshop et le compositing DOF/parallaxe dans Nuke. Photoshop, GIMP, Blender et Krita chargent le PNG 16 bits nativement. Un fichier JSON associé est aussi exporté avec le nom du modèle, la résolution d'entrée 256x256, la palette, l'indicateur d'inversion, les statistiques min/moyenne/max et les pourcentages de zone Proche/Médiane/Loin, pour que vos résultats restent reproductibles et vérifiables.
Pourquoi l'outil affiche-t-il un badge WebGPU ou WASM, et lequel est plus rapide ?
Au chargement, l'outil tente d'abord le fournisseur d'exécution WebGPU et bascule sur WebAssembly (avec SIMD et jusqu'à 4 threads) si WebGPU n'est pas disponible, puis affiche un badge indiquant le backend actif. WebGPU délègue les calculs matriciels à votre GPU et est généralement plusieurs fois plus rapide que le WASM CPU seul, surtout sur les grandes images. Sur les navigateurs sans WebGPU (anciens Safari, certains appareils mobiles), l'outil utilise automatiquement WASM pour fonctionner partout — seule la vitesse change, pas le résultat.
Pourquoi les bords des objets sont-ils parfois adoucis sur la carte ?
Parce que MiDaS v2.1 small fonctionne à une entrée fixe de 256x256, les structures fines comme cheveux, clôtures, fils, verre et reflets peuvent se fondre dans le premier plan ou l'arrière-plan, et la carte rééchelonnée hérite de cet adoucissement. C'est attendu pour un petit modèle monoculaire rapide. Pour la parallaxe et les effets de faible profondeur de champ, le résultat est généralement assez cohérent ; pour des bords plus nets, vous pouvez post-traiter la carte 16 bits exportée avec un filtrage préservant les bords (guidé/bilatéral) dans votre logiciel 3D ou de compositing.
