Mais jogos no WuGames.ioPatrocinadoDescubra jogos de navegador grátis — jogue na hora, sem download nem cadastro.Jogar

Conversor de Áudio para MIDI

Conversor de áudio para MIDI no navegador com detecção de tom YIN. Sem upload, prévia em piano roll, quantização e .mid pronto para sua DAW.

Info Esta ferramenta analisa arquivos de áudio para detectar tons e convertê-los para formato MIDI. Funciona melhor com áudio monofônico (linhas melódicas simples, vocais, instrumentos solo).
Upload
Arraste e solte um arquivo de áudio aqui
ou clique para navegar

Sobre o Conversor de Áudio para MIDI

Esta ferramenta online converte arquivos de áudio para formato MIDI detectando tons e notas no áudio. Usa algoritmos avançados de detecção de tom para analisar seu áudio e criar um arquivo MIDI que você pode usar em qualquer software de produção musical.

Quais formatos de áudio são suportados?

Todos os formatos de áudio comuns são suportados incluindo MP3, WAV, OGG, AAC, M4A, FLAC, OPUS e mais. Você também pode usar arquivos de vídeo (MP4, MKV, etc.) - a faixa de áudio será extraída automaticamente.

Que tipo de áudio funciona melhor?

Esta ferramenta funciona melhor com áudio monofônico - ou seja, linhas melódicas simples como vocais, flauta, violino, ou qualquer instrumento solo tocando uma nota por vez. Áudio polifônico complexo (como gravações de bandas completas ou piano com acordes) pode não converter com precisão porque múltiplas notas simultâneas são difíceis de separar.

Quão precisa é a conversão?

A precisão depende da qualidade e complexidade do áudio. Gravações limpas e isoladas com tons claros produzirão os melhores resultados. Ruído de fundo, reverberação ou sons sobrepostos podem reduzir a precisão. Você pode ajustar as configurações de sensibilidade e duração mínima da nota para melhorar os resultados para seu áudio específico.

O que é sensibilidade de detecção?

A sensibilidade controla quão suave um som precisa ser antes de ser detectado como uma nota. Sensibilidade mais baixa detectará notas mais suaves mas também pode captar ruído. Sensibilidade mais alta detectará apenas notas mais fortes e claras. Ajuste de acordo com a qualidade do seu áudio.

O que é duração mínima da nota?

Esta configuração filtra notas muito curtas que podem ser artefatos ou ruído. Se você está obtendo muitas notas falsas, aumente este valor. Se está perdendo notas rápidas (como appoggiaturas), diminua-o.

Como uso o arquivo MIDI?

O arquivo .mid baixado pode ser aberto em qualquer Estação de Trabalho de Áudio Digital (DAW) como FL Studio, Ableton Live, Logic Pro, GarageBand, Cubase, etc. Você pode então editar as notas, mudar o instrumento, quantizar o timing, ou usá-lo como ponto de partida para sua produção musical.

O que é o Piano Roll?

O piano roll é uma representação visual das notas detectadas ao longo do tempo. O eixo vertical mostra o tom (notas musicais), e o eixo horizontal mostra o tempo. Cada retângulo colorido representa uma nota detectada. Você pode usar os controles de zoom para ver mais detalhes.

Por que minha conversão está imprecisa?

Razões comuns para conversão imprecisa incluem: áudio polifônico (múltiplas notas ao mesmo tempo), ruído de fundo, reverberação ou efeitos pesados, passagens muito rápidas, ou áudio fora da faixa de tom selecionada. Tente ajustar as configurações ou usar áudio fonte mais limpo.

Conversor de Áudio para MIDI — Conversor de áudio para MIDI no navegador com detecção de tom YIN. Sem upload, prévia em piano roll, quantização e .mid
Conversor de Áudio para MIDI

Meu arquivo de áudio é enviado para um servidor?

Não! Todo o processamento acontece diretamente no seu navegador usando Web Audio API. Seu arquivo de áudio nunca sai do seu dispositivo, garantindo completa privacidade e processamento mais rápido.

O que é a configuração de faixa de tom?

A faixa de tom define as frequências mínima e máxima a detectar. Para vocais, C2-C6 geralmente funciona bem. Para instrumentos de baixo, tente C1-C4. Para instrumentos mais agudos como violino, C3-C7 pode ser melhor. Definir a faixa correta melhora a precisão e velocidade.

O que é velocidade em MIDI?

A velocidade representa quão forte uma nota é tocada, afetando seu volume. No modo Dinâmico, a velocidade é calculada do volume do áudio. No modo Fixo, todas as notas têm a mesma velocidade. O modo Dinâmico é mais expressivo mas pode variar mais.

Posso converter canto para MIDI?

Sim! Melodias vocais funcionam muito bem com esta ferramenta já que o canto é tipicamente monofônico. Para melhores resultados, use uma gravação vocal limpa sem música de fundo ou efeitos pesados.

Ele detecta acordes ou polifonia?

Não. É um transcritor monofônico: estima um tom fundamental por quadro de análise, então é excelente com material de linha única (vocais, cantarolar, baixo, synth lead, flauta, violino), mas não consegue resolver acordes nem duas notas simultâneas. Áudio polifônico (uma mixagem completa ou um piano tocando acordes) retornará o tom mais dominante por quadro, não todas as notas. Para transcrever uma progressão de acordes, isole cada parte primeiro ou toque uma nota por vez.

Como funciona a detecção de tom (YIN)?

Ela executa o algoritmo YIN inteiramente no seu navegador. O YIN calcula uma função de diferença normalizada por média cumulativa sobre cada quadro de ~46 ms e trava no vale mais profundo abaixo de um limite de clareza, refinando-o com interpolação parabólica. Escolher o melhor vale global (em vez do primeiro) evita erros de oitava ou sub-harmônicos, por isso o YIN é preciso e estável com vocais e instrumentos solo. Cada nota detectada também recebe um valor de clareza (confiança), e passagens mais altas mapeiam para maior velocidade MIDI em escala dBFS para preservar a dinâmica.

Posso quantizar o resultado na batida?

Sim. Defina uma Grade de Quantização (1/4, 1/8, 1/16, quiáltera de 1/8 ou de 1/16) e a ferramenta alinha o início de cada nota a essa grade no BPM que você digitou, para que o .mid exportado caia na grade no FL Studio, Ableton, Logic ou qualquer DAW. O controle de Intensidade da Quantização (0-100%) permite quantizar parcialmente: 100% alinha totalmente à grade, enquanto valores menores mantêm o feel humano da performance original. A quantização é aplicada antes da exportação MIDI/TXT e refletida ao vivo no piano roll, e você pode mudar a grade sem reanalisar o áudio.

Qual taxa de amostragem e volume o áudio deve ter?

Qualquer taxa de amostragem comum funciona (44.1 ou 48 kHz é ideal); a análise se adapta à taxa do arquivo. Procure um sinal limpo e bem gravado com picos por volta de -6 a -3 dBFS sem clipping. Como a velocidade é mapeada em escala dB, uma gravação normalizada gera a dinâmica mais expressiva. Todos os canais são somados em média para mono na análise, então uma melodia com pan extremo é detectada corretamente.