Corretor Gramatical e Parafraseador com IA
Corretor gramatical e parafraseador com IA grátis. Verifique erros de gramática, obtenha sugestões e reescreva textos instantaneamente.
Sobre o Corretor Gramatical e Parafraseador com IA
Nosso Corretor Gramatical e Parafraseador usa a API do LanguageTool para verificação gramatical avançada e o modelo PEGASUS da Hugging Face para parafraseamento inteligente. O corretor gramatical analisa seu texto em busca de erros de ortografia, gramática, estilo e pontuação com sugestões contextualizadas.
O parafraseador IA usa aprendizado profundo baseado em transformers para gerar alternativas com som natural enquanto preserva o significado. Ambos os recursos requerem conexão à internet para acessar APIs de IA poderosas baseadas em nuvem. Nota: Seu texto é enviado para serviços externos para processamento. Veja também nosso Resumidor de Texto com IA e Tradutor IA.
Meu texto é enviado a um servidor ao usar este corretor gramatical?
Não. Este Corretor Gramatical e Parafraseador com IA roda inteiramente no seu navegador usando Transformers.js e WebAssembly. O modelo de linguagem é baixado uma única vez do CDN do Hugging Face (e fica em cache local), e depois toda a correção e paráfrase acontece no seu CPU ou GPU sem o texto sair do dispositivo. Não há chamadas a um backend, nem registros, nem telemetria do seu conteúdo. Isso é crítico para contratos jurídicos, notas médicas, memorandos internos e redações estudantis em que a confidencialidade importa. Você pode verificar abrindo o DevTools e observando que nenhuma requisição XHR sai com seu texto depois que o modelo termina de carregar.
Qual modelo de linguagem a ferramenta usa por baixo dos panos?
O backbone padrão é uma variante quantizada de T5 ou FLAN-T5 servida via Hugging Face Transformers.js, normalmente entre 60M e 250M parâmetros para manter o download abaixo de 100 MB e a inferência em tempo real num notebook intermediário. T5 é um transformer codificador-decodificador ajustado em conjuntos de correção de erros gramaticais (JFLEG, BEA-2019) e paráfrase (PAWS). O modelo é carregado com ONNX Runtime Web em quantização INT8, trocando 1 ou 2 pontos BLEU por uma redução de 4x no tamanho e ganho de 2x a 3x na velocidade em relação a FP32. Para textos longos, a ferramenta divide a entrada por frases para caber na janela de 512 tokens.
Qual a precisão das correções comparada a Grammarly ou LanguageTool?
Em benchmarks GEC padrão (CoNLL-2014, BEA-2019), modelos pequenos baseados em T5 atingem F0.5 de cerca de 50 a 60, enquanto sistemas comerciais como o Grammarly ou modelos da classe GPT-4 ficam entre 65 e 75. Na prática, a ferramenta captura a maior parte dos erros de concordância, artigos, preposições e tempos verbais, mas pode deixar passar nuances de estilo, idiomatismos e jargão técnico. O LanguageTool combina regras e ML e tende a ser mais forte em idiomas europeus que não inglês. Para documentos críticos, passe o texto pela ferramenta para uma varredura rápida local e depois revise as sugestões manualmente.
Por que a paráfrase às vezes muda o sentido da minha frase?
Modelos de paráfrase são treinados com pares em que o alvo mantém a ideia mas muda a redação — eles otimizam diversidade superficial, não fidelidade semântica. Quando a entrada contém entidades nomeadas raras, negações, restrições numéricas ou cláusulas aninhadas, o decodificador pode descartar ou inverter tokens para manter fluência, alterando silenciosamente o sentido. Isso é chamado de deriva semântica e é uma limitação conhecida dos parafraseadores seq2seq. Para mitigar, reduza temperature/top-p (reescrita mais conservadora), divida frases longas antes da paráfrase e releia a saída antes de publicar. Se a preservação de sentido for crítica, parafraseie só os sintagmas nominais ou use o modo de sugestão.

Posso rodar o modelo na minha GPU para inferência mais rápida?
Sim. O Transformers.js detecta automaticamente WebGPU no Chrome 113+ e Edge, e cai para WebAssembly com SIMD em outros navegadores. Com WebGPU ativo, corrigir um parágrafo de 200 palavras cai de 3 a 5 segundos (WASM, CPU de 4 núcleos) para cerca de 0,5 a 1 segundo (GPU integrada). Você confirma o backend ativo abrindo o Console do DevTools e procurando a linha device: webgpu emitida pelo ONNX Runtime Web. Em Apple Silicon e GPUs Nvidia/AMD recentes o ganho é ainda maior: um T5-base quantizado processa 30 a 50 tokens por segundo no WebGPU contra 8 a 12 no WASM.
A ferramenta funciona offline depois que o modelo é baixado?
Sim — após o primeiro carregamento bem-sucedido, os arquivos ONNX e o tokenizer ficam armazenados no Cache Storage do navegador (amigável a service workers) e no IndexedDB. Você pode desconectar da internet, recarregar a página e a ferramenta continuará funcionando enquanto o cache sobreviver. A maioria dos navegadores mantém modelos em cache por semanas ou meses, a menos que você limpe os dados do site ou esteja sem espaço em disco. Isso é útil em aviões, em redes seguras ou em regiões com conexão intermitente. Para uso offline garantido, instale a página como PWA (onde permitido), assim o service worker fixa os arquivos do modelo.
Qual a diferença entre quantização INT8 e FP16 — qual preferir?
A quantização reduz a precisão dos pesos do modelo de ponto flutuante de 32 bits para representações com menos bits. INT8 (inteiros de 8 bits) reduz o tamanho cerca de 4x e é o padrão para WebAssembly porque a maioria das CPUs não tem caminho nativo FP16. FP16 (ponto flutuante de 16 bits) reduz o tamanho 2x, preserva mais faixa numérica que INT8 e é preferido no WebGPU onde GPUs modernas aceleram meia precisão nativamente. Para correção gramatical a diferença de qualidade entre INT8 e FP16 é mínima — geralmente menos de 1 BLEU — então tamanho e velocidade dominam a decisão. A ferramenta usa INT8 por padrão; se precisar de qualidade máxima, passe quantized: false para baixar os pesos FP32 completos.
Por que ONNX Runtime Web é preferido a TensorFlow.js para esta tarefa?
ONNX é um formato portátil de modelos que permite rodar o mesmo modelo treinado em backends PyTorch, TensorFlow e JAX, e a pilha oficial de navegador da Hugging Face (Transformers.js) é construída sobre ONNX Runtime Web. O TFJS é ótimo para modelos originados em TensorFlow/Keras e brilha em pipelines de visão, mas a maior parte da pesquisa moderna em NLP publica pesos em PyTorch, que convertem naturalmente para ONNX. ONNX Runtime Web também tem fusão de operadores mais agressiva, melhor cobertura WebGPU em 2026 e um binário de inferência mais enxuto. Para um corretor gramatical que carrega um T5 do Hugging Face Hub com uma linha de código, Transformers.js + ONNX é o caminho de menor resistência.
