Segurança para pipelines de IA

Detector de Prompt Injection

Descubra se um PDF esconde instruções maliciosas para subverter sistemas de IA — texto invisível, scripts embutidos e comandos disfarçados.

O que o detector identifica

Os principais vetores usados para manipular sistemas de IA que processam documentos.

Texto oculto

Spans com cor quase branca, fonte minúscula ou posicionados fora da página — invisíveis ao leitor humano, mas lidos por pipelines de IA.

Conteúdo de injection

Comandos para ignorar instruções, redefinir o papel do modelo, revelar o system prompt ou exfiltrar dados — em português e inglês.

Caracteres invisíveis

Caracteres Unicode de largura zero (que fragmentam palavras para burlar filtros) e controles bidirecionais (que invertem a ordem de leitura extraída).

Scripts e ações automáticas

JavaScript embutido, /OpenAction, /Launch, /SubmitForm e arquivos anexados. A combinação auto-executável é sinalizada como crítica.

Estrutura anômala do PDF

/ActualText divergente, campos de formulário ocultos (AcroForm), camadas opcionais (OCG) e conteúdo adicionado após a assinatura digital.

Metadados e nome do arquivo

Título, autor, palavras-chave e o próprio nome do arquivo são varridos — todos costumam ser entregues ao modelo junto do conteúdo.

Perguntas frequentes

Como a análise é feita?

Em três frentes: detecção de texto oculto (via inspeção dos spans do PDF), varredura estrutural do arquivo (scripts e ações automáticas) e classificação de conteúdo por dois passes — um de expressões regulares bilíngue e um modelo de linguagem (LLM). O texto do documento é tratado como dado não-confiável e nunca executado.

O detector remove ou corrige a injection?

Não. Esta ferramenta é de diagnóstico: ela aponta os achados, a severidade e o trecho ofensor para que você decida se é seguro processar o PDF com sistemas de IA. Para remover dados pessoais, use a ferramenta de anonimização.

Quanto custa?

1 crédito por página analisada — o mesmo saldo usado na anonimização. O arquivo é processado em memória e não é armazenado.

Um resultado 'limpo' garante que o PDF é seguro?

Não há garantia de 100% de cobertura. A análise reduz drasticamente o risco ao cobrir os vetores conhecidos, mas técnicas novas podem escapar. A responsabilidade pela decisão de uso é do usuário.