Aula 4

Seguranca nos Prompts e Agentes de IA

Formula mental

Postura de seguranca

Execucao segura = sandbox + isolamento de segredos + verificacao de dependencias

Use esta formula como uma lente de leitura, nao como uma verdade mecanica. O objetivo e tornar a tese auditavel antes da decisao.

Exemplo de mercado

Aplicacao do Seguranca nos Prompts e Agentes de IA

Contexto

Escolha um projeto real e separe evidencias observaveis de narrativa publica.

Leitura de preço

Compare a leitura contextual com odds, liquidez e timing do movimento de mercado.

Hipótese

Escreva uma hipotese que admita intervalo de incerteza e criterio de invalidacao.

Risco

Agente executando comandos destrutivos, vazamento de chaves em logs.

Modo de falha

Agente executando comandos destrutivos, vazamento de chaves em logs.

Este erro reduz a qualidade da decisao porque troca processo verificavel por interpretacao conveniente.

Checklist de decisão

Checklist do Seguranca nos Prompts e Agentes de IA

Docker ativo para execucao de scripts
.env excluido do versionamento
requirements.txt com versoes fixas
Aprovacao manual habilitada antes de execucao sensivel

"Codigo gerado por IA"

"Sandbox / Container"

"Injecao de segredos via env"

"Validacao de dependencias"

"Gate humano?"

"Execucao auditavel"

"Rejeicao e log"

"Codigo gerado por IA" -> "Sandbox / Container"

"Sandbox / Container" -> "Injecao de segredos via env"

"Injecao de segredos via env" -> "Validacao de dependencias"

"Validacao de dependencias" -> "Gate humano?"

"Gate humano?" Sim -> "Execucao auditavel"

"Gate humano?" Nao -> "Rejeicao e log"



    01
    sandbox
    =
    Docker isolado
     // limita superficie de ataque
  
    02
    secrets
    =
    .env + .gitignore
     // nunca no codigo-fonte
  
    03
    gate
    =
    aprovacao manual
     // humano antes de execucao sensivel

Seguranca nos Prompts e Agentes de IA

Ideia Central A velocidade de geração de código por IA só se converte em vantagem analítica quando a execução é contida, auditável e isolada de ativos sensíveis. Sem controle de runtime, a automação introduz risco sistêmico que corrompe pipelines de pesquisa e compromete a integridade dos dados.

Modelo Mental Zero Trust para Execução de Código. Trate todo artefato gerado por IA como potencialmente hostil até que seja validado em ambiente restrito. A confiança não é concedida pela origem (modelo ou prompt), mas pela arquitetura de isolamento, validação determinística e gate humano.

O que é Conjunto de práticas e controles para isolar a execução de scripts, gerenciar credenciais fora do código-fonte, verificar dependências antes da instalação e mitigar riscos de injeção em prompts e agentes autônomos. Inclui sandboxing via contêineres, gestão de variáveis de ambiente, pinning de pacotes, sanitização de entrada/saída e validação de schema antes da execução em produção.

Por que importa Em pipelines de pesquisa de futebol, a extração de odds, a normalização de estatísticas e o cálculo de probabilidades dependem de integridade de dados e estabilidade de ambiente. Um agente que executa código sem supervisão pode, por falha lógica ou prompt injection, vazar chaves de API, instalar dependências comprometidas (typosquatting), sobrescrever datasets históricos ou executar comandos destrutivos no host. A IA acelera a escrita, mas não substitui o desenho de arquitetura, a gestão de risco operacional nem a disciplina de validação. A incerteza inerente à geração de modelos de linguagem exige barreiras técnicas explícitas.

Mecanismo O controle de segurança opera em quatro camadas interdependentes:

Isolamento de Execução: Uso de contêineres (Docker) com imagens base mínimas, usuário não-root, sistema de arquivos efêmero e rede restrita. O código roda fora do ambiente host, limitando o blast radius de falhas.
Gestão de Segredos: Credenciais nunca são versionadas. Variáveis sensíveis são injetadas via .env ou secret managers em runtime. O .gitignore bloqueia explicitamente arquivos de configuração, logs e caches.
Verificação de Dependências: requirements.txt com versões fixas e, quando possível, hashes de integridade. Instalação com --no-cache-dir e validação de origem (PyPI oficial). Rejeição de pacotes com nomes ambíguos ou mantenedores não verificados.
Defesa contra Prompt Injection e Validação de Saída: System prompts com restrições explícitas de escopo, proibição de execução de shell não autorizada e definição de schema de saída (JSON/Pydantic). Sanitização de inputs externos e gate humano para aprovação antes de qualquer operação com dados ou rede.

Exemplo Aplicado (Futebol/Mercado) Um pesquisador solicita a um agente a geração de um script para extrair odds decimais de uma API de mercado esportivo, calcular a probabilidade implícita e remover o overround. Sem isolamento, o script pode conter uma chamada acidental a os.system(), instalar um pacote com nome similar ao solicitado (football-odds vs football_odds_lib) ou logar a chave de API em stdout por debug esquecido. Com a arquitetura de segurança aplicada, o script roda dentro de um contêiner Docker com acesso de rede limitado apenas ao endpoint da API. A chave é injetada via variável de ambiente no momento da execução. O requirements.txt fixa versões e o pipeline valida o schema de saída antes de gravar no diretório de dados. Se o prompt contiver instruções conflitantes ou tentar acessar caminhos do host, o sistema de validação rejeita a execução e exige revisão. O resultado é um fluxo auditável, onde cada etapa de extração e cálculo é rastreável e contida.

Configuracao de ambiente de desenvolvimento isolado e reproducivel.

Decomposição no Quadro (Blackboard Breakdown)

Definição do Ambiente Base: Escolha de imagem Docker oficial e leve (python:3.11-slim). Configuração de usuário não-root (RUN useradd -m researcher && USER researcher). Limitação de recursos (--memory, --cpus) para evitar loops infinitos consumindo host.
Estrutura de Segredos: Criação de .env.example com chaves fictícias. .gitignore incluindo .env, *.log, __pycache__/, venv/. Injeção em runtime via docker run --env-file .env.
Controle de Dependências: pip freeze > requirements.txt após validação local. Adição de --require-hashes quando aplicável. Script de instalação com pip install -r requirements.txt --no-cache-dir --trusted-host pypi.org.
Hardening de Prompt: System prompt define papel, escopo, restrições de execução e formato de saída. Exemplo: Você é um gerador de código Python para extração de dados. Não execute comandos de sistema. Retorne apenas código válido. Valide schema de saída antes de prosseguir.
Gate de Execução: Pipeline implementa etapa de revisão humana ou validação automática (linting + schema check). Só após aprovação o contêiner é iniciado. Logs são redirecionados para arquivo isolado, sem exposição de variáveis sensíveis.
Auditoria Pós-Execução: Verificação de integridade do dataset gerado, comparação de checksums, análise de logs para padrões anômalos. Registro de versão do código, hash do contêiner e parâmetros de execução para rastreabilidade.

Modo de Falha Execução por Confiança Padrão (Trust-by-Default). O pesquisador assume que o código gerado por IA é seguro, roda diretamente no host, armazena credenciais em scripts e ignora a verificação de dependências. Um prompt mal estruturado ou uma resposta alucinada introduz subprocess.run() não intencional, instala um pacote comprometido ou vaza a chave de API em logs públicos. O pipeline é contaminado, dados históricos são sobrescritos, e a modelagem probabilística subsequente opera sobre base corrompida. A falha não é técnica isolada, mas arquitetural: ausência de sandbox, gestão inadequada de segredos e falta de validação determinística antes da execução.

Checklist

Docker configurado com imagem base mínima e usuário não-root
.env presente no .gitignore e nunca versionado
requirements.txt com versões fixas e validação de origem
System prompt com escopo, restrições de execução e schema de saída definido
Gate humano ou validação automática (lint + schema) antes de rodar contêiner
Rede restrita no contêiner (apenas endpoints necessários)
Logs isolados e auditados para ausência de credenciais expostas
Registro de hash do código, versão do contêiner e parâmetros de execução

Exercício Prático

Crie um diretório lesson4_sandbox e inicialize um repositório Git.
Adicione .gitignore cobrindo .env, *.log, __pycache__/, venv/.
Crie .env.example com API_KEY=fake_key_123 e DATA_DIR=/data.
Escreva um Dockerfile baseado em python:3.11-slim, crie usuário não-root, copie requirements.txt e app.py.
Crie app.py que lê API_KEY via os.environ.get(), valida se não está vazia e imprime apenas um hash SHA-256 da chave (nunca a chave em texto).
Monte .env com valores fictícios e execute: docker build -t research-sandbox . && docker run --env-file .env --network none research-sandbox.
Valide nos logs que a chave não aparece em texto claro, que o contêiner não acessou a rede e que o código rodou com usuário restrito.
Simule um prompt injection adicionando uma linha no código gerado que tenta ler /etc/passwd. Observe como o isolamento de FS e a ausência de permissões root bloqueiam a operação. Documente o comportamento.

Conclusão Operacional Velocidade de geração não substitui rigor de execução. O isolamento de ambiente, a gestão determinística de segredos e a validação explícita de prompts e dependências são a infraestrutura que transforma código de IA em ferramenta de pesquisa auditável. Sem essas camadas, a automação amplifica erros e expõe o pipeline a riscos operacionais que comprometem a integridade dos dados e a confiabilidade da modelagem. Controle não é obstáculo à produtividade; é pré-requisito para escala sustentável.

Seguranca nos Prompts e Agentes de IA