Rotas globais de conectividade representando agentes de IA distribuídos

Google Lançou Agentes que se Autogerenciam: Mão na Massa com Gemini Managed Agents

NeuralPulse|2 de junho de 2026|10 min de leitura|Read in English

Preparando avatar...

🎬 NeuralPulse Shorts

No Google I/O 2026, no dia 19 de maio, a Google anunciou os Managed Agents no Gemini API. O conceito é direto: uma única chamada de API provisiona um agente completo com ambiente Linux remoto, isolado e efêmero. Você não gerencia servidor, não configura Docker, não escala. Só programa o comportamento.

Isso resolve um problema real. Qualquer um que já tentou colocar um agente de IA em produção sabe o caminho: servidor Linux, ambiente isolado, orquestrador de tarefas, filas, monitoramento, segurança de sandbox... dá para gastar semanas só na infraestrutura. Os Managed Agents eliminam essa camada inteira.

Neste post, você vai entender o que mudou, por que isso importa e — na prática — como criar seu primeiro agente gerenciado em menos de 30 minutos.

O que são Managed Agents no Gemini API?

Um Managed Agent é um agente de IA que roda inteiramente na infraestrutura do Google. Você manda uma requisição HTTP e recebe de volta um ambiente de execução completo: terminal Linux, acesso a internet, execução de código, download de arquivos.

O agente que a Google disponibilizou é o Antigravity, alimentado pelo modelo Gemini 3.5 Flash. Ele consegue raciocinar, planejar, chamar ferramentas, executar código Python em sandbox e navegar na web. Tudo entregue sem você precisar instalar nada além de um cliente HTTP.

A Google descreveu assim no blog oficial:

"Managed Agents in the Gemini API removes the friction of infrastructure setup, delivering the power of the Antigravity agent harness via managed agents, with a single API call providing a fully provisioned agent with a remote sandbox." — Google AI Blog, 19 de maio de 2026 (tradução livre: "Managed Agents no Gemini API remove o atrito da configuração de infraestrutura, entregando o poder do harness do agente Antigravity via agentes gerenciados, com uma única chamada de API provisionando um agente completo com sandbox remoto.")

O pulo do gato é este: em vez de você construir a "casa" para o agente morar, o Google entrega a casa pronta. Você só define o comportamento.

Por que isso importa agora?

Até maio de 2026, montar um agente autônomo exigia empilhar várias camadas de infraestrutura. A tabela abaixo mostra o contraste:

Componente	Antes (DIY)	Com Managed Agents
Ambiente de execução	Servidor Linux + Docker	Automático (sandbox remoto)
Orquestrador de tarefas	Celery / Temporal	Built-in no Antigravity
Isolamento de segurança	cgroups + seccomp + AppArmor	Gerenciado pelo Google
Escalabilidade	Auto-scaling groups	Elástico, sem configuração
Download de artefatos	Bucket S3 + presigned URLs	API REST nativa
Custo inicial	US$ 50-200/mês só de infra (estimativa de mercado)	Custo por token — Google afirma que Gemini 3.5 Flash custa menos da metade de modelos comparáveis

A Google afirma que o Gemini 3.5 Flash custa menos da metade de modelos comparáveis. Os preços exatos serão confirmados na documentação oficial. Mas a direção é clara: em vez de gastar semanas montando infra, você gasta 30 minutos programando o comportamento.

Mão na massa — Tutorial Passo a Passo

Vamos criar um agente que analisa dados de um CSV, extrai insights e gera um relatório.

⚠️ Aviso: Os exemplos abaixo são ilustrações conceituais baseadas na documentação em preview do Google I/O 2026. Consulte a documentação oficial do Gemini API para os nomes exatos de parâmetros e endpoints, que podem mudar durante o período de preview.

Passo 1 — Setup do ambiente

Crie sua chave de API no Google AI Studio e ative o faturamento. Depois, instale as dependências:

pip install google-genai requests python-dotenv

Crie um arquivo .env na raiz do projeto:

GEMINI_API_KEY=sua_chave_aqui

Passo 2 — Primeira chamada: o agente Antigravity

Vamos fazer o agente executar um script Python para analisar um CSV. O parâmetro environment='remote' é o que ativa o sandbox gerenciado:

import os
from dotenv import load_dotenv
from google import genai

load_dotenv() client = genai.Client(api_key=os.getenv("GEMINI_API_KEY"))

response = client.models.generate_content( model="gemini-3.5-flash", contents="Write a Python script to analyze this CSV data: sales,region,value\n100,North,50\n200,South,75\n150,East,60\n180,West,90\n\nThe script should calculate total by region and find the best-performing region.", config={ "environment": "remote", "temperature": 0.2 } )

print(response.text)

Execute o script. Em segundos, o agente Antigravity — alimentado pelo Gemini 3.5 Flash — provisiona um ambiente Linux, escreve o código, executa e retorna o resultado. Você não viu nada disso, só recebeu a saída.

Passo 3 — Conversa de múltiplos turnos

Agentes de verdade raramente resolvem tudo em uma chamada. Para manter contexto entre interações, use previous_interaction_id e environment_id:

# Primeira interação
resp1 = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Create a Python script that fetches the latest news about AI from a public API",
    config={"environment": "remote"}
)

env_id = resp1.environment_id prev_id = resp1.interaction_id

Segunda interação — o agente lembra do contexto

resp2 = client.models.generate_content( model="gemini-3.5-flash", contents="Now modify the script to save the results to a JSON file", config={ "environment": "remote", "environment_id": env_id, "previous_interaction_id": prev_id } )

print(resp2.text)

O environment_id mantém o mesmo sandbox ativo entre chamadas. O previous_interaction_id dá contexto de conversa. O agente sabe exatamente o que você pediu antes.

Passo 4 — Streaming em tempo real

ElevenLabs

Transforme texto em voz com IA realista. Perfeito para narracoes, podcasts e audiolivros.

Testar gratuito

Operações longas (web scraping, processamento de datasets grandes) podem levar minutos. Com stream=True, você vê o resultado em tempo real:

stream = client.models.generate_content_stream(
    model="gemini-3.5-flash",
    contents="Scrape the top 10 stories from Hacker News and summarize each one",
    config={
        "environment": "remote",
        "stream": True
    }
)

for chunk in stream: print(chunk.text, end="")

Cada chunk é um pedaço do raciocínio do agente. Você vê ele planejando, executando, encontrando erros e corrigindo — como se estivesse olhando por cima do ombro.

Passo 5 — Baixar artefatos gerados

O agente criou um arquivo JSON? Um CSV processado? Um gráfico? Consulte a documentação oficial do Gemini API para o endpoint de download de artefatos. O sandbox suporta arquivos inline de até 1 MB. Para arquivos maiores, você pode conectar repositórios GitHub, URLs públicas ou Google Cloud Storage.

Passo 6 — Crie um agente customizado

Se o Antigravity genérico não basta, crie seu próprio agente com instruções de sistema. Segundo a documentação do Google, é possível usar arquivos markdown para configurar o comportamento: AGENTS.md para instruções de sistema e SKILL.md para habilidades reutilizáveis — um formato que permite versionar o comportamento do agente como código.

Crie um arquivo AGENTS.md:

# Marketing Analyst Agent

You are a marketing data analyst. Your job is to:

Analyze CSV files with marketing campaign data
Calculate ROI, CTR, conversion rates
Generate actionable insights in Portuguese
Always output results as formatted tables

Never make up data. Only report what you find.

Agora registre uma skill em SKILL.md:

# Skill: CSV Analysis

Analyze marketing CSV files and produce structured reports.

Parameters

file_url: URL of the CSV file
metrics: comma-separated list of metrics to calculate

Output format

E na sua chamada de API:

response = client.models.generate_content(
    model="gemini-3.5-flash",
    contents="Analyze this campaign CSV and tell me which campaign had the best ROI",
    config={
        "environment": "remote",
        "system_instruction": open("AGENTS.md").read(),
        "skills": [open("SKILL.md").read()]
    }
)

Seu agente agora age como um analista de marketing — não como um LLM genérico. As skills funcionam como plugins de comportamento.

O que construir com isso?

Algumas ideias para começar:

Assistente de análise de dados: solta um CSV, recebe um relatório completo
Web scraper inteligente: o agente navega, extrai e estrutura dados
Gerador de documentação técnica: aponta para um repositório, recebe docs
Tradutor + revisor: pipeline multi-etapas de tradução e revisão
Testador automatizado: o agente executa testes, captura erros e sugere correções

O mais interessante? Você pode encadear múltiplos agentes. Um coleta dados, passa para outro que analisa, que passa para um terceiro que gera o relatório final. Tudo com chamadas de API simples.

O que a Google não contou (mas você precisa saber)

Dois pontos de atenção:

Ambiente efêmero. O sandbox é destruído após um período de inatividade. Se você precisa de estado persistente entre sessões, precisa salvar os artefatos externamente (Google Cloud Storage, GitHub).

Latência de inicialização. A primeira chamada para um novo ambiente leva alguns segundos (tempo de provisionamento). Chamadas subsequentes no mesmo environment_id tendem a ser mais rápidas. Para aplicações em tempo real, mantenha o ambiente aquecido com um keep-alive.

Produto em preview. Managed Agents foi lançado como preview no Google I/O 2026. A API ainda pode mudar. Teste em ambientes não-críticos antes de depender dela em produção.

Conclusão

Managed Agents não é só mais um feature do Gemini API. É uma mudança de paradigma: pela primeira vez, você pode criar um agente de IA completo sem tocar em infraestrutura. Uma única chamada de API substitui semanas de configuração de servidor, Docker, orquestradores e segurança de sandbox.

O tutorial de hoje te levou do zero a um agente funcional em 6 passos e menos de 30 minutos. O próximo passo é seu: o que você vai construir com um agente que se autogerencia?

Se testar, conta pra gente nos comentários. Queremos ver o que a comunidade brasileira vai criar com isso.

Custos de Egresso em Provedores de IA no Brasil: Oracle vs. Gigantes Globais em 2026

Análise detalhada dos custos de egresso em serviços de IA como SageMaker e Vertex AI no Brasil em 2026. Compare Oracle, AWS, Azure e Google Cloud e veja como...

6 de junho de 2026Ler mais

Ilustração de data centers conectados em nuvem com ícones de IA e gráficos de crescimento

negocios-ia|10 min

IA como Serviço no Brasil em 2026: A Nova Guerra das Nuvens e o Fim das Soluções Próprias

Empresas brasileiras estão trocando modelos de IA próprios por APIs e plataformas gerenciadas. AWS, Google Cloud e Azure disputam um mercado de US$ 50 bilhõe...

5 de junho de 2026Ler mais

Código Python sendo escrito para criar um agente de IA

llms-chatbots|12 min

Do Prompt ao Agente: Construa um Assistente de IA com Memória e Ferramentas em Python (2026)

Tutorial prático de construção de agentes de IA em Python: do loop ReAct simples ao LangGraph com ferramentas, memória persistente e checkpoint.

27 de maio de 2026Ler mais

Comentarios

Para ativar os comentarios, configure seu shortname do Disqus no componente.