Google Lançou Agentes que se Autogerenciam: Mão na Massa com Gemini Managed Agents
No Google I/O 2026, no dia 19 de maio, a Google anunciou os Managed Agents no Gemini API. O conceito é direto: uma única chamada de API provisiona um agente completo com ambiente Linux remoto, isolado e efêmero. Você não gerencia servidor, não configura Docker, não escala. Só programa o comportamento.
Isso resolve um problema real. Qualquer um que já tentou colocar um agente de IA em produção sabe o caminho: servidor Linux, ambiente isolado, orquestrador de tarefas, filas, monitoramento, segurança de sandbox... dá para gastar semanas só na infraestrutura. Os Managed Agents eliminam essa camada inteira.
Neste post, você vai entender o que mudou, por que isso importa e — na prática — como criar seu primeiro agente gerenciado em menos de 30 minutos.
O que são Managed Agents no Gemini API?
Um Managed Agent é um agente de IA que roda inteiramente na infraestrutura do Google. Você manda uma requisição HTTP e recebe de volta um ambiente de execução completo: terminal Linux, acesso a internet, execução de código, download de arquivos.
O agente que a Google disponibilizou é o Antigravity, alimentado pelo modelo Gemini 3.5 Flash. Ele consegue raciocinar, planejar, chamar ferramentas, executar código Python em sandbox e navegar na web. Tudo entregue sem você precisar instalar nada além de um cliente HTTP.
A Google descreveu assim no blog oficial:
"Managed Agents in the Gemini API removes the friction of infrastructure setup, delivering the power of the Antigravity agent harness via managed agents, with a single API call providing a fully provisioned agent with a remote sandbox." — Google AI Blog, 19 de maio de 2026 (tradução livre: "Managed Agents no Gemini API remove o atrito da configuração de infraestrutura, entregando o poder do harness do agente Antigravity via agentes gerenciados, com uma única chamada de API provisionando um agente completo com sandbox remoto.")
O pulo do gato é este: em vez de você construir a "casa" para o agente morar, o Google entrega a casa pronta. Você só define o comportamento.
Por que isso importa agora?
Até maio de 2026, montar um agente autônomo exigia empilhar várias camadas de infraestrutura. A tabela abaixo mostra o contraste:
| Componente | Antes (DIY) | Com Managed Agents |
|---|---|---|
| Ambiente de execução | Servidor Linux + Docker | Automático (sandbox remoto) |
| Orquestrador de tarefas | Celery / Temporal | Built-in no Antigravity |
| Isolamento de segurança | cgroups + seccomp + AppArmor | Gerenciado pelo Google |
| Escalabilidade | Auto-scaling groups | Elástico, sem configuração |
| Download de artefatos | Bucket S3 + presigned URLs | API REST nativa |
| Custo inicial | US$ 50-200/mês só de infra (estimativa de mercado) | Custo por token — Google afirma que Gemini 3.5 Flash custa menos da metade de modelos comparáveis |
A Google afirma que o Gemini 3.5 Flash custa menos da metade de modelos comparáveis. Os preços exatos serão confirmados na documentação oficial. Mas a direção é clara: em vez de gastar semanas montando infra, você gasta 30 minutos programando o comportamento.
Mão na massa — Tutorial Passo a Passo
Vamos criar um agente que analisa dados de um CSV, extrai insights e gera um relatório.
⚠️ Aviso: Os exemplos abaixo são ilustrações conceituais baseadas na documentação em preview do Google I/O 2026. Consulte a documentação oficial do Gemini API para os nomes exatos de parâmetros e endpoints, que podem mudar durante o período de preview.
Passo 1 — Setup do ambiente
Crie sua chave de API no Google AI Studio e ative o faturamento. Depois, instale as dependências:
pip install google-genai requests python-dotenv
Crie um arquivo .env na raiz do projeto:
GEMINI_API_KEY=sua_chave_aqui
Passo 2 — Primeira chamada: o agente Antigravity
Vamos fazer o agente executar um script Python para analisar um CSV. O parâmetro environment='remote' é o que ativa o sandbox gerenciado:
import os
from dotenv import load_dotenv
from google import genai
load_dotenv() client = genai.Client(api_key=os.getenv("GEMINI_API_KEY"))
response = client.models.generate_content( model="gemini-3.5-flash", contents="Write a Python script to analyze this CSV data: sales,region,value\n100,North,50\n200,South,75\n150,East,60\n180,West,90\n\nThe script should calculate total by region and find the best-performing region.", config={ "environment": "remote", "temperature": 0.2 } )
print(response.text)
Execute o script. Em segundos, o agente Antigravity — alimentado pelo Gemini 3.5 Flash — provisiona um ambiente Linux, escreve o código, executa e retorna o resultado. Você não viu nada disso, só recebeu a saída.
Passo 3 — Conversa de múltiplos turnos
Agentes de verdade raramente resolvem tudo em uma chamada. Para manter contexto entre interações, use previous_interaction_id e environment_id:
# Primeira interação
resp1 = client.models.generate_content(
model="gemini-3.5-flash",
contents="Create a Python script that fetches the latest news about AI from a public API",
config={"environment": "remote"}
)
env_id = resp1.environment_id prev_id = resp1.interaction_id
Segunda interação — o agente lembra do contexto
resp2 = client.models.generate_content( model="gemini-3.5-flash", contents="Now modify the script to save the results to a JSON file", config={ "environment": "remote", "environment_id": env_id, "previous_interaction_id": prev_id } )
print(resp2.text)
O environment_id mantém o mesmo sandbox ativo entre chamadas. O previous_interaction_id dá contexto de conversa. O agente sabe exatamente o que você pediu antes.
Passo 4 — Streaming em tempo real
Operações longas (web scraping, processamento de datasets grandes) podem levar minutos. Com stream=True, você vê o resultado em tempo real:
stream = client.models.generate_content_stream(
model="gemini-3.5-flash",
contents="Scrape the top 10 stories from Hacker News and summarize each one",
config={
"environment": "remote",
"stream": True
}
)
for chunk in stream: print(chunk.text, end="")
Cada chunk é um pedaço do raciocínio do agente. Você vê ele planejando, executando, encontrando erros e corrigindo — como se estivesse olhando por cima do ombro.
Passo 5 — Baixar artefatos gerados
O agente criou um arquivo JSON? Um CSV processado? Um gráfico? Consulte a documentação oficial do Gemini API para o endpoint de download de artefatos. O sandbox suporta arquivos inline de até 1 MB. Para arquivos maiores, você pode conectar repositórios GitHub, URLs públicas ou Google Cloud Storage.
Passo 6 — Crie um agente customizado
Se o Antigravity genérico não basta, crie seu próprio agente com instruções de sistema. Segundo a documentação do Google, é possível usar arquivos markdown para configurar o comportamento: AGENTS.md para instruções de sistema e SKILL.md para habilidades reutilizáveis — um formato que permite versionar o comportamento do agente como código.
Crie um arquivo AGENTS.md:
# Marketing Analyst Agent
You are a marketing data analyst. Your job is to:
- Analyze CSV files with marketing campaign data
- Calculate ROI, CTR, conversion rates
- Generate actionable insights in Portuguese
- Always output results as formatted tables
Never make up data. Only report what you find.
Agora registre uma skill em SKILL.md:
# Skill: CSV Analysis
Analyze marketing CSV files and produce structured reports.
Parameters
- file_url: URL of the CSV file
- metrics: comma-separated list of metrics to calculate
Output format
Always return a markdown table with: | Campaign | Spend | Revenue | ROI | Status |
E na sua chamada de API:
response = client.models.generate_content(
model="gemini-3.5-flash",
contents="Analyze this campaign CSV and tell me which campaign had the best ROI",
config={
"environment": "remote",
"system_instruction": open("AGENTS.md").read(),
"skills": [open("SKILL.md").read()]
}
)
Seu agente agora age como um analista de marketing — não como um LLM genérico. As skills funcionam como plugins de comportamento.
O que construir com isso?
Algumas ideias para começar:
- Assistente de análise de dados: solta um CSV, recebe um relatório completo
- Web scraper inteligente: o agente navega, extrai e estrutura dados
- Gerador de documentação técnica: aponta para um repositório, recebe docs
- Tradutor + revisor: pipeline multi-etapas de tradução e revisão
- Testador automatizado: o agente executa testes, captura erros e sugere correções
O mais interessante? Você pode encadear múltiplos agentes. Um coleta dados, passa para outro que analisa, que passa para um terceiro que gera o relatório final. Tudo com chamadas de API simples.
O que a Google não contou (mas você precisa saber)
Dois pontos de atenção:
Ambiente efêmero. O sandbox é destruído após um período de inatividade. Se você precisa de estado persistente entre sessões, precisa salvar os artefatos externamente (Google Cloud Storage, GitHub).
Latência de inicialização. A primeira chamada para um novo ambiente leva alguns segundos (tempo de provisionamento). Chamadas subsequentes no mesmo environment_id tendem a ser mais rápidas. Para aplicações em tempo real, mantenha o ambiente aquecido com um keep-alive.
Produto em preview. Managed Agents foi lançado como preview no Google I/O 2026. A API ainda pode mudar. Teste em ambientes não-críticos antes de depender dela em produção.
Conclusão
Managed Agents não é só mais um feature do Gemini API. É uma mudança de paradigma: pela primeira vez, você pode criar um agente de IA completo sem tocar em infraestrutura. Uma única chamada de API substitui semanas de configuração de servidor, Docker, orquestradores e segurança de sandbox.
O tutorial de hoje te levou do zero a um agente funcional em 6 passos e menos de 30 minutos. O próximo passo é seu: o que você vai construir com um agente que se autogerencia?
Se testar, conta pra gente nos comentários. Queremos ver o que a comunidade brasileira vai criar com isso.
Artigos Relacionados
Confira também: 2026: O Ano em que a Regulamentação de IA Saiu do Papel — Prazos, Multas e o Que Mudou no Brasil e no Mundo Confira também: A Crise de Segurança dos Agentes de IA em 2026: 30 Mil Instâncias Expostas, 1,5 Milhão de Tokens Vazados e o que Isso Significa para Você Confira também: 1.451 Dispositivos com IA Aprovados pelo FDA: a Revolução Silenciosa na Saúde em 2026
NeuralPulse
Blog profissional sobre Inteligencia Artificial. Exploramos tendencias, ferramentas, tutoriais e analises profundas sobre como a IA esta transformando negocios, tecnologia e o dia a dia.
Receba as novidades sobre IA
Junte-se a milhares de leitores que acompanham as ultimas tendencias em inteligencia artificial.
Artigos Relacionados
Custos de Egresso em Provedores de IA no Brasil: Oracle vs. Gigantes Globais em 2026
Análise detalhada dos custos de egresso em serviços de IA como SageMaker e Vertex AI no Brasil em 2026. Compare Oracle, AWS, Azure e Google Cloud e veja como...
IA como Serviço no Brasil em 2026: A Nova Guerra das Nuvens e o Fim das Soluções Próprias
Empresas brasileiras estão trocando modelos de IA próprios por APIs e plataformas gerenciadas. AWS, Google Cloud e Azure disputam um mercado de US$ 50 bilhõe...
Do Prompt ao Agente: Construa um Assistente de IA com Memória e Ferramentas em Python (2026)
Tutorial prático de construção de agentes de IA em Python: do loop ReAct simples ao LangGraph com ferramentas, memória persistente e checkpoint.
Comentarios
Powered by Disqus
Para ativar os comentarios, configure seu shortname do Disqus no componente.
<div id="disqus_thread"></div>