AI

Aprendizaje IA de la Semana: 18 de mayo de 2026

Resumen semanal de 9 recursos, herramientas y artículos sobre inteligencia artificial que guardé esta semana.

Aprendizaje semanal de IA

Esta semana trae una avalancha de novedades en tooling para agentes: desde frameworks tipo FastAPI para IA hasta CLIs de xAI y DeepSeek, pasando por el “agent view” de Claude Code y la respuesta de OpenAI con Codex remoto. También hay una profunda disección de qué es realmente un agent harness y un recordatorio de seguridad tras el hack a GitHub vía extensión de VS Code.

🛠️

Herramientas / productividad

pydantic/pydantic-ai: AI Agent Framework, the Pydantic way

Pydantic AI es un framework de agentes creado por el equipo detrás de Pydantic y FastAPI, diseñado para llevar esa misma experiencia “si compila, funciona” al desarrollo con GenAI. Es model-agnostic (soporta OpenAI, Anthropic, Gemini, DeepSeek, Grok, Ollama, Bedrock, Vertex y muchos más), integra observabilidad nativa con Logfire (OpenTelemetry), y apuesta por tipado estricto para mover errores a tiempo de escritura. Incluye evals potentes, capacidades componibles (web search, thinking, MCP), y soporte para A2A, MCP y human-in-the-loop.

Manage multiple agents with agent view - Claude Code Docs

El “agent view” de Claude Code (claude agents) es una vista única tipo dashboard para despachar, monitorizar y adjuntarse a múltiples sesiones en background desde una sola terminal. Cada fila muestra estado, actividad actual y tiempo; puedes peek para ver y responder sin entrar, o attach para la conversación completa. Las sesiones persisten aunque cierres la vista, y se agrupan por estado (pinned, need review, running, done). Incluye atajos de teclado y filtrado por directorio con --cwd.

OpenAI Developers en X: “Your Mac can hold down the fort while you work from your phone.”

OpenAI lanza conexión remota en la app desktop de Codex: activas “Keep this Mac awake” y el agente sigue corriendo en tu Mac mientras tú trabajas desde la app móvil de ChatGPT. Es la respuesta directa al dispatch de Anthropic, permitiendo tareas de larga duración sin mantener la sesión abierta en el teléfono.

Grok Build Beta | xAI

Grok Build es el nuevo CLI de xAI (para SuperGrok y X Premium+) que trae plan mode (apruebas el plan antes de que edite), subagentes en paralelo con worktrees propios, skills reutilizables vía /skillify, marketplace de plugins, hooks, MCP nativo y búsqueda de código. Instalación en un comando (curl -fsSL https://x.ai/cli/install.sh | bash) y funciona con cualquier codebase/lenguaje.

DeepSeek TUI

CodeWhale (el TUI de DeepSeek V4) envuelve al modelo en un “harness” con una Constitución escrita que jerarquiza 9 fuentes de autoridad (mensaje de usuario > instrucciones stale, output de herramienta > suposiciones, verificación > confianza). Usa el prefix cache de V4 para que referenciar esa Constitución sea ~100× más barato por turno, y cierra el bucle de feedback devolviendo errores de compilación, type errors de rust-analyzer y denegaciones de sandbox como vectores de corrección. Tiene tres modos: plan (read-only), agent (con aprobación) y YOLO (auto-aprueba). MIT, open source, npm install -g codewhale.

🤖

Agentes / asistentes

Akshay 🚀 en X: “The Anatomy of an Agent Harness”

Un deep dive exhaustivo desglosando las 12 componentes de un harness de producción (el término formalizado en 2026 para la infraestructura que envuelve al LLM: bucle de orquestación, tools, memoria, gestión de contexto, construcción de prompt, parsing de output, estado, manejo de errores, guardrails, bucles de verificación, subagentes y terminación). Compara implementaciones reales de Anthropic (Claude Code), OpenAI (Agents SDK/Codex), LangGraph, CrewAI y AutoGen. La tesis central: el harness es donde vive la ingeniería dura; dos productos con el mismo modelo pueden diferir 20+ posiciones en benchmarks solo por el harness. Incluye la metáfora del andamiaje (scaffolding): a medida que los modelos mejoran, el harness debería adelgazar.

Cotera | AI Agents That Know Your Business

Cotera (“Coco”) propone agentes que se describen en inglés plano (sin flowcharts ni if-then), se conectan a 200+ integraciones nativas (Salesforce, HubSpot, Zendesk, Slack, Notion, Shopify, warehouses, APIs HTTP) y ejecutan acciones reales sobre datos reales. El editor incluye copiloto para aprender a promptear, widgets para testing, y cada tool está hand-built (no MCP kitchen-sink) para fiabilidad. Casos de uso: soporte, ventas, CX, operaciones.

🔐

Seguridad

Space Programmer en X: ”🚨 GITHUB FUE HACKEADO”

Un empleado de GitHub instaló una extensión maliciosa de VS Code → los atacantes exfiltraron 3,800 repos internos (incluyendo código de Copilot) y los venden desde $50k en foros oscuros. Vector: una extensión con 4.8★ y 2M descargas, no un zero-day ni nation-state. Acciones inmediatas recomendadas: rotar todas las API keys/tokens de GitHub, auditar cada extensión instalada, verificar publisher, dejar de usar “latest” y pinnear versiones verificadas. GitHub dice que datos de clientes están seguros; la historia sugiere precaución.

📢

Comunidad

Andrej Karpathy en X: “Personal update: I’ve joined Anthropic.”

Andrej Karpathy anuncia su fichaje por Anthropic para volver a I+D en la frontera de LLMs. Mantiene su pasión por la educación y planea retomar ese trabajo con el tiempo. Movimiento relevante: Karpathy fue director de IA en Tesla y cofundador de OpenAI; su llegada refuerza el equipo de investigación de Anthropic en un momento clave.