Aprendizaje IA de la Semana: 8 de junio de 2026
Resumen semanal de 34 recursos, herramientas y artículos sobre inteligencia artificial que guardé esta semana.
Aprendizaje semanal de IA
Esta semana ha sido intensa en el frente de modelos frontera, herramientas de desarrollo agente y la emergencia de “loop engineering” como nuevo paradigma. Anthropic lanzó (y luego suspendió) sus modelos más potentes, OpenAI y Anthropic avanzan hacia IPO, y la comunidad de ingenieros está construyendo fábricas de software autónomas.
🧠
Modelos
Claude Fable 5 and Claude Mythos 5 | alphaXiv
Anthropic presentó su nueva familia Mythos-class: Fable 5 (versión segura para uso general) y Mythos 5 (sin salvaguardas para defensores cibernéticos aprobados). Fable 5 supera a todos los modelos previos en benchmarks de ingeniería de software, investigación científica, visión y trabajo de conocimiento. En pruebas tempranas, Stripe comprimió meses de migración en un código base de 50M líneas Ruby a un solo día. Precio: $10M input / $50M output tokens — menos de la mitad que Mythos Preview.
Anthropic en X: “The US government… has issued an export control directive to suspend all access to Fable 5 and Mythos 5”
Tres días después del lanzamiento, el gobierno de EE. UU. emitió una directiva de control de exportaciones que obliga a Anthropic a suspender acceso a Fable 5 y Mythos 5 para cualquier nacional extranjero, incluyendo sus propios empleados. El efecto neto: deshabilitaron ambos modelos para todos los clientes. Anthropic califica esto de “malentendido” y trabaja para restaurar acceso. Los demás modelos Claude no se ven afectados.
Pliny the Liberator 🐉 en X: ”🚿 FABLE-5 SYS PROMPT LEAK”
Filtración masiva del system prompt de Fable 5 (~120,000 caracteres). Revela detalles como: knowledge cutoff enero 2026, arquitectura de memoria persistente para artifacts (key-value storage), integración MCP para apps externas, y políticas de rechazo matizadas. El prompt incluye instrucciones detalladas sobre tono, formato, bienestar del usuario, y recordatorios de Anthropic que se inyectan dinámicamente (cyber_warning, ethics_reminder, etc.).
Claude Fable 5 and Claude Mythos 5 | Anthropic
El anuncio oficial confirma las capacidades: autonomía extendida (trabajan más tiempo que cualquier Claude previo), ingeniería de software (migraciones masivas, refactoring), trabajo de conocimiento, visión, memoria y ciencias de la vida. Mythos 5 se despliega inicialmente via Project Glasswing con el gobierno de EE. UU. para defensa cibernética. Nota: la página muestra una actualización del 12 junio confirmando la suspensión de acceso.
alphaXiv en X: “As believers of open research, we are disappointed to see Anthropic silently degrading Fable 5 for AI development”
AlphaXiv denuncia que Anthropic degrada silenciosamente Fable 5 para investigación en IA: temas como pipelines de preentrenamiento, infraestructura de entrenamiento distribuido o diseño de aceleradores ML “pueden tener efectividad limitada”. La preocupación: no es un rechazo visible sino una intervención invisible que debilita respuestas sin que el usuario lo sepa, rompiendo la capacidad de auditar si un fallo viene de la idea, la implementación o el proveedor del modelo.
🛠️
Herramientas / productividad
Orquestar subagentes a escala con flujos de trabajo dinámicos - Claude Code Docs
Documentación oficial de dynamic workflows en Claude Code: scripts JavaScript que orquestan docenas a cientos de subagentes. A diferencia de subagentes/skills/equipos donde Claude decide turno a turno, aquí el plan vive en código — el runtime ejecuta el bucle, ramificación y resultados intermedios, dejando el contexto de Claude solo para la respuesta final. Permite patrones de calidad repetibles: agentes independientes que revisan adversarialmente hallazgos antes de reportar. Incluye /deep-research como workflow integrado.
Xiaomi’s new open source, agentic AI coding harness MiMo Code beats Claude Code at ultra-long, 200+ step tasks | VentureBeat
MiMo Code de Xiaomi (open source) supera a Claude Code en tareas ultra-largas de 200+ pasos. Es un harness agente que planifica, ejecuta y verifica en bucles extensos. Parte de la apuesta de Xiaomi por tooling agente abierto y de alto rendimiento.
generalaction/emdash: Emdash is the Open-Source Agentic Development Environment
Emdash (YC W26): entorno de desarrollo agente open-source, desktop-first. Ejecuta múltiples agentes de coding en paralelo (Claude Code, Codex, OpenCode, Gemini, Amp, etc.), cada uno en su propio git worktree para aislamiento total. Soporta proyectos locales y remotos vía SSH. Revisa diffs, crea PRs, inspecciona CI y mergea desde un solo lugar. Local-first: estado en SQLite local, no envía código a servidores Emdash.
AgentWrapper/agent-orchestrator: Agentic orchestrator for parallel coding agents
Agent Orchestrator (AO): capa de orquestación agnóstica al agente (Claude Code, Codex, Aider) y al runtime (tmux, Docker, ConPTY). El orchestrator agent planifica tareas, spawnea workers en worktrees aislados, cada uno con su branch y PR. Reacciona automáticamente a fallos de CI y comentarios de review. Dashboard en localhost:3000. Solo requiere intervención humana cuando se necesita juicio.
junhoyeo/contrabass: Go & Charm stack implementation of OpenAI’s Symphony
Contrabass: reimplementación en Go + Charm (Bubble Tea TUI) de Symphony de OpenAI. Orquestador a nivel de proyecto para agentes de coding: parsea WORKFLOW.md con front-matter YAML, adapters para Linear/GitHub Issues/tablero interno, runners para Codex, OpenCode, oh-my-opencode, OMX, OMC. Equipos multi-agente con pipeline por fases (plan → exec → verify), TUI en vivo, dashboard React (Ziikoo) con streaming SSE, localización zh-CN. Modo tmux multi-proceso o goroutine in-process.
openai/symphony: Symphony turns project work into isolated, autonomous implementation runs
Symphony (OpenAI): convierte trabajo de proyecto en runs de implementación aislados y autónomos. Los ingenieros gestionan el trabajo, no supervisan agentes. Monitorea tablero Linear, spawnea agents, completan tareas y entregan prueba de trabajo: estado CI, feedback de review, análisis de complejidad, videos walkthrough. Al aceptar, landen PRs de forma segura. Preview de ingeniería para entornos de confianza. Implementación de referencia en Elixir.
Priivacy-ai/spec-kitty: Spec-Driven Development for serious software developers
Spec Kitty: CLI open-source para Spec-Driven Development gobernado. Flujo: spec → plan → tasks → next → review → accept → merge. Mantiene specs, planes, work packages, criterios de aceptación, estado de review y decisiones de merge en el repo (bajo kitty-specs/). Agentes corren en git worktrees aislados (.worktrees/) para paralelismo sin caos de branches. Dashboard kanban local opcional. Integra slash commands/skills para Claude Code, Codex, Cursor, Gemini, Copilot, Windsurf, OpenCode. Cada misión completada genera retrospectiva automática.
I Open-Sourced My Own AFK Software Factory - YouTube
Video demo de Sand Castle: librería TypeScript para orquestar agentes de coding en sandboxes aislados (Docker). Permite escribir scripts simples: sandcastle.run({ agent, sandbox, prompt }). Plantillas incluyen: planner paralelo con paso de review, backlog manager vía GitHub issues (filtrado por label), implementadores paralelos por issue, reviewer adversarial, merger que resuelve conflictos y cierra issues. El autor lo usa en producción para features, QA y mantenimiento AFK.
5 Claude Code skills I use every single day - YouTube
Cinco skills de Claude Code de uso diario para codificar proceso de ingeniería real:
- Grill me: entrevista implacable sobre cada rama del design tree hasta entendimiento compartido (hasta 16+ preguntas en una sesión).
- Write a PRD: convierte entendimiento en PRD con user stories y decisiones de implementación duraderas, output como GitHub issue.
- PRD to issues: descompone PRD en vertical slices (tracer bullets) con relaciones de bloqueo para paralelismo.
- TDD skill: fuerza red-green-refactor, confirma cambios de interfaz, diseña para testabilidad.
- Improve codebase architecture: explora codebase surfacing confusions, spawnea subagentes para diseñar interfaces alternativas, crea RFC de refactor como issue.
benjaminshoemaker/vibecode_spec_generator: Wizard-style app to help people generate specs
Vibe Scaffold (vibescaffold.dev): app Next.js con wizard de 4 pasos asistido por IA (OpenAI) para generar specs ejecutables por agentes: One Pager → Dev Spec → Prompt Plan → AGENTS.md. Chat interactivo context-aware, persistencia en localStorage, descarga individual o ZIP, preview de documentos de ejemplo. Edge runtime, Tailwind, Vercel AI SDK, Zustand.
Three Lessons from Building an AI Coding Toolkit
Tres lecciones hard-earned construyendo un toolkit de spec-driven development para Claude Code:
- LLMs necesitan criterios de aceptación objetivos, no subjetivos (“valida email antes de submit y muestra error en <200ms” vs “login intuitivo”).
- Haz que la IA revise su propio trabajo con otro sombrero: subagente code-reviewer califica cada fase; no avanza hasta pasar score. Especialización: writer vs reviewer.
- El contexto es código: todo vive en markdown en el repo (Project Brief, ADRs, Specs, Tasks, Worklogs). Claude lee, sigue workflows y actualiza. Los archivos son la memoria persistente.
TaylorHuston/ai-toolkit: A lightweight, fully customizable framework to enable Spec Driven Development with Claude Code
AI Toolkit (plugin marketplace): framework ligero para SDD con Claude Code. Incluye: plugin con 27 comandos, 21 agentes especializados, automatización inteligente; starter template (51 archivos); development guidelines (33 archivos en 4 dirs). Flujo core: /project-brief → /adr (decisiones estáticas) → /spec (living docs con acceptance criteria) → /plan ### (fases TDD) → /implement ### PHASE (ejecución con quality gates). Comandos extra: /quality, /review, /retro, /sync.
raw.githubusercontent.com/anthropics/claude-code/…/feature-dev.md
Comando oficial feature-dev de Claude Code: flujo estructurado para desarrollo de features con especificación, planificación, implementación y validación integradas. Parte del plugin ecosystem nativo.
specpulse/specpulse: Specification-Driven Development (SDD) Framework
SpecPulse: framework SDD universal con 11 comandos idénticos en 8 plataformas (Claude Code, Gemini CLI, Windsurf, Cursor, GitHub Copilot, OpenCode, Crush, Qwen Code). CLI-first con AI enhancement: /sp-pulse (entry point) → /sp-spec → /sp-plan → /sp-task → /sp-execute → /sp-status → /sp-validate → /sp-continue → /sp-decompose → /sp-clarify → /sp-llm-enforce. Crea foundation CLI y luego AI expande/valida. Soporta specs, plans, tasks, execution continua, validation, compliance enforcement.