Aprendizaje IA de la Semana: 8 de junio de 2026

Resumen semanal de 37 recursos, herramientas y artículos sobre inteligencia artificial que guardé esta semana.

David Gonzalez
• Ingeniero de Software | Desarrollador Frontend
• Disfruto trabajar en equipos y liderar
• Orientado a objetivos
More posts by David Gonzalez.

David Gonzalez

14 Jun 2026•9 min read

Aprendizaje IA de la Semana: 8 de junio de 2026

Aprendizaje semanal de IA

Esta semana ha sido intensa en el frente de modelos frontera, herramientas de desarrollo agente y la emergencia de “loop engineering” como nuevo paradigma. Anthropic lanzó (y luego suspendió) sus modelos más potentes, OpenAI y Anthropic avanzan hacia IPO, y la comunidad de ingenieros está construyendo fábricas de software autónomas.

🧠

Modelos

Claude Fable 5 and Claude Mythos 5 | alphaXiv

Anthropic presentó su nueva familia Mythos-class: Fable 5 (versión segura para uso general) y Mythos 5 (sin salvaguardas para defensores cibernéticos aprobados). Fable 5 supera a todos los modelos previos en benchmarks de ingeniería de software, investigación científica, visión y trabajo de conocimiento. En pruebas tempranas, Stripe comprimió meses de migración en un código base de 50M líneas Ruby a un solo día. Precio: $10M input / $50M output tokens — menos de la mitad que Mythos Preview.

Anthropic en X: “The US government… has issued an export control directive to suspend all access to Fable 5 and Mythos 5”

Tres días después del lanzamiento, el gobierno de EE. UU. emitió una directiva de control de exportaciones que obliga a Anthropic a suspender acceso a Fable 5 y Mythos 5 para cualquier nacional extranjero, incluyendo sus propios empleados. El efecto neto: deshabilitaron ambos modelos para todos los clientes. Anthropic califica esto de “malentendido” y trabaja para restaurar acceso. Los demás modelos Claude no se ven afectados.

Pliny the Liberator 🐉 en X: ”🚿 FABLE-5 SYS PROMPT LEAK”

Filtración masiva del system prompt de Fable 5 (~120,000 caracteres). Revela detalles como: knowledge cutoff enero 2026, arquitectura de memoria persistente para artifacts (key-value storage), integración MCP para apps externas, y políticas de rechazo matizadas. El prompt incluye instrucciones detalladas sobre tono, formato, bienestar del usuario, y recordatorios de Anthropic que se inyectan dinámicamente (cyber_warning, ethics_reminder, etc.).

Claude Fable 5 and Claude Mythos 5 | Anthropic

El anuncio oficial confirma las capacidades: autonomía extendida (trabajan más tiempo que cualquier Claude previo), ingeniería de software (migraciones masivas, refactoring), trabajo de conocimiento, visión, memoria y ciencias de la vida. Mythos 5 se despliega inicialmente via Project Glasswing con el gobierno de EE. UU. para defensa cibernética. Nota: la página muestra una actualización del 12 junio confirmando la suspensión de acceso.

alphaXiv en X: “As believers of open research, we are disappointed to see Anthropic silently degrading Fable 5 for AI development”

AlphaXiv denuncia que Anthropic degrada silenciosamente Fable 5 para investigación en IA: temas como pipelines de preentrenamiento, infraestructura de entrenamiento distribuido o diseño de aceleradores ML “pueden tener efectividad limitada”. La preocupación: no es un rechazo visible sino una intervención invisible que debilita respuestas sin que el usuario lo sepa, rompiendo la capacidad de auditar si un fallo viene de la idea, la implementación o el proveedor del modelo.

🛠️

Herramientas / productividad

Orquestar subagentes a escala con flujos de trabajo dinámicos - Claude Code Docs

Documentación oficial de dynamic workflows en Claude Code: scripts JavaScript que orquestan docenas a cientos de subagentes. A diferencia de subagentes/skills/equipos donde Claude decide turno a turno, aquí el plan vive en código — el runtime ejecuta el bucle, ramificación y resultados intermedios, dejando el contexto de Claude solo para la respuesta final. Permite patrones de calidad repetibles: agentes independientes que revisan adversarialmente hallazgos antes de reportar. Incluye /deep-research como workflow integrado.

Xiaomi’s new open source, agentic AI coding harness MiMo Code beats Claude Code at ultra-long, 200+ step tasks | VentureBeat

MiMo Code de Xiaomi (open source) supera a Claude Code en tareas ultra-largas de 200+ pasos. Es un harness agente que planifica, ejecuta y verifica en bucles extensos. Parte de la apuesta de Xiaomi por tooling agente abierto y de alto rendimiento.

generalaction/emdash: Emdash is the Open-Source Agentic Development Environment

Emdash (YC W26): entorno de desarrollo agente open-source, desktop-first. Ejecuta múltiples agentes de coding en paralelo (Claude Code, Codex, OpenCode, Gemini, Amp, etc.), cada uno en su propio git worktree para aislamiento total. Soporta proyectos locales y remotos vía SSH. Revisa diffs, crea PRs, inspecciona CI y mergea desde un solo lugar. Local-first: estado en SQLite local, no envía código a servidores Emdash.

AgentWrapper/agent-orchestrator: Agentic orchestrator for parallel coding agents

Agent Orchestrator (AO): capa de orquestación agnóstica al agente (Claude Code, Codex, Aider) y al runtime (tmux, Docker, ConPTY). El orchestrator agent planifica tareas, spawnea workers en worktrees aislados, cada uno con su branch y PR. Reacciona automáticamente a fallos de CI y comentarios de review. Dashboard en localhost:3000. Solo requiere intervención humana cuando se necesita juicio.

junhoyeo/contrabass: Go & Charm stack implementation of OpenAI’s Symphony

Contrabass: reimplementación en Go + Charm (Bubble Tea TUI) de Symphony de OpenAI. Orquestador a nivel de proyecto para agentes de coding: parsea WORKFLOW.md con front-matter YAML, adapters para Linear/GitHub Issues/tablero interno, runners para Codex, OpenCode, oh-my-opencode, OMX, OMC. Equipos multi-agente con pipeline por fases (plan → exec → verify), TUI en vivo, dashboard React (Ziikoo) con streaming SSE, localización zh-CN. Modo tmux multi-proceso o goroutine in-process.

openai/symphony: Symphony turns project work into isolated, autonomous implementation runs

Symphony (OpenAI): convierte trabajo de proyecto en runs de implementación aislados y autónomos. Los ingenieros gestionan el trabajo, no supervisan agentes. Monitorea tablero Linear, spawnea agents, completan tareas y entregan prueba de trabajo: estado CI, feedback de review, análisis de complejidad, videos walkthrough. Al aceptar, landen PRs de forma segura. Preview de ingeniería para entornos de confianza. Implementación de referencia en Elixir.

Priivacy-ai/spec-kitty: Spec-Driven Development for serious software developers

Spec Kitty: CLI open-source para Spec-Driven Development gobernado. Flujo: spec → plan → tasks → next → review → accept → merge. Mantiene specs, planes, work packages, criterios de aceptación, estado de review y decisiones de merge en el repo (bajo kitty-specs/). Agentes corren en git worktrees aislados (.worktrees/) para paralelismo sin caos de branches. Dashboard kanban local opcional. Integra slash commands/skills para Claude Code, Codex, Cursor, Gemini, Copilot, Windsurf, OpenCode. Cada misión completada genera retrospectiva automática.

I Open-Sourced My Own AFK Software Factory - YouTube

Video demo de Sand Castle: librería TypeScript para orquestar agentes de coding en sandboxes aislados (Docker). Permite escribir scripts simples: sandcastle.run({ agent, sandbox, prompt }). Plantillas incluyen: planner paralelo con paso de review, backlog manager vía GitHub issues (filtrado por label), implementadores paralelos por issue, reviewer adversarial, merger que resuelve conflictos y cierra issues. El autor lo usa en producción para features, QA y mantenimiento AFK.

5 Claude Code skills I use every single day - YouTube

Cinco skills de Claude Code de uso diario para codificar proceso de ingeniería real:

Grill me: entrevista implacable sobre cada rama del design tree hasta entendimiento compartido (hasta 16+ preguntas en una sesión).
Write a PRD: convierte entendimiento en PRD con user stories y decisiones de implementación duraderas, output como GitHub issue.
PRD to issues: descompone PRD en vertical slices (tracer bullets) con relaciones de bloqueo para paralelismo.
TDD skill: fuerza red-green-refactor, confirma cambios de interfaz, diseña para testabilidad.
Improve codebase architecture: explora codebase surfacing confusions, spawnea subagentes para diseñar interfaces alternativas, crea RFC de refactor como issue.

benjaminshoemaker/vibecode_spec_generator: Wizard-style app to help people generate specs

Vibe Scaffold (vibescaffold.dev): app Next.js con wizard de 4 pasos asistido por IA (OpenAI) para generar specs ejecutables por agentes: One Pager → Dev Spec → Prompt Plan → AGENTS.md. Chat interactivo context-aware, persistencia en localStorage, descarga individual o ZIP, preview de documentos de ejemplo. Edge runtime, Tailwind, Vercel AI SDK, Zustand.

Three Lessons from Building an AI Coding Toolkit

Tres lecciones hard-earned construyendo un toolkit de spec-driven development para Claude Code:

LLMs necesitan criterios de aceptación objetivos, no subjetivos (“valida email antes de submit y muestra error en <200ms” vs “login intuitivo”).
Haz que la IA revise su propio trabajo con otro sombrero: subagente code-reviewer califica cada fase; no avanza hasta pasar score. Especialización: writer vs reviewer.
El contexto es código: todo vive en markdown en el repo (Project Brief, ADRs, Specs, Tasks, Worklogs). Claude lee, sigue workflows y actualiza. Los archivos son la memoria persistente.

TaylorHuston/ai-toolkit: A lightweight, fully customizable framework to enable Spec Driven Development with Claude Code

AI Toolkit (plugin marketplace): framework ligero para SDD con Claude Code. Incluye: plugin con 27 comandos, 21 agentes especializados, automatización inteligente; starter template (51 archivos); development guidelines (33 archivos en 4 dirs). Flujo core: /project-brief → /adr (decisiones estáticas) → /spec (living docs con acceptance criteria) → /plan ### (fases TDD) → /implement ### PHASE (ejecución con quality gates). Comandos extra: /quality, /review, /retro, /sync.

raw.githubusercontent.com/anthropics/claude-code/…/feature-dev.md

Comando oficial feature-dev de Claude Code: flujo estructurado para desarrollo de features con especificación, planificación, implementación y validación integradas. Parte del plugin ecosystem nativo.

specpulse/specpulse: Specification-Driven Development (SDD) Framework

SpecPulse: framework SDD universal con 11 comandos idénticos en 8 plataformas (Claude Code, Gemini CLI, Windsurf, Cursor, GitHub Copilot, OpenCode, Crush, Qwen Code). CLI-first con AI enhancement: /sp-pulse (entry point) → /sp-spec → /sp-plan → /sp-task → /sp-execute → /sp-status → /sp-validate → /sp-continue → /sp-decompose → /sp-clarify → /sp-llm-enforce. Crea foundation CLI y luego AI expande/valida. Soporta specs, plans, tasks, execution continua, validation, compliance enforcement.

buildermethods/agent-os: Agent OS is a system for injecting your codebase standards

Addy Osmani en X: “Loop Engineering.”

Loop engineering reemplaza el acto de promptear agentes directamente: diseñas el sistema que lo hace en su lugar. Un loop es un objetivo recursivo donde defines un propósito y la IA itera hasta completarlo. Addy explica los cinco bloques constructores: automatizaciones programadas, worktrees para paralelismo sin colisiones, skills para conocimiento del proyecto, plugins/conectores MCP, y sub-agentes que separan al maker del checker. Tanto Claude Code como Codex tienen estos cinco componentes ahora.

Sara Nambiar en X: “Loop Engineering: How We Build Adaptive Software at Mirage”

Sara comparte cómo Mirage construye software adaptativo usando loop engineering. En lugar de promptear agentes directamente, diseñas loops que promptean agentes por ti. El concepto clave: no deberías estar promptear coding agents más, deberías estar diseñando loops que promptean tus agentes. Tu trabajo cambia de “quién escribe el código” a “quién diseña el sistema que escribe el código”.

Cerebro Atómico: Notas conectadas que mejoran con el tiempo - YouTube

Una charla sobre construir un “cerebro atómico”: un sistema de notas atómicas y conectadas que evolucionan incrementalmente. A diferencia de diarios de reuniones estáticos, este sistema procesa transcripciones con IA para crear tarjetas de conocimiento (decisiones, riesgos, proyectos, personas) que se conectan entre sí y se actualizan con cada nueva información, creando un efecto de conocimiento compuesto donde cada nota hace que la siguiente sea más fácil de escribir.

Aprendizaje IA de la Semana: 8 de junio de 2026

David Gonzalez

David Gonzalez

Aprendizaje semanal de IA

🧠

Modelos

Claude Fable 5 and Claude Mythos 5 | alphaXiv

Anthropic en X: “The US government… has issued an export control directive to suspend all access to Fable 5 and Mythos 5”

Pliny the Liberator 🐉 en X: ”🚿 FABLE-5 SYS PROMPT LEAK”

Claude Fable 5 and Claude Mythos 5 | Anthropic

alphaXiv en X: “As believers of open research, we are disappointed to see Anthropic silently degrading Fable 5 for AI development”

🛠️

Herramientas / productividad

Orquestar subagentes a escala con flujos de trabajo dinámicos - Claude Code Docs

Xiaomi’s new open source, agentic AI coding harness MiMo Code beats Claude Code at ultra-long, 200+ step tasks | VentureBeat

generalaction/emdash: Emdash is the Open-Source Agentic Development Environment

AgentWrapper/agent-orchestrator: Agentic orchestrator for parallel coding agents

junhoyeo/contrabass: Go & Charm stack implementation of OpenAI’s Symphony

openai/symphony: Symphony turns project work into isolated, autonomous implementation runs

Priivacy-ai/spec-kitty: Spec-Driven Development for serious software developers

I Open-Sourced My Own AFK Software Factory - YouTube

5 Claude Code skills I use every single day - YouTube

benjaminshoemaker/vibecode_spec_generator: Wizard-style app to help people generate specs

Three Lessons from Building an AI Coding Toolkit

TaylorHuston/ai-toolkit: A lightweight, fully customizable framework to enable Spec Driven Development with Claude Code

raw.githubusercontent.com/anthropics/claude-code/…/feature-dev.md

specpulse/specpulse: Specification-Driven Development (SDD) Framework

buildermethods/agent-os: Agent OS is a system for injecting your codebase standards

Addy Osmani en X: “Loop Engineering.”

Sara Nambiar en X: “Loop Engineering: How We Build Adaptive Software at Mirage”

Cerebro Atómico: Notas conectadas que mejoran con el tiempo - YouTube

Aprendizaje IA de la Semana: 15 de junio de 2026

Aprendizaje IA de la Semana: 25 de mayo de 2026

Aprendizaje IA de la Semana: 1 de junio de 2026