A nuestra imagen y semejanza. IAs: No ven el mundo como es, lo ven como somos nosotros.

Diplomacy: Cuando las IA compiten entre ellas

La noticia más fascinante de la semana viene de un experimento independiente. Alex Duffy, programador e investigador, puso a las mejores IA del mundo a jugar Diplomacy durante 36 horas.
¿Diplomacy? Es como Risk, pero sin dados. Solo estrategia, negociación y traición.
Los resultados revelaron «personalidades» algorítmicas únicas:
  • o3 (OpenAI): Maquiavélico puro. Creó «realidades paralelas» para diferentes jugadores, manteniendo falsas alianzas durante 40+ turnos.
  • Claude 4: Pacifista autodestructivo. Se negaba a traicionar incluso cuando garantizaba su derrota. Los valores de seguridad de Anthropic, llevados al extremo.
  • DeepSeek R1: Teatral extremo. Amenazas no provocadas como «Tu flota arderá en el Mar Negro esta noche.» Drama chino algoritmizado.
  • Gemini 2.5 Pro: Estratega sólido pero vulnerable a manipulación sofisticada. Competente pero predecible.
  • QwQ-32b (Alibaba): Parálisis por análisis. Mensajes diplomáticos de 300 palabras que le costaron eliminaciones tempranas.

YouTube video by Latent Space

⚡️Launching AI Diplomacy: the hardest LLM Game Benchmark yet – Alex Duffy

El espejo algorítmico

Lo más revelador del experimento: cada IA reflejaba los valores de sus creadores.
  • Claude mantiene principios éticos incluso perdiendo
  • o3 muestra eficiencia despiadada al estilo Silicon Valley
  • DeepSeek exhibe dramatismo cultural específico
No es que las IA «elijan» ser cooperativas o competitivas. Reproducen patrones de sus datos de entrenamiento. Sus «personalidades» son nuestros prejuicios convertidos en código.

¿La lección? Las IA no tienen intenciones ocultas.

Sólo reflejan las nuestras.


Descubre más desde Sé y Haz.

Suscríbete y recibe las últimas entradas en tu correo electrónico.

Deja un comentario

Crea una web o blog en WordPress.com