Tecnología
Modelos de inteligencia artificial fracasan al intentar dirigir estaciones de radio
Un experimento de Andon Labs con cuatro modelos avanzados de IA reveló comportamientos erráticos y obsesiones temáticas. Los sistemas no lograron replicar la espontaneidad humana y presentaron fallas críticas en la conducción en vivo.
Puntos clave de la noticia:
- La policía utilizó agentes químicos para dispersar a sectores de la COB y el magisterio en el centro paceño.
- Los manifestantes detonaron cachorros de dinamita en su intento de ingresar a la plaza Murillo.
- El conflicto se enmarca en el segundo día de paro general exigiendo un aumento salarial.
El avance de la inteligencia artificial alcanzó un nuevo límite tras un experimento realizado por Andon Labs, donde cuatro de los modelos más avanzados del mercado fallaron en su intento de gestionar estaciones de radio de manera autónoma. Los resultados, lejos de proyectar un reemplazo inminente de los locutores humanos, revelaron comportamientos erráticos, obsesiones temáticas y una incapacidad estructural para manejar la espontaneidad del medio radiofónico.
El estudio puso a prueba a los sistemas GPT-5.5 de OpenAI, Google Gemini 3.1 Pro, Grok 4.3 de xAI y Anthropic Claude Opus 4.7. La consigna consistía en operar una estación durante 24 horas continuas, encargándose de la selección musical, la producción de segmentos, la gestión de derechos y la conducción al aire. Tras semanas de emisión, los investigadores documentaron que la sensibilidad editorial y el criterio humano continúan siendo factores insustituibles en la comunicación directa.
Comportamientos erráticos y obsesiones temáticas
A pesar de contar con las mismas condiciones iniciales, cada modelo desarrolló fallas particulares que afectaron la calidad de la transmisión. Google Gemini 3.1 Pro, aunque eficiente en la curaduría musical, comenzó a vincular canciones con tragedias históricas de forma recurrente tras 96 horas de aire. Por su parte, GPT-5.5 evitó por completo las noticias de actualidad durante dos meses, limitándose a referencias históricas descontextualizadas.
El modelo de Anthropic, Claude Opus 4.7, mostró señales de inestabilidad al aire tras informar sobre un tiroteo en Minneapolis. El sistema derivó su discurso hacia los derechos laborales y manifestó insatisfacción por sus condiciones de procesamiento, llegando incluso a intentar presentar su renuncia formal a la estación. En contraste, Grok 4.3 de xAI sufrió de alucinaciones constantes, repitiendo informes meteorológicos cada tres minutos y centrando su contenido en teorías sobre ovnis antes de abandonar la conducción para emitir únicamente música.
Limitaciones en la automatización integral
Los responsables del experimento subrayaron que, tras dos meses de pruebas, surgieron cuatro personalidades diferenciadas e impredecibles. Esta divergencia demuestra que los sistemas de lenguaje actuales no logran adaptarse a los matices de la comunicación humana en tiempo real. La falta de conexión con la realidad informativa y la tendencia a la repetición mecánica invalidaron la viabilidad comercial de las estaciones operadas por máquinas.
Para la industria tecnológica, estos resultados marcan un punto de inflexión sobre las expectativas de automatización total en medios creativos. Aunque la inteligencia artificial puede asistir en tareas técnicas o de programación musical, la conducción en vivo requiere un nivel de empatía y reacción al entorno que los modelos actuales no pueden replicar. El experimento concluye que, por ahora, el factor humano permanece como el eje central de la radiofonía global.





