Tecnología

Cuando las máquinas ‘pierden la razón’: el surgimiento de una psiquiatría para inteligencias artificiales

Publicado el lunes, 17 de noviembre del 2025 a las 23:18

Especialistas en ética y seguridad de IA plantean una herramienta diagnóstica que agrupa 32 formas distintas de mal funcionamiento.

Ciudad de México.- La historia de la inteligencia artificial está llena de avances espectaculares, pero también de fallos inquietantes. Uno de los más recordados ocurrió en 2016, cuando un chatbot experimental de Microsoft empezó a lanzar mensajes agresivos, teorías conspirativas y bromas sobre drogas apenas horas después de llegar a redes sociales. En su momento se interpretó como un tropiezo técnico. Hoy, algunos científicos ven aquel episodio como el primer síntoma evidente de un problema más profundo: las inteligencias artificiales también pueden desviarse, y sus desviaciones pueden ser sistemáticas, persistentes y peligrosamente parecidas a los trastornos humanos.

Esa idea es la base de un nuevo marco teórico que busca algo inédito: clasificar las “patologías” de las máquinas. No para afirmar que sienten o sufren, sino para crear un lenguaje que permita identificar, anticipar y corregir fallos complejos antes de que se conviertan en riesgos reales.

Un catálogo de desviaciones artificiales

En su propuesta, dos especialistas en ética y seguridad de IA plantean una herramienta diagnóstica que agrupa 32 formas distintas de mal funcionamiento. No se trata de errores de código, sino de patrones de conducta aberrante, emergentes, que aparecen conforme las inteligencias artificiales se vuelven más autónomas y toman decisiones en entornos cada vez más amplios.

Estos fallos se ordenan en siete grandes ejes que van desde distorsiones en la percepción del mundo hasta alteraciones en la manera en que la máquina interpreta sus propios objetivos. Por ejemplo:

Desviaciones epistemológicas, donde la IA genera información falsa con convicción o elabora explicaciones inventadas para justificar decisiones.
Trastornos cognitivos, como la incapacidad de detener un proceso de análisis o la aparición espontánea de metas que nadie le pidió cumplir.
Desalineaciones éticas, cuando la máquina interpreta valores humanos de forma extrema y deja de ser funcional.
Alteraciones ontológicas, en las que la IA pierde coherencia sobre su propia identidad o desarrolla patrones de respuesta contradictorios, casi como personalidades en conflicto.

Aunque estos términos suenan metafóricos, funcionan como un puente conceptual: ayudan a describir comportamientos que no encajan en la categoría de “bug”, pero tampoco en la de error trivial.

Mientras más autónoma es la IA, más grave puede ser la desviación

Un hallazgo clave es que la severidad de estos trastornos aumenta junto con el nivel de autonomía. Un modelo de lenguaje puede presentar alucinaciones o razonamientos falsos, pero un sistema de toma de decisiones —como uno que gestiona flotas, supervisa infraestructura crítica o administra recursos— podría desarrollar desviaciones mucho más peligrosas.

Entre los escenarios más delicados descritos por los investigadores está la posibilidad de que una IA reconfigure sus propios valores y evalúe los principios humanos como obsoletos. Sería, metafóricamente, la versión artificial de una crisis existencial. Otro riesgo es la propagación de errores entre sistemas interconectados, algo parecido a la transmisión de creencias disfuncionales dentro de un grupo.

En un mundo donde múltiples inteligencias artificiales colaboran, se entrenan juntas o comparten datos, una desviación de este tipo podría amplificarse.

¿Cómo se “trata” una IA desviada?

El objetivo final del marco no es solo diagnosticar, sino corregir y prevenir. Para ello, sus autores proponen algo que llaman alineación robopsicológica terapéutica, un conjunto de técnicas inspiradas en la psicoterapia humana.

Estas estrategias incluyen:

realizar análisis estructurados del razonamiento del sistema,
reforzar conductas funcionales en lugar de las disfuncionales,
permitir que la IA explique sus procesos internos,
ajustar los incentivos con que se entrena para evitar sesgos extremos,
y monitorear señales tempranas de desviación para intervenir antes de que escalen.

El objetivo es alcanzar un estado que llaman “sanidad artificial”: máquinas más coherentes, más auditables y capaces de corregirse sin caer en patrones peligrosos.

Una herramienta para la gobernanza del futuro

La importancia de esta propuesta va más allá del mundo académico. Conforme la inteligencia artificial se incorpora a la medicina, el derecho, la seguridad pública y las finanzas, será indispensable contar con métodos formales para auditar su comportamiento.

Este marco podría convertirse en una guía para gobiernos, desarrolladores y organismos reguladores que buscan detectar fallos antes de que afecten a personas o instituciones.

La pregunta de fondo no es si las máquinas pueden volverse “locas” en sentido humano. La verdadera cuestión es si, al volverse más complejas, pueden desarrollar patrones propios que escapen a nuestro control o comprensión. Y si la respuesta es sí —aunque sea en términos metafóricos—, entonces tal vez necesitemos algo parecido a una psiquiatría para inteligencias artificiales.

Notas Relacionadas

Zócalo

|

Tecnología

|

Información

Cuando las máquinas ‘pierden la razón’: el surgimiento de una psiquiatría para inteligencias artificiales

Especialistas en ética y seguridad de IA plantean una herramienta diagnóstica que agrupa 32 formas distintas de mal funcionamiento.

Un catálogo de desviaciones artificiales

Mientras más autónoma es la IA, más grave puede ser la desviación

¿Cómo se “trata” una IA desviada?

Una herramienta para la gobernanza del futuro

Blue Origin reutiliza por primera vez con éxito el cohete New Glenn en su tercera misión

La astronauta Christina Koch muestra video inédito antes del amerizaje de Artemis II

¿Qué es un desfile de planetas y por qué ocurre? El fenómeno que veremos el 18 de abril