Por qué a la IA le gustan tanto los duendecillos y Japón

OpenAI ha tenido que suprimir la fascinación de ChatGPT por las criaturas fantásticas, pero no es el único sesgo que emerge en estos chatbots

“Pero aquí está el molesto duendecillo de las cavernas” o “una dinámica de lo más brutal, digna de un duende” son dos respuestas que ChatGPT dio a un usuario de Reddit en febrero. “Desde las versiones 5.3 y 5.4, ha empezado a comparar cualquier cosa negativa con un duende”, añadía.

A más gente le pasaba algo así: “Después de la actualización 5.4, ChatGPT usa ‘duende’ en casi todas las conversaciones. A veces es ‘gremlin’. En un chat reciente mío apareció duende tres veces en cuatro mensajes”, decía otro usuario del célebre foro tecnológico Hacker News. Tanto duendecillo ha obligado a OpenAI a mirarlo y publicar un artículo en su blog: “De dónde salen los duendecillos”.

La respuesta breve es: fue un accidente. Hasta hace poco, una de las personalidades que podía tomar ChatGPT para sus respuestas era friki (nerdy en el original inglés). En el entrenamiento de esa personalidad, animaron al modelo a que usara metáforas de criaturas fantásticas: “Sin querer, dimos recompensas altas a las metáforas con criaturas. A partir de ahí, los duendes se propagaron”, dice el artículo de OpenAI.

Por qué a la IA le gustan tanto los duendecillos y Japón

Related reading

Tu ‘chatbot’ favorito no es tu amigo

El lado siniestro de ChatGPT

OpenAI promete proteger a los menores en ChatGPT, pero los expertos advierten:…

La IA cruza la frontera de la intimidad sin que la humanidad haya conseguido…

La IA funciona con sesgos y por adulación, lo que provoca una pérdida del…

Modo ‘beta’ global: el experimento masivo de la IA