OpenAI ha tenido que suprimir la fascinación de ChatGPT por las criaturas fantásticas, pero no es el único sesgo que emerge en estos chatbots

“Pero aquí está el molesto duendecillo de las cavernas” o “una dinámica de lo más brutal, digna de un duende” son dos respuestas que ChatGPT dio a un usuario de Reddit en febrero. “Desde las versiones 5.3 y 5.4, ha empezado a comparar cualquier cosa negativa con un duende”, añadía.

A más gente le pasaba algo así: “Después de la actualización 5.4, ChatGPT usa ‘duende’ en casi todas las conversaciones. A veces es ‘gremlin’. En un chat reciente mío apareció duende tres veces en cuatro mensajes”, decía otro usuario del célebre foro tecnológico Hacker News. Tanto duendecillo ha obligado a OpenAI a mirarlo y publicar un artículo en su blog: “De dónde salen los duendecillos”.

La respuesta breve es: fue un accidente. Hasta hace poco, una de las personalidades que podía tomar ChatGPT para sus respuestas era friki (nerdy en el original inglés). En el entrenamiento de esa personalidad, animaron al modelo a que usara metáforas de criaturas fantásticas: “Sin querer, dimos recompensas altas a las metáforas con criaturas. A partir de ahí, los duendes se propagaron”, dice el artículo de OpenAI.