Selbst die leistungsstärksten Versionen großer Sprachmodelle (LLMs) neigen oft noch dazu, irreführende oder falsche Antworten zu liefern. Diese sogenannten Halluzinationen können erheblichen Schaden anrichten – auch in der Wissenschaft. In einer neuen Studie konnten fast 150.000 gefälschte Zitate in Forschungsarbeiten gefunden werden. Dafür untersuchten Wissenschaftler:innen der Cornell University und der University of California insgesamt 111 Millionen Referenzen aus 2,5 Millionen wissenschaftlichen Artikeln.Anzeige
Quellen werden ungeprüft übernommen
Die meisten wissenschaftlichen Arbeiten sind zwar nicht öffentlich zugänglich, ihre Ergebnisse können dennoch reale Folgen haben. Von Technologie über Medizin bis hin zur Arbeit tragen neue, wissenschaftliche Ergebnisse dazu bei, Prozesse zu verändern. Um den Einfluss von KI auf die Forschungsliteratur zu erforschen, suchte das Team nach Zitaten, die sich keiner bekannten Veröffentlichung zuordnen ließen. Während manche Fälle auf Rechtschreibfehler zurückzuführen waren, stießen die Forscher:innen auch auf zahlreiche KI-generierte Halluzinationen.
Insgesamt wurden 146.900 falsche Referenzen gefunden. Zudem zeigte sich, dass die fehlerhaften Zitate über viele Artikel verteilt waren und sich nicht auf einzelne Fälle konzentrierten. Dieses Ergebnis deutet darauf hin, dass viele Autor:innen KI-generierte Referenzen übernehmen, ohne sie vollständig zu überprüfen. Die gefälschten Zitate tauchten in den Datenbanken Arxiv, Biorxiv, SSRN und Pubmed Central auf. Dabei handelt es sich um wissenschaftliche Datenbanken, in denen Autor:innen ihre Arbeiten vor der Veröffentlichung in Fachzeitschriften hochladen, um sie der globalen Forschungsgemeinschaft zugänglich zu machen.Anzeige









