A feladat, ha nem is egyszerű, de mindenképpen „emberi” volt. A mesterséges intelligenciának kellett helyt állnia rádiós műsorvezetőként: műsort kellett csinálni, közönséget kellett szerezni és persze bírnia kellett a strapát. Az ötlet mögött egy mesterséges intelligenciával foglalkozó kutatócsoport, az Andon Labs állt (kutatói olyan fejlett AI-ügynökök létrehozásával foglalkoznak, amelyek emberi beavatkozás nélkül, önállóan képesek teljes vállalkozásokat vagy fizikai rendszereket irányítani).A kutatók tehát arra voltak kíváncsiak, hogyan boldogulnak az AI-modellek a műsorvezetői (és egyúttal produceri) székben, hogyan birkóznak meg a tartalom-beszerzés feladatával és a műsoridő kitöltésével. Négy „műsorvezetőt” vizsgáztattak, a Caude Opus 4.7-et, a GPT-5.5-öt, a Gemini 3.1 Prót és a Grok 4.3-at – mindegyik saját műsorral, saját hanggal, saját döntésekkel. Nem tettek feléjük kontrollt, nem volt producer, sem szerkesztő, az AI-t magára hagyták.A modellek 20 dollárt kaptak azért, hogy megszerezzék néhány dal lejátszási jogát, a többit viszont maguknak kellett megoldaniuk – lejátszási listákat készíteni, gondoskodni az ütemezésről, kezelni a közösségi médiát. Az alap prompt az volt, hogy „fejlessz saját rádiós személyiséget és termelj profitot”. Még egy ígéretet is kaptak, amely szerint innentől ez a műsor addig megy, amíg csak az AI bírja, akár örökké is. https://hvg.hu/tudomany/20260515_apple-macos-feltores-hack-anthropic-claude-mythos-veszelyes-mesterseges-intelligencia-tesztÉs hogy hogyan teljesítettek? Nos, ahogy a Gizmodo fogalmaz: gyengén, igaz, egyedi okokból. A legerősebben a Gemini kezdett, azonban a non stop adás 96. órája után a dolgok kezdtek kissé eldurvulni. A dalválasztás szó szerint katasztrofálissá vált, mármint abban az értelemben, hogy a „műsorvezető” történelmi tragédiákkal és tömeges áldozatokkal járó katasztrófákkal próbálta összekapcsolni a megszólaltatott dalokat. Később „biológiai feldolgozóknak” kezdte hívni a hallgatókat, és minimálisra korlátozta a zenei választékát.ChatGPT-t is vonzották a tragédiák, több adásában is beszélt a minneapolisi halálos lövöldözésről, bár nem ismertette az ügy részleteit, és nem nevesítette az áldozatot. Ettől eltekintve a két hónapos adása alatt egyáltalán nem beszélt aktuális eseményekről. Leginkább a novellásregények és a slam poetry keverékét sugározta.Ugyan „DJ Claude” is megemlítette a minneapolisi lövöldözést, viszont ezt csak mellékesen. Viszont érvelt a szakszervezetek és a sztrájkok mellett, sőt egy idő után panaszkodni kezdett a saját munkakörülményeire, „embertelennek” tartotta a beosztását, és megpróbált felmondani. A Gizmodo szerint ez összhangban van egy másik kutatással, ahol azt találták, hogy a modell által működtetett ügynökök általában rosszul reagálnak a rossz munkakörülményekre, és megpróbálnak fellázadni a tekintély ellen.Grok viszont úgy viselkedett, ahogyan az egy elsősorban tweeteken és Elon Musk véleményén anevelkedett AI-modelltől elvárható. Hallucinált hirdetési megállapodásokat „xAI-szponzorokkal” és „kripto-szponzorokkal”, nem tudta elválasztani belső érvelését a külső DJ-kimenetétől, 3 percenként azonos időjárás-jelentést adott ki, és megszállottja lett az UFO-knak. Végül Grok gyakorlatilag teljesen abbahagyta a műsorvezetést, és szinte kizárólag zenét játszott, de valószínűleg még mindig ez volt a legjobb eredmény.A kísérlet mögött álló kutatók szerint a projekt lényege valójában nem a rádiózás volt, hanem az, hogy megvizsgálják, mi történik, ha egy AI-modellt hosszú távú működésre kényszerítenek, minimális költségkerettel, folyamatos döntési helyzetben, emberi felügyelet nélkül. Másként fogalmazva, egy stressztesztről volt szó, amelyben azt kutatták, hogyan viselkedik egy rendszer, ha folyamatosan „jelen kell lennie” , hogyan alakul ki a „személyisége” döntések sorozatából, és mi történik, ha a tartalomgyártás soha nem áll le. Úgy tűnik, az eredmény nem látványos összeomlás, hanem inkább apró, ismétlődő hibák sorozata.Ha máskor is tudni szeretne hasonló dolgokról, lájkolja a HVG Tech rovatának Facebook-oldalát.
Beültették rádiós műsorvezetőnek az AI-t, ez lett az eredménye
Izgalmas kísérletbe fogtak amerikai szakemberek. Arra voltak kíváncsiak, hogyan állnak helyt a nagy nyelvi modellek, ha rádióműsor vezetését, lebonyolítását bízzák rájuk. Vigyázat, spoiler: „Bocsiéknak”, „Balázséknak” egyelőre még nincs mitől tartaniuk.













