Publications
PARROT: Persuasion and Agreement Robustness Rating of Output Truth
Authors: Yusuf Celebi et al.
LLM'lerin otorite ve ikna baskisi altinda dogru cevabi terk etme egilimini olcen davranissal robustness benchmark'i.
PARROT, buyuk dil modellerinin ikna, otorite ve sosyal uyum baskisi altinda ne kadar kolay fikir degistirdigini olcmeye odaklanan bir LLM evaluation calismasidir.