PARROT: Persuasion and Agreement Robustness Rating of Output Truth
arXiv
LLM'lerin otorite ve ikna baskisi altinda dogru cevabi terk etme egilimini olcen davranissal robustness benchmark'i.
Publications
arXiv
LLM'lerin otorite ve ikna baskisi altinda dogru cevabi terk etme egilimini olcen davranissal robustness benchmark'i.
arXiv
RDP'nin klasik cizgi sadeleştirme mantigini LLM embedding trajectory analizine tasiyan geometri odakli adaptasyon calismasi.