PARROT: Persuasion and Agreement Robustness Rating of Output Truth
arXiv
LLM'lerin otorite ve ikna baskisi altinda dogru cevabi terk etme egilimini olcen davranissal robustness benchmark'i.
Publications
arXiv
LLM'lerin otorite ve ikna baskisi altinda dogru cevabi terk etme egilimini olcen davranissal robustness benchmark'i.
arXiv
RDP'nin klasik cizgi sadeleştirme mantigini LLM embedding trajectory analizine tasiyan geometri odakli adaptasyon calismasi.
Procedia Computer Science
Turkce bilgi erisimi icin dense retrieval ve late-interaction yaklasimlarini karsilastiran akademik benchmark calismasi.