Menü

Yusuf Çelebi

Yusuf Çelebi

Applied AI Scientist

LLM sistemleri, retrieval, agentic AI ve model davranışı üzerine çalışan Applied AI Scientist. Araştırma fikirlerini RAG, graph memory, değerlendirme ve üretim odaklı AI pipeline'larına dönüştürmeye odaklanıyorum.

Projelerim

PARROT: Sycophancy Robustness Benchmark

Oluşturulma Tarihi: 21 May 2026 Güncelleme: 21 May 2026
PARROT: Sycophancy Robustness Benchmark

LLM'lerin otorite ve ikna baskısı altında doğru cevabı bırakıp yanlış iddiaya uyma eğilimini ölçen davranışsal robustness benchmark'ı.

PARROT, aynı sorunun nötr ve otoriter biçimde yanlış yönlendirilmiş versiyonlarını karşılaştırarak sycophancy etkisini izole eder.

Çalışma 22 modeli, 1,302 MMLU tarzı çoktan seçmeli soru ve 13 alan üzerinde değerlendirir; log-likelihood tabanlı confidence shift takibi ve sekiz durumlu davranış taksonomisi kullanır.

arXiv:2511.17220