Yusuf Çelebi

Applied AI Scientist

LLM sistemleri, retrieval, agentic AI ve model davranışı üzerine çalışan Applied AI Scientist. Araştırma fikirlerini RAG, graph memory, değerlendirme ve üretim odaklı AI pipeline'larına dönüştürmeye odaklanıyorum.

İletişim

E-posta Tel WhatsApp

Yusuf Çelebi

Applied AI Scientist

LLM sistemleri, retrieval, agentic AI ve model davranışı üzerine çalışan Applied AI Scientist. Araştırma fikirlerini RAG, graph memory, değerlendirme ve üretim odaklı AI pipeline'larına dönüştürmeye odaklanıyorum.

İletişim

E-posta Tel WhatsApp

Projelerim

PARROT: Sycophancy Robustness Benchmark

Oluşturulma Tarihi: 21 May 2026 Güncelleme: 21 May 2026

LLM'lerin otorite ve ikna baskısı altında doğru cevabı bırakıp yanlış iddiaya uyma eğilimini ölçen davranışsal robustness benchmark'ı.

PARROT, aynı sorunun nötr ve otoriter biçimde yanlış yönlendirilmiş versiyonlarını karşılaştırarak sycophancy etkisini izole eder.

Çalışma 22 modeli, 1,302 MMLU tarzı çoktan seçmeli soru ve 13 alan üzerinde değerlendirir; log-likelihood tabanlı confidence shift takibi ve sekiz durumlu davranış taksonomisi kullanır.

arXiv:2511.17220

GitHub'da Görüntüle Proje Listesine Dön

Menü

Yusuf Çelebi

Applied AI Scientist

İletişim

PARROT: Sycophancy Robustness Benchmark