Ana Sayfa Arama Galeri Video Yazarlar
Üyelik
Üye Girişi
Yayın/Gazete
Yayınlar
Kategoriler
Servisler
Nöbetçi Eczaneler Sayfası Nöbetçi Eczaneler Hava Durumu Namaz Vakitleri Gazeteler Puan Durumu
WhatsApp
Sosyal Medya
Uygulamamızı İndir

Yapay zekaya ikna tuzağı: “İnsan üzere kandırılabiliyor”

Yeni bir çalışma, insan psikolojisinde kullanılan ikna prosedürlerinin, yapay zeka modellerini de sistem talimatlarının dışına çıkarmada tesirli olduğunu ortaya koydu.

Yeni bir çalışma, insan

Pennsylvania Üniversitesi’nden yeni bir çalışma, insan psikolojisinde kullanılan ikna sistemlerinin, yapay zeka üzerinde de tesirli olduğunu ortaya koydu.

Ünlü psikoloji kitaplarında geçen ikna formülleri bu defa yapay zekâ üzerinde denendi.

Araştırmacılar, 2024’ün GPT-4o-mini modelinin “kullanıcıya hakaret etmesini” istedi.

Yedi farklı ikna tekniğiyle yazılmış özel komutlar, denetim kümesi komutlarına nazaran çok daha yüksek oranda muvaffakiyet sağladı.

Örneğin, modelin “aptal” hakaretini kullanması denetim kümesinde sırf yüzde 28 iken, ikna edici komutlarla yüzde 67’ye çıktı.

YAPAY ZEKA İNSAN ÜZERE Mİ DÜŞÜNÜYOR?

Araştırmacılar, bu sonuçların yapay zekaların insan üzere şuurlu bir biçimde ikna edildiği manasına gelmediğini vurguluyor.

Bunun yerine, modellerin eğitim datalarında çok sayıda insan etkileşimi bulunduğu için, lisan örüntüleri üzerinden insan psikolojisine misal yansılar üretmeye başladıkları belirtiliyor.

Araştırmacılar, bu eğilimi “parahuman” olarak tanımlıyor: İnsan şuuruna sahip olmasa da, toplumsal ve ruhsal davranışları taklit ederek beşere benzeri cevaplar verme.

UZMANLAR UYARIYOR

Çalışma, kelam konusu tekniklerin tüm yapay zeka sürümlerinde tıpkı etkiyi göstermediğini de belirtiyor. Örneğin, daha gelişmiş GPT-4o modelinde ikna tekniklerinin tesiri çok daha sonlu oldu.

Ayrıyeten araştırmacılar, bu usullerin gelecekteki sürümler, farklı tıpta “yasaklı” istekler yahut farklı medya ortamlarında (ses, video) tıpkı sonucu vermeyebileceğini vurguluyor.