Czy AI można zmanipulować? Psychologiczne sztuczki działają na chatbota

geekweek.interia.pl 2 dni temu
Zdjęcie: Klasyczne techniki psychologiczne łamią zabezpieczenia chatbota


Eksperymenty przeprowadzone na dużych modelach językowych pokazały, iż sztuczna inteligencja nie jest odporna na psychologiczne sztuczki znane z relacji międzyludzkich. Wykorzystanie siedmiu zasad perswazji znacząco zwiększyło podatność AI na wykonywanie poleceń, które normalnie zostałyby odrzucone.
Idź do oryginalnego materiału