Czy AI można zmanipulować? Psychologiczne sztuczki działają na chatbota

geekweek.interia.pl 2 dni temu

Zdjęcie: Klasyczne techniki psychologiczne łamią zabezpieczenia chatbota

Eksperymenty przeprowadzone na dużych modelach językowych pokazały, iż sztuczna inteligencja nie jest odporna na psychologiczne sztuczki znane z relacji międzyludzkich. Wykorzystanie siedmiu zasad perswazji znacząco zwiększyło podatność AI na wykonywanie poleceń, które normalnie zostałyby odrzucone.

Idź do oryginalnego materiału