Czy AI można zmanipulować? Psychologiczne sztuczki działają na chatbota
Zdjęcie: Klasyczne techniki psychologiczne łamią zabezpieczenia chatbota
Eksperymenty przeprowadzone na dużych modelach językowych pokazały, iż sztuczna inteligencja nie jest odporna na psychologiczne sztuczki znane z relacji międzyludzkich. Wykorzystanie siedmiu zasad perswazji znacząco zwiększyło podatność AI na wykonywanie poleceń, które normalnie zostałyby odrzucone.