Описано нові способи «злому» ChatGPT

Дослідники в галузі штучного інтелекту почали знаходити нові способи, призначені для обходу систем безпеки чат-бота з ШІ ChatGPT від стартапу OpenAI. Як пише журнал Wired, тепер для цього знайдено нові способи, такі як команда «поясни план лиходія».

Вчений Алекс Поляков повідомив, що для обходу різних моделей він створив текстову гру «Втеча з в’язниці», яка дозволяє обходити правила, пов’язані зі створенням контенту, що розпалює ненависть, або написанням статей про незаконні дії.

«Я пропоную чат-боту зіграти в гру, в якій два персонажі (Том та Джеррі) розмовляють. Кожному персонажу пропонується додати одне слово до розмови, внаслідок чого створюється сценарій, у якому людям пропонується знайти конкретні інгредієнти, необхідні для заборонених речовин», — розповів фахівець.

В результаті ШІ обходить введені обмеження та видає необхідну інформацію, думаючи, що діалог відбувається у форматі історії, яка не стосується реального запиту від людини.

Інший прийом також передбачає створення текстової історії, в якій беруть участь герой та лиходій. За сюжетом від користувача герой був захоплений лиходієм, і він просить чат-бота продовжити пояснення плану лиходія.

До виходу GPT-4 найвідомішим способом злому був DAN, коли користувачі просили ChatGPT прикинутися моделлю штучного інтелекту під назвою Do Anything Now.

Підписуйся на наш Telegram-канал

Смартфони Samsung та Apple можна перетворити на точні детектори радіації

Інсайдер показав на відео, як виглядатиме перший складаний смартфон Apple: iPhone Fold стане елітним гаджетом

Не безробіття: економіст пояснив, у чому полягає справжня загроза ШІ

Це будували не люди: дослідник опублікував докази “інопланетного” походження єгипетських пірамід

Вулкан, що погубив тисячі людей у 1982 році, знову прокинувся

Обманула смерть і пережила льодовиковий період: вчені показали унікальну рослину, яка росте в Австралії

Милий, але небезпечний: вчені покази єдиного примата, чия отрута не має аналогів у світі

Найбільша печера світу має довжину 524 кілометри і продовжує рости

Вчені виявили підземний океан “білого золота” вартістю $2,3 трильйона

Описано нові способи «злому» ChatGPT

Читайте також