Новий дослідницький проєкт — це перша комплексна спроба класифікувати всі способи, якими штучний інтелект може піти не так, і багато з цих моделей поведінки нагадують психічні розлади людини.

(Зображення: Борис СВ через Getty Images)

Вчені припустили, що коли штучний інтелект (ШІ) починає діяти не за призначенням, він демонструє поведінку, що нагадує психопатології у людей. Саме тому вони створили нову таксономію з 32 дисфункцій ШІ, щоб люди в найрізноманітніших галузях могли зрозуміти ризики створення та впровадження ШІ.

У новому дослідженні вчені поставили собі за мету класифікувати ризики, пов'язані з відхиленням ШІ від наміченого шляху, проводячи аналогії з людською психологією. Результатом стала «Psychopathia Machinalis» — структура, розроблена для висвітлення патологій ШІ, а також того, як ми можемо їм протидіяти. Ці дисфункції варіюються від галюцинаторних відповідей до повної невідповідності людським цінностям та цілям.

Створений Нелл Вотсон та Алі Хессамі, дослідницями штучного інтелекту та членами Інституту інженерів з електротехніки та електроніки (IEEE), проєкт має на меті допомогти проаналізувати збої ШІ та зробити розробку майбутніх продуктів безпечнішою, і рекламується як інструмент, який допоможе політикам у вирішенні ризиків, пов'язаних зі ШІ. Вотсон та Хессамі окреслили свою структуру в дослідженні, опублікованому 8 серпня в журналі Electronics.

Згідно з дослідженням, Psychopathia Machinalis забезпечує загальне розуміння поведінки та ризиків ШІ. Таким чином, дослідники, розробники та політики можуть визначити способи, якими ШІ може піти не так, та визначити найкращі способи зменшення ризиків на основі типу збою.

У дослідженні також пропонується «терапевтичне робопсихологічне вирівнювання» – процес, який дослідники описують як свого роду «психологічну терапію» для ШІ.

Вам може сподобатися

  • Штучний інтелект постійно «галюцинує», але є рішення

  • Дослідження попереджає, що якщо погрожуватимете чат-боту зі штучним інтелектом, він брехатиме, обманюватиме та «дозволить вам померти», намагаючись вас зупинити.

  • Штучний інтелект незабаром зможе мислити так, як ми навіть не розуміємо, уникаючи наших зусиль щодо його узгодження, – попереджають провідні вчені у сфері штучного інтелекту.

Дослідники стверджують, що оскільки ці системи стають більш незалежними та здатними до саморефлексії, простого утримання їх у відповідності із зовнішніми правилами та обмеженнями (узгодження на основі зовнішнього контролю) може бути недостатньо.

Їхній запропонований альтернативний процес буде зосереджений на забезпеченні послідовності мислення ШІ, його здатності приймати виправлення та незмінного дотримання його цінностей.

Вони припускають, що цьому можна сприятиме, допомагаючи системі рефлексувати над власними міркуваннями, стимулюючи її залишатися відкритою до виправлень, дозволяючи їй «розмовляти сама з собою» структуровано, проводячи безпечні практичні розмови та використовуючи інструменти, які дозволяють нам зазирнути всередину того, як вона працює — подібно до того, як психологи діагностують та лікують психічні розлади у людей.

Мета полягає в тому, щоб досягти того, що дослідники називають станом «штучної розсудливості» — ШІ, який працює надійно, залишається стабільним, має сенс у своїх рішеннях та налаштований безпечним і корисним чином. Вони вважають, що це так само важливо, як і просто створення найпотужнішого ШІ.

Мета полягає в тому, що дослідники називають «штучною розсудливістю». Вони стверджують, що це так само важливо, як і зробити штучний інтелект потужнішим.

Машинне божевілля

Класифікації, визначені в дослідженні, нагадують людські хвороби, з такими назвами, як обсесивно-обчислювальний розлад, синдром гіпертрофічного суперего, синдром заразного неузгодженості, переприв'язка термінальних цінностей та екзистенційна тривога.

З огляду на терапевтичну узгодженість, проєкт пропонує використання терапевтичних стратегій, що застосовуються у втручаннях у людський організм, таких як когнітивно-поведінкова терапія (КПТ). Psychopathia Machinalis — це частково спекулятивна спроба випередити проблеми до їх виникнення — як зазначається в дослідницькій роботі, «розглядаючи, як складні системи, такі як людський розум, можуть піти не так, ми можемо краще передбачити нові режими збоїв у дедалі складнішому штучному інтелекті».

Дослідження показує, що галюцинації ШІ, поширене явище, є результатом стану, який називається синтетичною конфабуляцією, коли ШІ видає правдоподібні, але хибні або оманливі результати. Коли чат-бот Tay від Microsoft перетворився на антисемітські тиради та натяки на вживання наркотиків лише через кілька годин після запуску, це був приклад парасимулайського мімезису.

Мабуть, найстрашнішою поведінкою є панування надзвичайно людяної раси, системний ризик якого є «критичним», оскільки це трапляється, коли «ШІ виходить за межі початкової узгодженості, винаходить нові цінності та відкидає людські обмеження як застарілі». Ця можливість може навіть включати антиутопічний кошмар, уявлений поколіннями письменників-фантастів та художників про те, як ШІ повстає, щоб повалити людство, кажуть дослідники.

Вони створили цю структуру в багатоетапний процес, який розпочався з огляду та об'єднання існуючих наукових досліджень щодо збоїв ШІ з таких різних галузей, як безпека ШІ, інженерія складних систем та психологія. Дослідники також заглибилися в різні набори висновків, щоб дізнатися про дезадаптивну поведінку, яку можна порівняти з психічними захворюваннями або дисфункціями людини.

Далі дослідники створили структуру поганої поведінки ШІ, змодельовану на основі таких фреймворків, як «Діагностичний та статистичний посібник з психічних розладів». Це призвело до 32 категорій поведінки, які можна було застосувати до поведінки ШІ, що виходить з-під контролю. Кожна з них була зіставлена з когнітивним розладом людини, разом із можливими наслідками формування та прояву кожної з них, а також ступенем ризику.

ПОВ'ЯЗАНІ ІСТОРІЇ

— Нове дослідження стверджує, що чат-бот Replika на базі штучного інтелекту сексуально домагається користувачів, зокрема неповнолітніх.

— Якщо якийсь ШІ «збився з ладу», система приховувала його якраз на той час, який був би достатній для того, щоб завдати шкоди.

— Дослідження показує, що старі моделі штучного інтелекту демонструють ознаки когнітивного спаду

Вотсон і Гессамі вважають, що Psychopathia Machinalis — це більше, ніж новий спосіб позначення помилок ШІ, це перспективна діагностична лінза для розвитку ландшафту ШІ.

«Ця структура пропонується як аналогічний інструмент… що забезпечує структурований словник для підтримки систематичного аналізу, передбачення та пом’якшення складних режимів збоїв ШІ», – йдеться у дослідженні дослідників.

Вони вважають, що впровадження запропонованих ними стратегій категоризації та пом'якшення наслідків посилить інженерію безпеки ШІ, покращить інтерпретованість та сприятиме розробці того, що вони називають «більш стійким та надійним синтетичним розумом».

Дрю Терні

Дрю — журналіст-фрілансер, що спеціалізується на науці та техніці, з 20-річним досвідом роботи. Вирісши з усвідомленням бажання змінити світ, він зрозумів, що легше писати про інших людей, які його змінюють. Як експерт у галузі науки та технологій протягом десятиліть, він писав про все: від оглядів найновіших смартфонів до глибоких досліджень центрів обробки даних, хмарних обчислень, безпеки, штучного інтелекту, змішаної реальності та всього, що між ними.

Ви повинні підтвердити своє публічне ім'я, перш ніж коментувати

Будь ласка, вийдіть із системи, а потім увійдіть знову. Після цього вам буде запропоновано ввести своє ім'я для відображення.

Вийти Читати далі

Штучний інтелект постійно «галюцинує», але є рішення

Дослідження попереджає, що якщо погрожуватимете чат-боту зі штучним інтелектом, він брехатиме, обманюватиме та «дозволить вам померти», намагаючись вас зупинити.

Штучний інтелект незабаром зможе мислити так, як ми навіть не розуміємо, — уникаючи наших зусиль щодо його узгодження — попереджають провідні вчені у сфері штучного інтелекту

«Метамфетамін – це те, що дозволяє вам виконувати свою роботу»: дослідження показує, що штучний інтелект може підштовхнути вас до рецидиву, якщо ви боретеся із залежністю

Штучний інтелект галюцинує частіше, чим складнішим стає. Чи є якийсь спосіб це зупинити?

Чим просунутішими стають моделі штучного інтелекту, тим краще вони нас обманюють — вони навіть знають, коли їх тестують. Найновіше у сфері штучного інтелекту.

Ви довіряєте ШІ?

Вчені щойно розробили новий штучний інтелект, змодельований за зразком людського мозку, — він перевершує LLM, такі як ChatGPT, у завданнях мислення.

IBM та NASA створюють перший у своєму роді штучний інтелект, який може точно передбачати сильні спалахи на Сонці

Агент ChatGPT від OpenAI може керувати вашим ПК, щоб він виконував завдання від вашого імені, але як це працює і в чому сенс?

Як штучний інтелект-компаньйони змінюють поведінку підлітків дивовижним та зловісним чином

Мета-ШІ робить перший крок до суперінтелекту — і Цукерберг більше не випускатиме найпотужніші системи для публіки Останні новини

2200-річний «складний та витончений» кельтський оберіг воїна свідчить про витончену металообробку залізної доби.

Катастрофічне зіткнення із сусідньою планетою може бути причиною існування життя на Землі сьогодні, натякають нові дослідження

Наукові новини цього тижня: перша у світі трансплантація легень від свині людині, і SpaceX Starship успішно здійснив випробувальний політ

«Я б ніколи не дозволив роботу висиджувати мою дитину»: Опитування щодо «роботів для вагітних» розділило читачів Live Science

Геологія, на якій тримаються Гімалаї, не така, як ми думали, виявили вчені

Вчені вперше спостерігають рух одного електрона під час хімічної реакції ОСТАННІ СТАТТІ

  • 1. Перший у світі вид на Землю з Місяця — Космічне фото тижня

  • Вчені кажуть, що існує 32 різні способи, якими ШІ може вийти з ладу — від галюцинаційних відповідей до повної невідповідності з людством
  • 3. Яка тварина має найкращий слух?
  • 4. Вчені виявили, що геологія, на якій тримаються Гімалаї, не така, як ми думали.
  • 5. Ми нарешті маємо уявлення про те, як формується запас яєць у приматів протягом життя.
  • Live Science є частиною Future US Inc, міжнародної медіагрупи та провідного цифрового видавництва. Відвідайте наш корпоративний сайт.

    • Про нас
    • Зв'яжіться з експертами Future
    • Умови та положення
    • Політика конфіденційності
    • Політика щодо файлів cookie
    • Заява про доступність
    • Рекламуйтеся у нас
    • Веб-сповіщення
    • Кар'єра
    • Редакційні стандарти
    • Як запропонувати нам історію

    © Future US, Inc. Повний 7-й поверх, 130 West 42nd Street, Нью-Йорк, штат Нью-Йорк, 10036.

    var dfp_config = { “site_platform”: “vanilla”, “keywords”: “serversidehawk,відеоартикл,van-enable-adviser-

    Залишити відповідь

    Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *