Вчені щойно розробили новий штучний інтелект, змодельований за зразком людського мозку, — він перевершує LLM, такі як ChatGPT, у завданнях мислення.

(Зображення: Євген Мімрін/Getty Images)

Вчені розробили новий тип моделі штучного інтелекту (ШІ), яка може міркувати інакше, ніж більшість моделей великих мов програмування (LLM), таких як ChatGPT, що призводить до значно кращої продуктивності в ключових тестах.

Новий штучний інтелект для мислення, який називається ієрархічною моделлю мислення (HRM), натхненний ієрархічною та багаточасовою обробкою в людському мозку — тим, як різні області мозку інтегрують інформацію протягом різної тривалості (від мілісекунд до хвилин).

Вчені з Sapient, компанії зі штучного інтелекту в Сінгапурі, стверджують, що ця модель міркування може досягати кращої продуктивності та працювати ефективніше. Це завдяки тому, що модель вимагає менше параметрів та навчальних прикладів.

Модель HRM має 27 мільйонів параметрів при використанні 1000 навчальних зразків, повідомили вчені в дослідженні, завантаженому 26 червня до бази даних arXiv препринтів (яка ще не пройшла рецензування). Для порівняння, більшість просунутих LLM мають мільярди або навіть трильйони параметрів. Хоча точна цифра не була оприлюднена, деякі оцінки показують, що нещодавно випущена GPT-5 має від 3 до 5 трильйонів параметрів.

Новий спосіб мислення для ШІ

Коли дослідники протестували HRM у бенчмарку ARC-AGI — відомому своєю складністю тесту, метою якого є перевірка того, наскільки близькі моделі до досягнення загального штучного інтелекту (AGI), — система досягла вражаючих результатів, згідно з дослідженням.

Вам може сподобатися

  • Дослідження показує, що передові моделі штучного інтелекту від OpenAI та DeepSeek зазнають «повного колапсу», коли проблеми стають надто складними.

  • Штучний інтелект постійно «галюцинує», але є рішення

  • Штучний інтелект перехитрив 30 найкращих математиків світу на секретній зустрічі в Каліфорнії

HRM набрав 40,3% в ARC-AGI-1, порівняно з 34,5% для o3-mini-high від OpenAI, 21,2% для Claude 3.7 від Anthropic та 15,8% для Deepseek R1. У складнішому тесті ARC-AGI-2 HRM набрав 5% проти 3% для o3-mini-high, 1,3% для Deepseek R1 та 0,9% для Claude 3.7.

Більшість просунутих програм LLM використовують метод ланцюжка думок (CoT), в якому складна проблема розбивається на кілька, набагато простіших проміжних кроків, що виражаються природною мовою. Він імітує процес людського мислення, розбиваючи складні проблеми на зручні для засвоєння частини.

Але вчені Sapient стверджують у дослідженні, що CoT має ключові недоліки, а саме: «крихке розкладання завдань, великі вимоги до даних та висока затримка».

Натомість, HRM виконує послідовні завдання міркування за один прямий прохід, без будь-якого явного контролю проміжних кроків, через два модулі. Один модуль високого рівня відповідає за повільне, абстрактне планування, тоді як модуль низького рівня обробляє швидкі та детальні обчислення. Це схоже на те, як людський мозок обробляє інформацію в різних регіонах.

Він працює, застосовуючи ітеративне уточнення — обчислювальну техніку, яка покращує точність розв'язку шляхом багаторазового уточнення початкового наближення — протягом кількох коротких імпульсів «роздумів». Кожен імпульс розглядає, чи слід продовжувати процес роздумів, чи його слід подати як «остаточну» відповідь на початкове запитання.

ПОВ'ЯЗАНІ ІСТОРІЇ

— Мета-ШІ робить перший крок до суперінтелекту — і Цукерберг більше не випускатиме найпотужніші системи для публіки

— Дослідження попереджає, що якщо погрожувати чат-боту зі штучним інтелектом, він брехатиме, обманюватиме та «дозволить вам померти», намагаючись вас зупинити.

— «У кращому випадку безрозсудно, а в гіршому — оманливо та небезпечно»: Не вірте галасі — ось чому штучний інтелект не такий, як кажуть мільярдери

HRM досяг майже ідеальної продуктивності у складних завданнях, таких як складні головоломки судоку, з якими не могли впоратися звичайні LLM, а також досяг успіху в оптимальному пошуку шляху в лабіринтах.

Стаття не пройшла рецензування, але організатори бенчмарку ARC-AGI спробували відтворити результати для себе після того, як вчені дослідження опублікували свою модель у відкритому коді на GitHub.

Хоча вони відтворили цифри, представники повідомили в блозі, вони зробили деякі несподівані висновки, зокрема, що ієрархічна архітектура мала мінімальний вплив на продуктивність — натомість існував недостатньо документований процес удосконалення під час навчання, який призвів до суттєвого підвищення продуктивності.

Кеумарс Афіфі-Сабет, редактор каналу, технології

Кьомарс — редактор відділу технологій у Live Science. Він писав для різних видань, зокрема ITPro, The Week Digital, ComputerActive, The Independent, The Observer, Metro та TechRadar Pro. Він пропрацював журналістом у сфері технологій понад п'ять років, раніше обіймав посаду редактора спеціалізованих матеріалів в ITPro. Він має кваліфікацію журналіста NCTJ та ступінь з біомедичних наук Лондонського університету Королеви Марії. Він також зареєстрований як дипломований менеджер-основоположник в Chartered Management Institute (CMI), отримавши кваліфікацію керівника команди 3-го рівня з відзнакою у 2023 році.

Ви повинні підтвердити своє публічне ім'я, перш ніж коментувати

Будь ласка, вийдіть із системи, а потім увійдіть знову. Після цього вам буде запропоновано ввести своє ім'я для відображення.

Вийти Читати далі

Дослідження показує, що передові моделі штучного інтелекту від OpenAI та DeepSeek зазнають «повного колапсу», коли проблеми стають надто складними.

Штучний інтелект постійно «галюцинує», але є рішення

Штучний інтелект перехитрив 30 найкращих математиків світу на секретній зустрічі в Каліфорнії

Штучний інтелект незабаром зможе мислити так, як ми навіть не розуміємо, уникаючи наших зусиль щодо його узгодження, – попереджають провідні вчені у сфері штучного інтелекту.

Нове дослідження стверджує, що ШІ «розуміє» емоції краще за нас

Нова система штучного інтелекту може «передбачати поведінку людини в будь-якій ситуації» з безпрецедентним ступенем точності, стверджують вчені.

Ви довіряєте ШІ?

Вчені кажуть, що ШІ може вийти з ладу 32 різними способами — від галюцинаційних відповідей до повної невідповідності з людством

IBM та NASA створюють перший у своєму роді штучний інтелект, який може точно передбачати сильні спалахи на Сонці

Агент ChatGPT від OpenAI може керувати вашим ПК, щоб він виконував завдання від вашого імені, але як це працює і в чому сенс?

Як штучний інтелект-компаньйони змінюють поведінку підлітків дивовижним та зловісним чином

Мета-ШІ робить перший крок до суперінтелекту — і Цукерберг більше не випускатиме найпотужніші системи для публіки Останні новини

2200-річний «складний та витончений» кельтський оберіг воїна свідчить про витончену металообробку залізної доби.

Катастрофічне зіткнення із сусідньою планетою може бути причиною існування життя на Землі сьогодні, натякають нові дослідження

Наукові новини цього тижня: перша у світі трансплантація легень від свині людині, і SpaceX Starship успішно здійснив випробувальний політ

«Я б ніколи не дозволив роботу висиджувати мою дитину»: Опитування щодо «роботів для вагітних» розділило читачів Live Science

Геологія, на якій тримаються Гімалаї, не така, як ми думали, виявили вчені

Вчені вперше спостерігають рух одного електрона під час хімічної реакції ОСТАННІ СТАТТІ

  • Археологи кажуть, що в Перу знайдено «дивну» гробницю, в якій зберігаються скелети людей з мотузками на шиях та зв'язаними за спиною руками.

  • Повний «Кукурудзяний Місяць» сходить цього тижня — він принесе більшій частині світу місячне затемнення у вигляді «кривавого місяця».
  • Вчені кажуть, що існує 32 різні способи, якими ШІ може вийти з ладу — від галюцинаційних відповідей до повної невідповідності з людством.
  • 4. Перший у світі вид на Землю з Місяця, зроблений 59 років тому — Космічне фото тижня
  • 5. У якої тварини найкращий слух?
  • Live Science є частиною Future US Inc, міжнародної медіагрупи та провідного цифрового видавництва. Відвідайте наш корпоративний сайт.

    • Про нас
    • Зв'яжіться з експертами Future
    • Умови та положення
    • Політика конфіденційності
    • Політика щодо файлів cookie
    • Заява про доступність
    • Рекламуйтеся у нас
    • Веб-сповіщення
    • Кар'єра
    • Редакційні стандарти
    • Як запропонувати нам історію

    © Future US, Inc. Повний 7-й поверх, 130 West 42nd Street, Нью-Йорк, штат Нью-Йорк, 10036.

    var dfp_config = { “site_platform”: “vanilla”, “keywords”: “type-news-daily,serversidehawk,videoarticle,van-enable-adviser-

    Залишити відповідь

    Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *