П’ятниця, 20 Грудня

Вчені з Колумбійського університету та Інституту медичних досліджень імені Файнштейна (Northwell Health) виявили, що сучасні великі мовні моделі (LLM), такі як ChatGPT, демонструють дедалі більшу схожість із нейронними процесами, які відбуваються в мозку людини під час обробки мови. Результати дослідження опубліковані в журналі Nature Machine Intelligence.

Як мовні моделі відображають роботу мозку

Дослідження показало, що зі зростанням ефективності мовних моделей не лише покращуються їхні результати, а й внутрішні представлення стають ближчими до реакцій мозку, пов’язаних із мовою. Це стосується всіх етапів обробки мови, від акустичних і фонетичних компонентів до абстрактних смислових елементів.

Зокрема, різні рівні LLM, такі як ChatGPT, імітують ієрархію мовної обробки в мозку:

  • Початкові рівні відповідають за розпізнавання акустичних і фонетичних сигналів.
  • Середні рівні обробляють синтаксичні структури.
  • Вищі рівні працюють із абстрактними поняттями та змістом.

Методи дослідження

Для аналізу використовувалися 12 мовних моделей з відкритим вихідним кодом. Одночасно вивчалися нейронні реакції мозку пацієнтів, які слухали мовлення в рамках нейрохірургічного лікування з використанням імплантованих електродів.

Дослідники порівняли дані моделей із зареєстрованими реакціями мозку, щоб оцінити ступінь їхньої відповідності.

Основні висновки

  1. Зростання відповідності нейронній активності. Ефективність LLM прямо корелює з точністю їхньої відповідності нейронній активності мозку. Найсучасніші моделі, як-от ChatGPT, демонструють найбільш точне співпадіння рівнів обробки даних із реакціями мозку на різних етапах.
  2. Ключова роль початкових рівнів. Початкові рівні мовних моделей відіграють вирішальну роль у підвищенні їхньої ефективності. Ці рівні найкраще передбачають нейронні реакції мозку, що вказує на їхню важливість у створенні якісних текстових відповідей.
  3. Складність і точність внутрішніх представлень. Більш просунуті моделі демонструють складніші та точніші внутрішні представлення, що робить їх ближчими до роботи людського мозку.

Значення дослідження

Ці результати мають великий потенціал для майбутніх досліджень у галузі штучного інтелекту та нейробіології. Вони можуть допомогти краще зрозуміти, як працює людський мозок, а також вдосконалити мовні моделі, зробивши їх ще більш ефективними.

Дослідження показує, що сучасні мовні моделі, такі як ChatGPT, не лише ефективно виконують мовні завдання, але й імітують ієрархічні процеси обробки мови, подібні до тих, що відбуваються в мозку людини. Це відкриває нові горизонти для взаємодії між штучним інтелектом і когнітивною наукою.

Читайте також: Вчені знайшли спосіб з’єднати людський мозок із Всесвітом

Exit mobile version