Вчені з Колумбійського університету та Інституту медичних досліджень імені Файнштейна (Northwell Health) виявили, що сучасні великі мовні моделі (LLM), такі як ChatGPT, демонструють дедалі більшу схожість із нейронними процесами, які відбуваються в мозку людини під час обробки мови. Результати дослідження опубліковані в журналі Nature Machine Intelligence.
Як мовні моделі відображають роботу мозку
Дослідження показало, що зі зростанням ефективності мовних моделей не лише покращуються їхні результати, а й внутрішні представлення стають ближчими до реакцій мозку, пов’язаних із мовою. Це стосується всіх етапів обробки мови, від акустичних і фонетичних компонентів до абстрактних смислових елементів.
Зокрема, різні рівні LLM, такі як ChatGPT, імітують ієрархію мовної обробки в мозку:
- Початкові рівні відповідають за розпізнавання акустичних і фонетичних сигналів.
- Середні рівні обробляють синтаксичні структури.
- Вищі рівні працюють із абстрактними поняттями та змістом.
Методи дослідження
Для аналізу використовувалися 12 мовних моделей з відкритим вихідним кодом. Одночасно вивчалися нейронні реакції мозку пацієнтів, які слухали мовлення в рамках нейрохірургічного лікування з використанням імплантованих електродів.
Дослідники порівняли дані моделей із зареєстрованими реакціями мозку, щоб оцінити ступінь їхньої відповідності.
Основні висновки
- Зростання відповідності нейронній активності. Ефективність LLM прямо корелює з точністю їхньої відповідності нейронній активності мозку. Найсучасніші моделі, як-от ChatGPT, демонструють найбільш точне співпадіння рівнів обробки даних із реакціями мозку на різних етапах.
- Ключова роль початкових рівнів. Початкові рівні мовних моделей відіграють вирішальну роль у підвищенні їхньої ефективності. Ці рівні найкраще передбачають нейронні реакції мозку, що вказує на їхню важливість у створенні якісних текстових відповідей.
- Складність і точність внутрішніх представлень. Більш просунуті моделі демонструють складніші та точніші внутрішні представлення, що робить їх ближчими до роботи людського мозку.
Значення дослідження
Ці результати мають великий потенціал для майбутніх досліджень у галузі штучного інтелекту та нейробіології. Вони можуть допомогти краще зрозуміти, як працює людський мозок, а також вдосконалити мовні моделі, зробивши їх ще більш ефективними.
Дослідження показує, що сучасні мовні моделі, такі як ChatGPT, не лише ефективно виконують мовні завдання, але й імітують ієрархічні процеси обробки мови, подібні до тих, що відбуваються в мозку людини. Це відкриває нові горизонти для взаємодії між штучним інтелектом і когнітивною наукою.
Читайте також: Вчені знайшли спосіб з’єднати людський мозок із Всесвітом