Група ізраїльських учених навчила модель штучного інтелекту перекладати клинопис стародавньої акадської мови. Результати їхньої роботи вже тішать археологів
Переклад – це не просто заміна слів. При перекладі важливо розуміти, як обидві мови пов’язують думки між собою, а потім використовувати ці знання для збереження нюансів оригіналу. Цей процес значно ускладнюється в задачах адаптації стародавніх мов, які потрібно не тільки воскресити, а й заповнити культурний контекст, який часто втрачений через нестачу джерел.
Приклад – аккадська мова, яка використовувалася в Стародавній Месопотамії (територія сучасних Сирії та Іраку) у період між 2800 роком до н. е. та 500 роком н. е. Щоб прискорити його вивчення, група з археологів та IT-фахівців розробила ШІ-інструмент, здатний практично миттєво перекладати з аккадської.
Збереглася мова
Акадська мова дійшла до нашого часу у вигляді текстів, нанесених на таблички, — писар наносив клинопис очеретяним стілусом на вологі глиняні прямокутники перед їх випалом. Це виявилося на руку сучасним археологам — матеріал краще протистоїть пожежам та повеням, ніж папірус чи пергамент.

Складнощі перекладу
Незважаючи на велику кількість табличок, вкрай важко правильно перекласти стародавні бібліотеки. Справа в тому, що аккадська мова полівалентна: клинописні знаки можуть мати кілька різних значень залежно від того, як кожен з них функціонує в реченні, яке місце в ньому займає.
Переклад з аккадської мови складається із двох етапів. Спочатку вчені повинні транслітерувати клинописні знаки – зафіксувати схожі по фонетиці звуки. Після цього настає етап адаптації з урахуванням полівалентних особливостей.
Машинний переклад від ШІ
Команда ізраїльських дослідників розробила нейронну модель машинного перекладу з аккадської. Схожа технологія лежить в основі Google Перекладача. Вчені навчили модель ШІ на вибірці із клинописних текстів. Після цього вона змогла перекладати їх двома способами – через транслітерацію чи безпосередньо, адаптуючи знаки до слів. У результаті модель пройшла оцінку можливостей. Вона продемонструвала, що результати роботи ШІ були високоякісними в обох випадках. Дослідники зазначають: «Практично у кожному випадку тип промови тексту був пізнаваний. Перспективний сценарій на майбутнє полягає в тому, щоб модель показувала ще й список джерел, від яких відштовхувалася під час перекладу, що було б особливо корисним для наукових цілей».

Робота над помилками
Над результатами ще доведеться попрацювати. В обох випадках деякі тестові пропозиції були перекладені неправильно. Як і інші моделі ШІ, ця схильна до галюцинацій – моментів, коли відповідь не має ніякого зв’язку з вихідним текстом.
Модель ШІ найкраще працює при перекладі коротких та середніх за довжиною речень. Крім того, вона ефективніше справляється з шаблоннішими жанрами на кшталт указів та звітів, ніж з міфами, гімнами та пророцтвами. Зі збільшенням числа тренувань на більшому наборі даних команда має намір підвищити точність ШІ та використовувати його як асистент, результати роботи якого перевіряють вчені.


Підписуйся на наш Telegram-канал