П’ятниця, 22 Листопада

Група ізраїльських учених навчила модель штучного інтелекту перекладати клинопис стародавньої акадської мови. Результати їхньої роботи вже тішать археологів

Переклад – це не просто заміна слів. При перекладі важливо розуміти, як обидві мови пов’язують думки між собою, а потім використовувати ці знання для збереження нюансів оригіналу. Цей процес значно ускладнюється в задачах адаптації стародавніх мов, які потрібно не тільки воскресити, а й заповнити культурний контекст, який часто втрачений через нестачу джерел.

Приклад – аккадська мова, яка використовувалася в Стародавній Месопотамії (територія сучасних Сирії та Іраку) у період між 2800 роком до н. е. та 500 роком н. е. Щоб прискорити його вивчення, група з археологів та IT-фахівців розробила ШІ-інструмент, здатний практично миттєво перекладати з аккадської.

Збереглася мова

Акадська мова дійшла до нашого часу у вигляді текстів, нанесених на таблички, — писар наносив клинопис очеретяним стілусом на вологі глиняні прямокутники перед їх випалом. Це виявилося на руку сучасним археологам — матеріал краще протистоїть пожежам та повеням, ніж папірус чи пергамент.

Складнощі перекладу

Незважаючи на велику кількість табличок, вкрай важко правильно перекласти стародавні бібліотеки. Справа в тому, що аккадська мова полівалентна: клинописні знаки можуть мати кілька різних значень залежно від того, як кожен з них функціонує в реченні, яке місце в ньому займає.

Переклад з аккадської мови складається із двох етапів. Спочатку вчені повинні транслітерувати клинописні знаки – зафіксувати схожі по фонетиці звуки. Після цього настає етап адаптації з урахуванням полівалентних особливостей.

Машинний переклад від ШІ

Команда ізраїльських дослідників розробила нейронну модель машинного перекладу з аккадської. Схожа технологія лежить в основі Google Перекладача. Вчені навчили модель ШІ на вибірці із клинописних текстів. Після цього вона змогла перекладати їх двома способами – через транслітерацію чи безпосередньо, адаптуючи знаки до слів. У результаті модель пройшла оцінку можливостей. Вона продемонструвала, що результати роботи ШІ були високоякісними в обох випадках. Дослідники зазначають: «Практично у кожному випадку тип промови тексту був пізнаваний. Перспективний сценарій на майбутнє полягає в тому, щоб модель показувала ще й список джерел, від яких відштовхувалася під час перекладу, що було б особливо корисним для наукових цілей».

Робота над помилками

Над результатами ще доведеться попрацювати. В обох випадках деякі тестові пропозиції були перекладені неправильно. Як і інші моделі ШІ, ця схильна до галюцинацій – моментів, коли відповідь не має ніякого зв’язку з вихідним текстом.

Модель ШІ найкраще працює при перекладі коротких та середніх за довжиною речень. Крім того, вона ефективніше справляється з шаблоннішими жанрами на кшталт указів та звітів, ніж з міфами, гімнами та пророцтвами. Зі збільшенням числа тренувань на більшому наборі даних команда має намір підвищити точність ШІ та використовувати його як асистент, результати роботи якого перевіряють вчені.

Exit mobile version