Close Menu
    Facebook X (Twitter) Instagram
    Четвер, 9 Квітня
    Facebook X (Twitter) Instagram Telegram
    T4 – сучасні технології та наукаT4 – сучасні технології та наука
    • Компанії
    • Наука
    • Техно
    • Транспорт
    • Інтернет
    • ПЗ
    • Ігри
    • Lifestyle
    T4 – сучасні технології та наукаT4 – сучасні технології та наука
    Техно

    Науковці створили тест, який не може пройти жоден штучний інтелект

    Андрій НеволінАндрій Неволін13 Листопада, 2024
    Facebook Twitter Telegram

    Вчені з Epoch AI розробили новий математичний тест FrontierMath, який виявився непосильним для сучасних моделей штучного інтелекту, навіть найпросунутіших. Це ставить під сумнів швидке досягнення технологічної сингулярності, коли ШІ перевершить людський інтелект.

    FrontierMath складається з надскладних математичних задач, з якими не впоралися такі потужні моделі, як Claude 3.5 Sonnet, GPT-4o, o1-preview та Gemini 1.5 Pro. Навіть маючи доступ до середовища Python для обчислень, ці моделі розв’язали менше 2% завдань.

    Історична подія: Біткоїн перетнув позначку в $90 000: привітальне відео від Binance

    У чому унікальність FrontierMath?

    Головна відмінність цього тесту полягає в тому, що задачі в ньому абсолютно нові та раніше не публікувалися. Це означає, що нейромережі не могли “підглянути” рішення або навчитися розв’язувати подібні приклади заздалегідь.

    Результати тестування

    Найкращий результат показала модель Gemini 1.5 Pro, але навіть вона змогла розв’язати лише незначну частину завдань. LLM Grok 2 Beta від Ілона Маска взагалі не впоралася з жодним рівнянням.

    Рейтинг нейромереж за проходженням FrontierMath

    Як створювався FrontierMath?

    Для створення тесту було залучено 60 математиків з різних університетів світу. Задачі охоплюють широкий спектр математичних дисциплін, включаючи теорію чисел та алгебраїчну геометрію. Навіть досвідченим математикам може знадобитися кілька днів, щоб розв’язати одну задачу з FrontierMath.

    Що це означає?

    Результати тестування FrontierMath свідчать про те, що штучний інтелект, незважаючи на значний прогрес, все ще має обмеження, особливо в галузі складних математичних обчислень, які потребують глибокого аналізу та нестандартного мислення. Це підкреслює важливість подальших досліджень та розробок у сфері ШІ, щоб наблизитися до створення дійсно універсального інтелекту.

    Читайте також: В Китаї створили зброю, що нагадує «Зірку смерті»

    Підписуйся на наш Telegram-канал

    ChatGPT Claude Gemini GPT-4o тест ШІ штучний інтелект

    Читайте також

    Генеральний директор Apple радить обмежити користування смартфоном через вплив на мозок

    31 Березня, 2026

    ШІ за рік знатиме більше, ніж усі люди на Землі разом узяті

    30 Березня, 2026

    Танцювальне шоу роботів у Китаї закінчилося катастрофою: гуманоїд дав ляпаса дитині

    26 Березня, 2026
    Нове

    Вчені кажуть, що зміна клімату прискорила еволюцію: що це означає для людей

    9 Квітня, 2026

    У космосі виявили резервуар води, який перевищує запаси Землі у 140 трильйонів разів

    9 Квітня, 2026

    Науковці з’ясували, в якій країні живуть найщасливіші люди

    9 Квітня, 2026
    Наука

    Вчені назвали орган людини, який еволюціонував щонайменше 32 рази: його досі вважають непотрібним

    By Андрій Неволін7 Квітня, 2026
    Наука

    “У нас немає такої сили на Землі”: на Туринській плащаниці виявили слід надпотужного випромінювання

    By Андрій Неволін8 Квітня, 2026
    Наука

    Марс може стати придатним для життя всього за 15 років: що вигадали вчені

    By Андрій Неволін2 Квітня, 2026
    Facebook X (Twitter) Instagram Pinterest Telegram LinkedIn
    • Про нас
    • Редакційна політика
    • Політика конфіденційності та захисту персональних даних
    • Контакти редакції
    © 2026 T4.com.ua Копіювання текстів або зображень, поширення інформації T4.com.ua у будь-якій формі забороняється без письмової згоди адміністрації T4.com.ua Цитування матеріалів сайту T4.com.ua дозволено за умови відкритого для пошукових систем гіперпосилання на конкретний матеріал не нижче другого абзацу.

    Type above and press Enter to search. Press Esc to cancel.