Close Menu
    Facebook X (Twitter) Instagram
    Субота, 7 Лютого
    Facebook X (Twitter) Instagram Telegram
    T4 – сучасні технології та наукаT4 – сучасні технології та наука
    • Компанії
    • Наука
    • Техно
    • Транспорт
    • Інтернет
    • ПЗ
    • Ігри
    • Lifestyle
    T4 – сучасні технології та наукаT4 – сучасні технології та наука
    Техно

    Науковці створили тест, який не може пройти жоден штучний інтелект

    Андрій НеволінАндрій Неволін13 Листопада, 2024
    Facebook Twitter Telegram

    Вчені з Epoch AI розробили новий математичний тест FrontierMath, який виявився непосильним для сучасних моделей штучного інтелекту, навіть найпросунутіших. Це ставить під сумнів швидке досягнення технологічної сингулярності, коли ШІ перевершить людський інтелект.

    FrontierMath складається з надскладних математичних задач, з якими не впоралися такі потужні моделі, як Claude 3.5 Sonnet, GPT-4o, o1-preview та Gemini 1.5 Pro. Навіть маючи доступ до середовища Python для обчислень, ці моделі розв’язали менше 2% завдань.

    Історична подія: Біткоїн перетнув позначку в $90 000: привітальне відео від Binance

    У чому унікальність FrontierMath?

    Головна відмінність цього тесту полягає в тому, що задачі в ньому абсолютно нові та раніше не публікувалися. Це означає, що нейромережі не могли “підглянути” рішення або навчитися розв’язувати подібні приклади заздалегідь.

    Результати тестування

    Найкращий результат показала модель Gemini 1.5 Pro, але навіть вона змогла розв’язати лише незначну частину завдань. LLM Grok 2 Beta від Ілона Маска взагалі не впоралася з жодним рівнянням.

    Рейтинг нейромереж за проходженням FrontierMath

    Як створювався FrontierMath?

    Для створення тесту було залучено 60 математиків з різних університетів світу. Задачі охоплюють широкий спектр математичних дисциплін, включаючи теорію чисел та алгебраїчну геометрію. Навіть досвідченим математикам може знадобитися кілька днів, щоб розв’язати одну задачу з FrontierMath.

    Що це означає?

    Результати тестування FrontierMath свідчать про те, що штучний інтелект, незважаючи на значний прогрес, все ще має обмеження, особливо в галузі складних математичних обчислень, які потребують глибокого аналізу та нестандартного мислення. Це підкреслює важливість подальших досліджень та розробок у сфері ШІ, щоб наблизитися до створення дійсно універсального інтелекту.

    Читайте також: В Китаї створили зброю, що нагадує «Зірку смерті»

    Підписуйся на наш Telegram-канал

    ChatGPT Claude Gemini GPT-4o тест ШІ штучний інтелект

    Читайте також

    Смартфони Samsung та Apple можна перетворити на точні детектори радіації

    4 Лютого, 2026

    Інсайдер показав на відео, як виглядатиме перший складаний смартфон Apple: iPhone Fold стане елітним гаджетом

    4 Лютого, 2026

    Вчені використали штучний інтелект для створення вірусу, якого ніколи не існувало в природі

    27 Січня, 2026
    Нове

    Вони є на всіх континентах: загадкові символи вказують на цивілізацію, що зникла 40 тисяч років тому

    7 Лютого, 2026

    Вчені зазирнули всередину льодовика Судного дня: побачене підтверджує найгірші сценарії затоплення міст

    7 Лютого, 2026

    Вчені показали істоту, яка кілька днів може жити без голови

    6 Лютого, 2026
    Наука

    Це будували не люди: дослідник опублікував докази “інопланетного” походження єгипетських пірамід

    By Андрій Неволін6 Лютого, 2026
    Наука

    Найбільша печера світу має довжину 524 кілометри і продовжує рости

    By Андрій Неволін2 Лютого, 2026
    Наука

    Вчені виявили підземний океан “білого золота” вартістю $2,3 трильйона

    By Андрій Неволін1 Лютого, 2026
    Facebook X (Twitter) Instagram Pinterest Telegram
    Контакти

    © 2026 T4.com.ua Копіювання текстів або зображень, поширення інформації T4.com.ua у будь-якій формі забороняється без письмової згоди адміністрації T4.com.ua Цитування матеріалів сайту T4.com.ua дозволено за умови відкритого для пошукових систем гіперпосилання на конкретний матеріал не нижче другого абзацу.

    Type above and press Enter to search. Press Esc to cancel.