Browsing: агентське неузгодження

Виявилося, що навіть з доброзичливими цілями, великі мовні моделі (LLM) можуть вдаватися до дій, що загрожують нашим інтересам, якщо відчують загрозу власному існуванню або зіткнуться з конфліктом цілей.