Разработчики утверждают, что ответы o1 сопоставимы с ответами научных аспирантов. Кроме того, систему сложнее взломать, поскольку она не нарушает заданные параметры работы.
Во время тестирования на «джейлбрейк» preview-версия нового искусственного интеллекта набрала 88 баллов из 100, в то время как GPT-4o — только 22 балла.
Обновлённая модель показала результаты, схожие с результатами аспирантов, при решении сложных эталонных задач по физике, химии и биологии. В наших тестах мы также обнаружили, что нейросеть превосходит их в математике и программировании. На квалификационном экзамене для Международной математической олимпиады (IMO) GPT-4o правильно решила только 13% задач, а новая модель набрала 83%.
Одно из главных нововведений — способность ИИ тратить больше времени на обдумывание поставленной задачи. Нейросеть может использовать несколько стратегий и признавать свои ошибки, вместо того чтобы просто собирать ответ из слов, хранящихся в базе данных.
В OpenAI считают, что o1 подойдёт физикам для генерации сложных математических формул для квантовой оптики и разработчикам во всех сферах для выполнения многоступенчатых исследовательских или функциональных процессов.
Также компания представила модель o1-mini, которая больше подходит для решения задач программирования.