OpenAI выпустила модели o3 и o4⁠-⁠mini для ChatGPT — они умеют «думать картинками»

16 апреля 2025 года OpenAI представила две новые модели: o3 и o4-mini.

Обе нейросети — «рассуждающие». То есть они размышляют, прежде чем дать ответ, и строят цепочку рассуждений, которую можно посмотреть. В отличие от предыдущих моделей, o3 и o4-mini научились интегрировать изображения в процесс мышления и пользоваться другими инструментами ChatGPT.

Главные различия моделей: o3 — более мощная, но доступна по платной подписке, а o4-mini — не такая умная, зато быстрая и есть в бесплатной версии. Расскажу подробнее.

«Рассуждающие» модели научились использовать все инструменты ChatGPT. Теперь они могут искать информацию в интернете, анализировать загруженные файлы и данные с помощью Python, интерпретировать изображения, генерировать картинки, комбинировать несколько функций, если это необходимо.

Модели сами понимают, когда использовать инструменты и какие выбрать, — им не нужно напрямую указывать это в запросе.

Бесплатный курс Учебника Т⁠—⁠Ж «Как упростить жизнь с помощью нейросетей»

Модели получили визуальное мышление. Они научились встраивать изображения прямо в цепочку рассуждений. Нейросети не просто «видят» картинку — они как бы «думают» с ее помощью.

Если пользователь загрузит фото с доски, схему из учебника или нарисованный от руки эскиз, модель распознает изображение — даже размытое, отзеркаленное или плохого качества. А с помощью встроенных инструментов она может в процессе рассуждения поворачивать, приближать и преобразовывать картинки.

Источник: t-j.ru

Средний рейтинг
0 из 5 звезд. 0 голосов.