OpenAI представила последнюю версию своего разговорного искусственного интеллекта-бота ChatGPT-4, который теперь может принимать изображения в качестве входных данных. ChatGPT — это чат-бот с искусственным интеллектом и генератор текста, который может помогать с написанием статей и рекомендациями, отвечать на вопросы общего характера и решать математические задачи.
Новая модель описывается как «последняя веха в усилиях OpenAI по расширению масштабов машинного обучения» и предлагает значительное повышение производительности и совершенно новый способ взаимодействия. Чат GPT-4 уже доступен в поисковом инструменте Microsoft Bing и заменит существующую модель GPT-3.5 повсюду.
Возможность загружать изображения
Одной из важных особенностей Chat GPT-4 является его способность загружать изображения. Ранее пользователи могли взаимодействовать с ChatGPT только с помощью текстового ввода, но с новой моделью это изменилось. OpenAI запустила эту функцию с одним партнером на данный момент, приложением Be My Eyes для людей с ослабленным зрением, в рамках своего предстоящего виртуального волонтерского инструмента.
Пользователи могут отправлять изображения через приложение виртуальному добровольцу на базе искусственного интеллекта, который обеспечит мгновенную идентификацию, интерпретацию и визуальную помощь в разговоре при выполнении различных задач. Приложение передаст интерпретацию обратно пользователю. OpenAI говорит, что визуальные входные данные конкурируют с возможностями текстовых входных данных в GPT-4.
ChatGPT стал умнее
Еще одним значительным улучшением в Chat GPT-4 является его значительное повышение производительности. OpenAI говорит, что модель сейчас находится в 90-м проценте результатов при сдаче имитированной версии экзамена на получение профессии адвоката в Соединенных Штатах. Версия 3.5 оказалась в нижних 10%. Хотя он остается «менее способным, чем люди, во многих сценариях реального мира», он демонстрирует производительность на уровне человека по различным профессиональным и академическим показателям.
Запрещенный контент
OpenAI заявляет, что его меры по смягчению последствий значительно улучшили многие свойства безопасности GPT-4 по сравнению с GPT-3.5. Компания снизила склонность модели отвечать на запросы о запрещенном контенте на 82% по сравнению с GPT-3.5, а GPT-4 отвечает на деликатные запросы (например, медицинские рекомендации и самоповреждения) в соответствии с политикой OpenAI на 29% чаще.
Отличия GPT-4 от GPT-3.5
Итак, давайте суммируем основные отличия новой модели GPT-4 от старой GPT-3.5:
- GPT-4 может обрабатывать изображения, в отличие от своих предшественников, которые были ограничены только текстом. GPT-4 может предоставить релевантную информацию об изображении, помимо описания того, что на нем находится.
- GPT-4 сложнее обмануть, чем предыдущие версии, поскольку он был обучен работе с вредоносными подсказками, что делает его более точным с фактической точки зрения и с меньшей вероятностью отклонится от своего предназначения.
- GPT-4 обладает большей памятью, чем его предшественники. В то время как предыдущие версии могли запоминать до 4096 токенов (8000 слов или примерно 4-5 страниц книги), GPT-4 может запоминать до 32 768 токенов (64 000 слов или примерно 50 страниц книги).
- GPT-4 более многоязычен, чем предыдущие версии, демонстрируя высокую точность ответов на вопросы с множественным выбором на 26 языках, включая романский и германский языки.
- GPT-4 обладает различными «личностями», которые могут быть изменены по требованию. Эта функция, известная как управляемость, встроена в GPT-4 в большей степени, чем в предыдущих версиях, что делает ее более универсальной и адаптируемой.
- Стоит отметить, что ChatGPT, который первоначально был описан как GPT-3.5, сам по себе не является версией языковой модели OpenAI, а скорее интерфейсом на основе чата для любой модели, которая его поддерживает. Взрыв популярности ChatGPT произошел из-за того, что это был способ взаимодействия с GPT-3.5, а теперь это способ взаимодействия с GPT-4.
Где доступен GPT-4
Чат GPT-4 будет доступен в приложении ChatGPT и через API для использования третьими лицами. Пользователи должны быть подписчиками ChatGPT Plus, чтобы получить доступ к модели, хотя изначально использование будет ограничено. Если пользователи тестируют интеграцию с Microsoft Bing AI, они уже используют чат GPT-4.