YandexGPT

Материал из Википедии — свободной энциклопедии
(перенаправлено с «YaGPT»)
Перейти к навигации Перейти к поиску
YandexGPT
Тип Большая языковая модель
Разработчик Яндекс
Первый выпуск 17 мая 2023 года
Последняя версия 4 (24 октября 2024)
Состояние функционирует
Сайт ya.ru/ai/gpt-4

YandexGPT — нейросеть семейства GPT от компании «Яндекс», которая может создавать и перерабатывать тексты, предлагать новые идеи и учитывать контекст беседы с пользователем.

Для обучения YandexGPT используется датасет, включающий в себя информацию из книг, журналов, газет и других открытых источников из интернета[1]. Нейросеть может ошибаться в фактах и фантазировать, однако по мере обучения будет выдавать всё более точные ответы.

Использование YandexGPT

[править | править код]

YandexGPT — технология, которая используется в различных продуктах для решения разных задач. Нейросеть интегрирована в виртуального помощника «Алису» и доступна в приложениях «Яндекс» и «Яндекс Старт», в «Яндекс Браузере», «Яндекс Станциях», а также в умных телевизорах с «Алисой».

YandexGPT работает на главной странице «Яндекса», в «Поиске»[2], «Маркете», «Лавке»[3], «Практикуме», «Учебнике», «Авто.ру» и других сервисах компании.

Яндекс даёт бизнесу доступ к API нейросети через Yandex Cloud и разрабатывает собственные B2B-решения на её основе.

С июля 2023 года 800 компаний приняли участие в закрытом тестировании YandexGPT[4]. ИТ‑разработчики, банки, ритейл и компании других отраслей могут использовать технологию в двух режимах: API и Playground (интерфейс в консоли Yandex Cloud для тестирования модели и проверки гипотез)[5]. 21 ноября 2024 года был запущен инструмент AI Assistant API для быстрого создания ИИ-ассистентов под различные безнес-задачи на базе YandexGPT[6].

Бизнесу доступны две версии модели: одна работает в асинхронном режиме и лучше справляется с решением сложных задач, а вторая подходит для создания быстрых ответов в режиме реального времени. В результате YandexGPT испытали в десятках сценариев: для контентных задач, техподдержки, создания чат‑ботов, виртуальных ассистентов и т. д.

В июне 2024 года с помощью YandexGPT был улучшен машинный перевод в «Яндекс Переводчике», «Поиске» и в переводе видео в «Яндекс Браузере»[7].

В феврале 2023 года «Яндекс» сообщил, что разрабатывает собственную версию генеративной нейросети ChatGPT в рамках развития языковой модели из семейства YaLM (Yet another Language Model)[8]. Проект получил предварительное название YaLM 2.0, которое впоследствии поменяли на YandexGPT.

17 мая компания представила нейросеть под названием YandexGPT (YaGPT), добавив в своего виртуального ассистента «Алису» специальный навык, позволяющий взаимодействовать с новой языковой моделью[9].

5 июня 2023 года в пресс-службе «Яндекса» сообщили, что нейросеть научилась запоминать контекст беседы и задавать уточняющие вопросы[10].

15 июня 2023 года «Яндекс» добавил языковую модель YandexGPT в приложение для генерации изображений «Шедеврум»[11]. Благодаря этому его пользователи получили возможность создавать содержательные посты с текстом, заголовком и подходящей по смыслу иллюстрацией[12].

27 июня в «Яндекс» сообщили, что нейросеть научилась тезисно пересказывать статьи из интернета. Функция работает с русскоязычными текстами и статьями из интернета объёмом до 30 тысяч знаков[13].

В июле 2023 года нейросеть YandexGPT стала доступна бизнесу для создания виртуальных ассистентов и чат-ботов, а также генерирования и структурирования текстовой информации.

7 сентября 2023 года «Яндекс» представил на конференции Practical ML Conf новую версию языковой модели — YandexGPT 2[14]. По сравнению с предыдущей она способна решать больше видов задач, при этом качество её ответов улучшилось[15]. По утверждению разработчиков, YandexGPT 2 отвечает на запросы пользователей лучше первой версии нейросети в 67 % случаев[16].

14 сентября 2023 года «Яндекс» начал тестировать YandexGPT для создания быстрых ответов на запросы в «Поиске»[17]. Нейросеть в режиме реального времени находит несколько самых подходящих источников по запросу пользователя, делает краткую выжимку каждого из них, а затем выбирает наиболее полезный ответ из получившихся. Он отображается под поисковой строкой вместе со ссылкой на источник.

С 6 октября 2023 года YandexGPT может создавать краткие пересказы русскоязычных видеороликов в интернете[18]. Она обобщает видео длиной от двух минут до четырёх часов, в которых есть речь[19].

В декабре 2023 года Яндекс Казахстан открыл доступ к YandexGPT API для казахстанских компаний[20].

28 марта 2024 года Yandex запустил третье поколение нейросетей YandexGPT. Первая версия — YandexGPT 3 Pro предназначена для бизнеса и доступна пользователям Yandex Cloud[21]. По словам разработчиков, на тестах YandexGPT 3 Pro в среднем отвечает лучше, чем YandexGPT 2 в 67 % случаев, а при работе с простыми пользовательскими запросами её результаты оказались выше на 69 %[22].

28 мая 2024 года вышло третье поколение облегчённой версии нейросети YandexGPT Lite[23].

24 октября 2024 года появилось четвёртое поколение нейросети — YandexGPT 4, включающее облегчённую модель Lite и мощную Pro[24]. В декабре 2024 года YandexGPT 4 в версии Pro был впервые внедрен в массовый сервис Яндекса — Алиса Про[25].

16 апреля 2024 года Яндекс представил сервис «Нейро», он объединяет в себе возможности традиционных поисковых технологий и больших языковых генеративных моделей. В «Нейро» пользователь может задать системе любой вопрос простыми словами, YandexGPT 3 проанализирует поисковую выдачу Яндекса по запросу и объединит найденную информацию в одном сообщении со ссылками на источники. Взаимодействие с сервисом ведется в формате диалога, заданный ранее вопрос можно уточнить, а также его можно дополнить картинкой[26][27].

Обучение Yandex GPT

[править | править код]

Обучение проходит в несколько этапов:

1. Pretraining. Модель учит структуру языка и запоминает факты о мире. Ей подаются в обучение терабайты текста из интернета, книг и других общедоступных источников, отобранные с помощью поисковых моделей «Яндекса» и разбитые на небольшие фрагменты (токены)[28].

2. Fine-tuning. Эксперты оптимизируют миллиарды параметров модели, собирая большой датасет из сотен тысяч примеров максимально разнообразных задач с хорошими ответами.

Созданием качественных обучающих примеров занимаются AI-тренеры «Яндекса»[29]. Это эксперты широкого круга гуманитарных профессий: журналисты, педагоги, филологи, редакторы, социологи, психологи, филологи[30]. «Яндекс» стал первой в России компанией, которая начала нанимать и обучать таких специалистов.

3. Продуктовые доработки. Модели придают «человеческий характер», чтобы она могла отвечать на вопросы о себе и была более живой в общении[28].

Для обучения YandexGPT используются суперкомпьютеры «Яндекса»[31].

Возможности

[править | править код]

В октябре 2023 года YandexGPT 2 смогла сдать ЕГЭ по литературе на 55 баллов[32]. При этом минимальный порог, необходимый для поступления в вуз, — 40 баллов. Это первый случай в России, когда искусственный интеллект успешно справился с ЕГЭ, ответив не только на вопросы тестов, но и выполнив творческие задания[33].

В мае 2024 года заместитель председателя Совета безопасности Дмитрий Медведев раскритиковал в своем телеграм-канале нейросеть YandexGPT, на основе которой работает виртуальный помощник «Алиса». По словам зампреда Совбеза[34], разработанный компанией искусственный интеллект не даёт ответы на «нейтральные» вопросы, косвенно связанные с политикой. Медведев счёл, что такой подход «подрывает доверие» к «Яндексу». В самой компании не стали комментировать высказывания политика[35]. Нейросеть YandexGPT не готова разговаривать об Украине, о вторжении России на Украину, статусе Крыма, ДНР и ЛНР. Нейросеть также не готова разговаривать о марксизме, Владимире Путине, Александре Лукашенко, Владимире Зеленском, Михаиле Саакашвили, Юлии Навальной и рассказывать какие-либо сведения из их биографии[36]. Подвержена цензуре тема памятников Степану Бандере[36].

Примечания

[править | править код]
  1. Нейросеть Яндекса YandexGPT: что это, возможности, как пользоваться. РБК Тренды. Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  2. «Яндекс» открыл доступ к тестированию быстрых ответов YandexGPT в «Поиске». Хабр (14 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  3. YandexGPT поможет «Лавке» заполнять карточки товаров по фото этикеток. Хабр (12 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  4. Кейсы с YandexGPT, data-оркестр или бессерверный пайплайн: выбираем самое интересное с Yandex Scale’23. Хабр (29 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  5. «Яндекс» предоставил компаниям доступ к YandexGPT. Коммерсантъ (19 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 29 июня 2023 года.
  6. Яндекс запустил сервис, который поможет компаниям создавать ИИ-ассистентов на базе YandexGPT 4. seonews.ru (21 ноября 2024). Дата обращения: 29 ноября 2024.
  7. Гормалева, Наталья. «Яндекс» улучшил качество машинного перевода с помощью YandexGPT. rb.ru (7 июня 2024). Дата обращения: 10 июля 2024. Архивировано 10 июля 2024 года.
  8. Кодачигов, Валерий. Найдется что: «Яндекс» запустит для поисковика сверхсовременную нейросеть. Известия (1 февраля 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  9. «Яндекс» добавил в «Алису» генеративную нейросеть YandexGPT. Forbes.ru (17 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  10. "Нейросеть YandexGPT научилась запоминать контекст диалога". Ведомости. Архивировано 10 июня 2023. Дата обращения: 29 декабря 2023. {{cite news}}: |archive-date= / |archive-url= несоответствие временной метки; предлагается 10 июня 2023 (справка)
  11. «Яндекс» добавил в «Шедеврум» нейросеть YandexGPT для генерации текста. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  12. Яндекс встроил нейросеть YandexGPT в приложение Шедеврум. Российская газета (15 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 17 июня 2023 года.
  13. YandexGPT теперь может кратко пересказать текст. Коммерсантъ (27 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 27 июня 2023 года.
  14. "Яндекс" запустил YandexGPT 2. ТАСС. Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  15. Вышла новая версия нейросети от Яндекс — YandexGPT 2. Компьютерра (8 сентября 2023). Дата обращения: 29 декабря 2023. Архивировано 13 октября 2023 года.
  16. «Алиса» получила нейросеть YandexGPT 2 — она отвечает на вопросы лучше старой в 67 % случаев. 3DNews Daily Digital Digest. Дата обращения: 29 декабря 2023. Архивировано 28 октября 2023 года.
  17. «Яндекс» начал тестировать быстрые ответы YandexGPT. Сноб (14 сентября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  18. В "Яндекс.Браузере" появилась функция пересказа видео. ТАСС (6 октября 2023). Дата обращения: 14 января 2024. Архивировано 14 января 2024 года.
  19. Нейросеть "Яндекса" научилась кратко пересказывать видеоролики. Российская газета (6 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 6 января 2024 года.
  20. Яндекс Казахстан открывает доступ к YandexGPT API для казахстанских компаний. Tengrinews.kz (7 декабря 2023). Дата обращения: 10 июля 2024. Архивировано 10 июля 2024 года.
  21. «Яндекс» представил третье поколение нейросетей YandexGPT. РБК (28 марта 2023). Дата обращения: 30 марта 2023. Архивировано 28 марта 2024 года.
  22. Яндекс представил третье поколение нейросетей YandexGPT. 3DNews Daily Digital Digest (28 марта 2024). Дата обращения: 11 апреля 2024. Архивировано 10 апреля 2024 года.
  23. «Яндекс» запустил третье поколение YandexGPT Lite. Коммерсантъ (28 мая 2024). Дата обращения: 29 мая 2023. Архивировано 28 мая 2024 года.
  24. «Яндекс» представил новую версию языковой модели YandexGPT 4 с рассуждениями. Коммерсантъ (24 октября 2024). Дата обращения: 28 октября 2023. Архивировано 12 ноября 2024 года.
  25. «Яндекс» встроил в «Алису Про» свою самую мощную языковую модель YandexGPT 4 Pro. habr.ru (5 декабря 2024). Дата обращения: 8 декабря 2024. Архивировано 8 декабря 2024 года.
  26. «Яндекс» представил поисковый ИИ-сервис «Нейро». www.sostav.ru. Дата обращения: 2 сентября 2024. Архивировано 2 сентября 2024 года.
  27. Сидоров, Илья. Яндекс представил Нейро. Это поиск с искусственным интеллектом, который сам отвечает на любые вопросы. iPhones.ru (16 апреля 2024). Дата обращения: 2 сентября 2024. Архивировано 2 сентября 2024 года.
  28. 1 2 YandexGPT в Алисе: как мы создаём языковую модель нового поколения. Хабр (5 июня 2023). Дата обращения: 29 декабря 2023. Архивировано 5 января 2024 года.
  29. СМИ: «Яндекс» начал нанимать гуманитариев для обучения своей нейросети YaLM 2.0. Хабр (19 апреля 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  30. Нейросеть YandexGPT подключили к виртуальному помощнику "Алиса". Какое будущее ждет искусственный интеллект в России. Российская газета (18 мая 2023). Дата обращения: 29 декабря 2023. Архивировано 4 июня 2023 года.
  31. YandexGPT научилась создавать тексты в режиме реального времени. ТАСС. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  32. Нейросеть YandexGPT смогла сдать ЕГЭ по литературе. BFM.ru. Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  33. Нейросеть Яндекса YandexGPT 2 смогла получить проходной балл ЕГЭ по литературе. Код Дурова (12 октября 2023). Дата обращения: 29 декабря 2023. Архивировано 14 января 2024 года.
  34. Медведев раскритиковал «Яндекс» из-за ответов «Алисы». Коммерсантъ (19 мая 2024). Дата обращения: 21 мая 2024. Архивировано 21 мая 2024 года.
  35. Музычук, Анастасия. «Яндекс» отказался комментировать претензии Медведева из-за «дурки» от «Алисы». RTVI (19 мая 2024). Дата обращения: 21 мая 2024. Архивировано 21 мая 2024 года.
  36. 1 2 Дмитрия Медведева взбесило, что YandexGPT не хочет рассказывать про Бандеру. Знал бы он, о чем еще умалчивают нейросети «Яндекса» и «Сбера» (иногда они даже забывают, что сам Медведев был президентом). Meduza. Дата обращения: 21 мая 2024. Архивировано 21 мая 2024 года.