Forklog
2024-04-15 09:23:09

Стартап xAI представил первую мультимодальную версию Grok-1.5V

Компания Илона Маска xAI представила новую модель чат-бота Grok, способную обрабатывать запросы в различных форматах. Презентация состоялась спустя несколько недель после релиза предыдущей версии. «Grok-1.5V конкурирует с существующими мультимодальными моделями в ряде областей: от междисциплинарных рассуждений до понимания научных диаграмм, графиков и скриншотов», — говорится в блоге. Разработчики привели в пресс-релизе несколько примеров, демонстрирующих новые возможности чат-бота: преобразование наброска блок-схемы в код Python; генерация сказки на ночь из детского рисунка; объяснение мемов;  преобразование таблицы в формат CSV-файла. Пример перевода наброска схемы в код на Python. Данные: xAI. Протестировав аналоги GPT-4V, Claude 3Sonnet, Claude 3 Opus и Gemini Pro 1.5, xAI утверждает, что ее мультимодальная модель занимает лидирующие позиции по многим параметрам. Сравнение ИИ-моделей. Данные: xAI. Представители компании сделали акцент на том, что Grok-1.5V превосходит своих конкурентов в бенчмарке RealWorldQA — новой метрике, созданной для оценки пространственного понимания реального мира. Примеры прохождения RealWorldQA. Данные: xAI. Для прохождения теста ИИ-модель обучилась на более чем 700 изображениях, сопровождаемых вопросом и ответом для каждого элемента. xAI выложила RealWorldQA в открытый доступ по лицензии Creative Commons. Grok-1.5V появилась менее чем через месяц после того, как xAI опубликовал открытый исходный код модели. По словам разработчиков, в ближайшие месяцы будут внесены «значительные» обновления в возможности чат-бота по пониманию и генерации мультимодальных сигналов. Ранние тестеры и текущие пользователи получат доступ к Grok-1.5V в ближайшее время. Напомним, в декабре 2023 года представители xAI направили уведомление в SEC о планах по привлечению $1 млрд через частную продажу долевых ценных бумаг.

获取加密通讯
阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约