ChatGPT - Как и зачем Digital Signage AI

ChatGPT - Как и зачем Digital Signage AI

Вы читали о ChatGPT, DALL-E, Stable Diffusion и многом другом. Все они являются примерами последнего технического увлечения: генеративного ИИ.

В этой статье мы рассмотрим генеративный ИИ, способы его использования в цифровых вывесках и перспективы. Так что если вы хотите быть впереди в своей стратегии цифровых вывесок, читайте дальше!

Введение

Мир генеративного ИИ находится в огне. Сверхмощные алгоритмы пишут код, сочиняют истории и создают изображения, которые могут бросить вызов тесту Тьюринга. Под покровом тайны глубоко сложные процессы машинного обучения пробираются сквозь миллиарды созданных человеком слов, графики и кода, становясь с каждой минутой все более интеллектуальными и творческими.

А поскольку эти алгоритмы полностью доступны через Web API, их легко внедрить в ваш опыт работы с Intuiface.

Давайте потратим немного времени на понимание мира генеративного ИИ, его ценности для цифровых вывесок и того, как его можно использовать в Intuiface.

Что такое генеративный искусственный интеллект?

Генеративный искусственный интеллект (ИИ) - это подмножество машинного обучения, которое позволяет компьютерам создавать новый контент - такой как текст, аудио, видео, изображения или код - используя знания о ранее созданном контенте. На выходе получается аутентичный и полностью оригинальный контент.

Алгоритмы, создающие этот уникальный контент, основаны на моделях, которые отражают уроки, полученные по определенной теме. Эти уроки не программируются; вместо этого алгоритмы обучаются сами с помощью механизма, известного как глубокое обучение, совершенствуя свои модели по мере поступления все большего количества данных по теме. Среди многих интересных аспектов этой технологии - гибкость механизма обучения, который адаптируется ко всем аспектам человеческого самовыражения. Достижимы как эстетика изображения, так и формализм кода JavaScript!

Каковы наиболее популярные варианты генеративного ИИ?

Наиболее известным примером генеративного ИИ является GPT - в настоящее время он представлен GPT-3.5, последней версией модели предсказания языка третьего поколения в серии GPT. Созданный OpenAI, этот алгоритм может быть адаптирован для создания изображений и всего, что имеет языковую структуру: он отвечает на вопросы, пишет эссе, составляет резюме более длинных текстов, пишет программный код и даже переводит языки. OpenAI предоставил модели GPT около 570 ГБ текстовой информации из Интернета, чтобы достичь этой способности к естественному языку. Хотите попробовать? Зайдите на сайт ChatGPT, создайте бесплатный аккаунт и начните разговор.

Для генерации изображений наиболее известными вариантами являются DALL-E (также основанный на GPT), Midjourney и StableDiffusion. Как и ChatGPT, эти сервисы принимают на вход естественный язык, но их выходной информацией являются изображения. Изображения могут быть выполнены в любом стиле - от вдохновленных искусством тем, таких как кубизм или импрессионизм, до абсолютно реалистичных изображений, которые выглядят как фотографии, но были созданы алгоритмом.

Как работает генеративный искусственный интеллект

Ха! Если вы ищете трактат о науке глубокого обучения, это не то место. Однако мы можем рассказать о том, как эти модели работают с пользователями.

Запросы на текст и изображения подаются в виде "подсказки". Подсказки - это предложения на естественном языке, которые выражают желаемый результат. Создание подсказок - это развивающееся искусство, потому что чем более конкретной и описательной является подсказка, тем больше вероятность того, что вы получите именно то, что хотите.

Теперь вы можете удовлетворить свое желание увидеть "Йоду, сидящего на Железном троне из "Игры престолов" у домашней тарелки в Фенуэй-парке".

Как вы узнаете ниже, большинство сервисов генеративного искусственного интеллекта доступны через набор API. Через эти API бизнес-услуги - и, в наших корыстных интересах, цифровые вывески - могут включать эту технологию.

Как рынок B2B использует генеративный искусственный интеллект

В настоящее время существует длинный (и растущий) список компаний, использующих генеративный ИИ.

На графике ниже в колонке слева указаны наиболее распространенные на рынке генеративные модели. Справа указаны различные области решений и компании, использующие генеративные модели для предоставления услуг в этих областях.

Как традиционные цифровые вывески могут использовать преимущества генеративного искусственного интеллекта

Генеративный искусственный интеллект может стать отличной технологией-компаньоном для создания уникальных и увлекательных цифровых вывесок. С его помощью цифровые вывески могут динамически создавать и отображать контент в реальном времени, который идеально вписывается в контекст. Этот контент может зависеть от поведения пользователя или внешних источников данных, от прогноза погоды до цен в реальном времени.

Примеры:

  • Создание контекстно-зависимых изображений, отражающих текущую информацию, обстановку или аудиторию.
  • Генерировать резюме и/или переводы непредсказуемых текстов, таких как новостные сообщения или спортивные события.
  • Переписывать сообщения с различными тонами и длиной в зависимости от аудитории или срочности.
  • Наиболее серьезным препятствием является производительность, особенно при генерации изображений, поскольку современные решения генеративного ИИ не являются (пока) мгновенными. В зависимости от сложности запроса и сложности желаемого результата, генерация изображения может занять даже несколько секунд. В результате, вывески должны быть проактивными в запросе на контент, чтобы гарантировать отсутствие визуальных задержек.

Как интерактивные цифровые вывески повышают ценность генеративного ИИ

Применяя интерактивные цифровые вывески, которые позволяют понять предпочтения пользователя, вы можете пойти дальше в использовании Generative AI. Теперь вы не ограничены только внешним контекстом; вы обладаете глубокими знаниями о своей аудитории и можете общаться соответственно.

Под "интерактивным" мы понимаем любой тип человеко-машинного общения, как активный, так и пассивный. Активные варианты включают прикосновения, жесты и голос, а пассивные - сенсоры и компьютерное зрение. Для всех видов взаимодействия в сочетании с контекстом и экранным контентом цифровые табло могут четко определить интересы пользователя.

Примеры включают:

  • Использование данных о пользователе для создания персонализированных "аватаров" на время сеанса.
  • Добавление причудливой индивидуальности во взаимодействие, создание шуток и остроумных отступлений для пользователя в контексте того, что в противном случае могло бы быть скучным цифровым взаимодействием.
  • Преобразование обзора заказов в корзине в разговорный текст для придания человечности использованию киоска.
  • Использование технологии анонимного распознавания лиц для определения возраста/пола и использование этой информации для персонализации общения.
  • Перевод постоянно меняющихся источников данных, таких как каталог продукции или туристическая информация.
  • Для любого сценария на естественном языке дизайнер - или пользователь - может выбрать динамическое преобразование текста в речь (TTS) с помощью либо специфических сервисов ОС, либо с помощью генеративных голосовых сервисов ИИ, таких как VALL-E.

Во всех случаях творческая группа освобождается от необходимости предвидеть широкий спектр потенциальных пользователей/сценариев/требований. Они могут просто положиться на ресурс генеративного ИИ, который сделает всю работу в режиме реального времени.

Использование генеративного ИИ в Intuiface

Поскольку многие сервисы генеративного ИИ открываются через веб-интерфейсы API, текстовый запрос ("подсказка") может быть программно отправлен, а ответ в виде текста/изображения получен в режиме реального времени для отображения. Благодаря Intuiface API Explorer пользователи Intuiface могут легко создавать интеграции с этими веб-интерфейсами, несмотря на то, что практически не имеют представления о том, как они работают.

Большинство веб-интерфейсов API для генеративного ИИ разрешают ограниченное бесплатное использование и требуют токенов или системы оплаты на основе изображений для внедрения в масштабе. Вот несколько примеров API, все из которых поддерживаются Intuiface API Explorer:

  • OpenAI для создания, завершения и перевода текста
  • DALL-E (на базе OpenAI) для генерации изображений
  • Как отмечалось выше, хороший пример DALL-E можно найти в нашем сообществе пользователей.      ‍
  • Стабильная диффузия для генерации изображений
  • Объяснение того, как использовать Stable Diffusion в Intuiface, находится здесь.
  • Официальный API ChatGPT пока недоступен, но предположительно будет выпущен в ближайшее время...
  • Например, Паоло Тозолини, партнер Intuiface, Tosolini Productions, опубликовал в нашем сообществе пользователей отличный пример того, как он использовал API Explorer для создания интеграции в реальном времени с DALL-E.

Хотя в приведенном выше примере используется пользовательский интерфейс на базе Intuiface, который зависит от человеческого ввода для создания подсказки (и, соответственно, изображения), Intuiface также может извлекать информацию из окружающей среды и использовать ее для создания подсказки. Например, подсказка может включать слова, связанные с текущей температурой, количеством или присутствием проходящих мимо людей, временем суток и т.д. - Все эти данные собираются и осмысленно комбинируются для генеративного алгоритма ИИ в режиме реального времени.

Как отмечалось выше, при таком подходе опытный дизайнер освобождается от необходимости определять все возможные сценарии и создавать соответствующие ответы в упреждающем режиме. Изображения и копия могут быть автоматически созданы генеративным сервисом ИИ на основе бесконечных контекстов окружающей среды и предоставлены практически в режиме реального времени. Такая автоматическая генерация контента - это революция для цифровых табло!

Генеративный искусственный интеллект и цифровые вывески - взгляд в будущее

Генеративный ИИ постоянно развивается и становится все более доступным. Он будет все чаще использоваться в сетях цифровых вывесок, поскольку становится все дешевле, быстрее и проще в использовании. Это позволит предприятиям создавать уникальные впечатления, адаптированные к индивидуальному зрителю или окружающей обстановке.

Можно представить себе полностью автоматизированную справочную службу, систему рекомендаций (по одежде, питанию, местам отдыха) или гида. Возможности генеративного ИИ для цифровых вывесок - и нашей жизни! - практически безграничны. По мере развития этой технологии ее потенциальное применение будет расти в геометрической прогрессии.

Вы можете начать исследование уже сегодня. Используйте Intuiface, чтобы окунуть ногу в воду, поэкспериментировать с технологией и использовать ее для улучшения интерактивных возможностей.

Написать комментарий

Написать в Telegram
Написать в WhatsApp
Написать сообщение