ChatGPT - Как и зачем Digital Signage AI
Вы читали о ChatGPT, DALL-E, Stable Diffusion и многом другом. Все они являются примерами последнего технического увлечения: генеративного ИИ.
В этой статье мы рассмотрим генеративный ИИ, способы его использования в цифровых вывесках и перспективы. Так что если вы хотите быть впереди в своей стратегии цифровых вывесок, читайте дальше!
Введение
Мир генеративного ИИ находится в огне. Сверхмощные алгоритмы пишут код, сочиняют истории и создают изображения, которые могут бросить вызов тесту Тьюринга. Под покровом тайны глубоко сложные процессы машинного обучения пробираются сквозь миллиарды созданных человеком слов, графики и кода, становясь с каждой минутой все более интеллектуальными и творческими.
А поскольку эти алгоритмы полностью доступны через Web API, их легко внедрить в ваш опыт работы с Intuiface.
Давайте потратим немного времени на понимание мира генеративного ИИ, его ценности для цифровых вывесок и того, как его можно использовать в Intuiface.
Что такое генеративный искусственный интеллект?
Генеративный искусственный интеллект (ИИ) - это подмножество машинного обучения, которое позволяет компьютерам создавать новый контент - такой как текст, аудио, видео, изображения или код - используя знания о ранее созданном контенте. На выходе получается аутентичный и полностью оригинальный контент.
Алгоритмы, создающие этот уникальный контент, основаны на моделях, которые отражают уроки, полученные по определенной теме. Эти уроки не программируются; вместо этого алгоритмы обучаются сами с помощью механизма, известного как глубокое обучение, совершенствуя свои модели по мере поступления все большего количества данных по теме. Среди многих интересных аспектов этой технологии - гибкость механизма обучения, который адаптируется ко всем аспектам человеческого самовыражения. Достижимы как эстетика изображения, так и формализм кода JavaScript!
Каковы наиболее популярные варианты генеративного ИИ?
Наиболее известным примером генеративного ИИ является GPT - в настоящее время он представлен GPT-3.5, последней версией модели предсказания языка третьего поколения в серии GPT. Созданный OpenAI, этот алгоритм может быть адаптирован для создания изображений и всего, что имеет языковую структуру: он отвечает на вопросы, пишет эссе, составляет резюме более длинных текстов, пишет программный код и даже переводит языки. OpenAI предоставил модели GPT около 570 ГБ текстовой информации из Интернета, чтобы достичь этой способности к естественному языку. Хотите попробовать? Зайдите на сайт ChatGPT, создайте бесплатный аккаунт и начните разговор.
Для генерации изображений наиболее известными вариантами являются DALL-E (также основанный на GPT), Midjourney и StableDiffusion. Как и ChatGPT, эти сервисы принимают на вход естественный язык, но их выходной информацией являются изображения. Изображения могут быть выполнены в любом стиле - от вдохновленных искусством тем, таких как кубизм или импрессионизм, до абсолютно реалистичных изображений, которые выглядят как фотографии, но были созданы алгоритмом.
Как работает генеративный искусственный интеллект
Ха! Если вы ищете трактат о науке глубокого обучения, это не то место. Однако мы можем рассказать о том, как эти модели работают с пользователями.
Запросы на текст и изображения подаются в виде "подсказки". Подсказки - это предложения на естественном языке, которые выражают желаемый результат. Создание подсказок - это развивающееся искусство, потому что чем более конкретной и описательной является подсказка, тем больше вероятность того, что вы получите именно то, что хотите.
Теперь вы можете удовлетворить свое желание увидеть "Йоду, сидящего на Железном троне из "Игры престолов" у домашней тарелки в Фенуэй-парке".
Как вы узнаете ниже, большинство сервисов генеративного искусственного интеллекта доступны через набор API. Через эти API бизнес-услуги - и, в наших корыстных интересах, цифровые вывески - могут включать эту технологию.
Как рынок B2B использует генеративный искусственный интеллект
В настоящее время существует длинный (и растущий) список компаний, использующих генеративный ИИ.
На графике ниже в колонке слева указаны наиболее распространенные на рынке генеративные модели. Справа указаны различные области решений и компании, использующие генеративные модели для предоставления услуг в этих областях.
Как традиционные цифровые вывески могут использовать преимущества генеративного искусственного интеллекта
Генеративный искусственный интеллект может стать отличной технологией-компаньоном для создания уникальных и увлекательных цифровых вывесок. С его помощью цифровые вывески могут динамически создавать и отображать контент в реальном времени, который идеально вписывается в контекст. Этот контент может зависеть от поведения пользователя или внешних источников данных, от прогноза погоды до цен в реальном времени.
Примеры:
- Создание контекстно-зависимых изображений, отражающих текущую информацию, обстановку или аудиторию.
- Генерировать резюме и/или переводы непредсказуемых текстов, таких как новостные сообщения или спортивные события.
- Переписывать сообщения с различными тонами и длиной в зависимости от аудитории или срочности.
- Наиболее серьезным препятствием является производительность, особенно при генерации изображений, поскольку современные решения генеративного ИИ не являются (пока) мгновенными. В зависимости от сложности запроса и сложности желаемого результата, генерация изображения может занять даже несколько секунд. В результате, вывески должны быть проактивными в запросе на контент, чтобы гарантировать отсутствие визуальных задержек.
Как интерактивные цифровые вывески повышают ценность генеративного ИИ
Применяя интерактивные цифровые вывески, которые позволяют понять предпочтения пользователя, вы можете пойти дальше в использовании Generative AI. Теперь вы не ограничены только внешним контекстом; вы обладаете глубокими знаниями о своей аудитории и можете общаться соответственно.
Под "интерактивным" мы понимаем любой тип человеко-машинного общения, как активный, так и пассивный. Активные варианты включают прикосновения, жесты и голос, а пассивные - сенсоры и компьютерное зрение. Для всех видов взаимодействия в сочетании с контекстом и экранным контентом цифровые табло могут четко определить интересы пользователя.
Примеры включают:
- Использование данных о пользователе для создания персонализированных "аватаров" на время сеанса.
- Добавление причудливой индивидуальности во взаимодействие, создание шуток и остроумных отступлений для пользователя в контексте того, что в противном случае могло бы быть скучным цифровым взаимодействием.
- Преобразование обзора заказов в корзине в разговорный текст для придания человечности использованию киоска.
- Использование технологии анонимного распознавания лиц для определения возраста/пола и использование этой информации для персонализации общения.
- Перевод постоянно меняющихся источников данных, таких как каталог продукции или туристическая информация.
- Для любого сценария на естественном языке дизайнер - или пользователь - может выбрать динамическое преобразование текста в речь (TTS) с помощью либо специфических сервисов ОС, либо с помощью генеративных голосовых сервисов ИИ, таких как VALL-E.
Во всех случаях творческая группа освобождается от необходимости предвидеть широкий спектр потенциальных пользователей/сценариев/требований. Они могут просто положиться на ресурс генеративного ИИ, который сделает всю работу в режиме реального времени.
Использование генеративного ИИ в Intuiface
Поскольку многие сервисы генеративного ИИ открываются через веб-интерфейсы API, текстовый запрос ("подсказка") может быть программно отправлен, а ответ в виде текста/изображения получен в режиме реального времени для отображения. Благодаря Intuiface API Explorer пользователи Intuiface могут легко создавать интеграции с этими веб-интерфейсами, несмотря на то, что практически не имеют представления о том, как они работают.
Большинство веб-интерфейсов API для генеративного ИИ разрешают ограниченное бесплатное использование и требуют токенов или системы оплаты на основе изображений для внедрения в масштабе. Вот несколько примеров API, все из которых поддерживаются Intuiface API Explorer:
- OpenAI для создания, завершения и перевода текста
- DALL-E (на базе OpenAI) для генерации изображений
- Как отмечалось выше, хороший пример DALL-E можно найти в нашем сообществе пользователей.
- Стабильная диффузия для генерации изображений
- Объяснение того, как использовать Stable Diffusion в Intuiface, находится здесь.
- Официальный API ChatGPT пока недоступен, но предположительно будет выпущен в ближайшее время...
- Например, Паоло Тозолини, партнер Intuiface, Tosolini Productions, опубликовал в нашем сообществе пользователей отличный пример того, как он использовал API Explorer для создания интеграции в реальном времени с DALL-E.
Хотя в приведенном выше примере используется пользовательский интерфейс на базе Intuiface, который зависит от человеческого ввода для создания подсказки (и, соответственно, изображения), Intuiface также может извлекать информацию из окружающей среды и использовать ее для создания подсказки. Например, подсказка может включать слова, связанные с текущей температурой, количеством или присутствием проходящих мимо людей, временем суток и т.д. - Все эти данные собираются и осмысленно комбинируются для генеративного алгоритма ИИ в режиме реального времени.
Как отмечалось выше, при таком подходе опытный дизайнер освобождается от необходимости определять все возможные сценарии и создавать соответствующие ответы в упреждающем режиме. Изображения и копия могут быть автоматически созданы генеративным сервисом ИИ на основе бесконечных контекстов окружающей среды и предоставлены практически в режиме реального времени. Такая автоматическая генерация контента - это революция для цифровых табло!
Генеративный искусственный интеллект и цифровые вывески - взгляд в будущее
Генеративный ИИ постоянно развивается и становится все более доступным. Он будет все чаще использоваться в сетях цифровых вывесок, поскольку становится все дешевле, быстрее и проще в использовании. Это позволит предприятиям создавать уникальные впечатления, адаптированные к индивидуальному зрителю или окружающей обстановке.
Можно представить себе полностью автоматизированную справочную службу, систему рекомендаций (по одежде, питанию, местам отдыха) или гида. Возможности генеративного ИИ для цифровых вывесок - и нашей жизни! - практически безграничны. По мере развития этой технологии ее потенциальное применение будет расти в геометрической прогрессии.
Вы можете начать исследование уже сегодня. Используйте Intuiface, чтобы окунуть ногу в воду, поэкспериментировать с технологией и использовать ее для улучшения интерактивных возможностей.
Написать комментарий