ИИ поисковик Perplexity хочет конкурировать с поисковиком Google. Но это изначально не равная борьба, пока Google контролирует браузер Chrome (который используют 80% пользователей) и его поиск по-умолчанию. Поэтому ребята из Perplexity решили запустить собственный браузер - Comet. За счет чего он хочет победить Chrome? Ну, в нем есть sidebar-ассистент, который может отвечать и даже выполнять какие-то действия в контексте открытой страницы и даже в контексте истории страниц. Получится ли у него? Нет. И даже если в Гугле обленятся и не сделают такого же sidebar-ассистента в Chrome. Главная задача браузера - правильно отображать веб-странички, и в этом деле никто не может конкурировать с Chrome, потому что Гугл формирует стандарты веба. И хотя Comet использует open-source движок Chromium - чтобы еле-еле поспевать за Гуглом нужны возможности, как у Microsoft. Однако есть одна зацепка. Сейчас в США идет судебный процесс, который может обязать Гугл продать браузер Chrome, и тогда ставка Perplexity Comet может сыграть.
В онлайн офисе Google Workspace появились собственные AI-агенты под названием Gems (сокращенно от Gemini, потому что они работают на базе модели Gemini). Каждого из них можно настроить для выполнения конкретной задачи в Google Docs, Sheets, Drive, Slides и Gmail. Например, говорит Гугл, если вы менеджер по продажам, вы можете «создать Gem, который поможет с продажами, основанными на информации для конкретной компании, потенциального клиента или отрасли». Доступ к Gemini можно получить в Workspace, нажав на кнопку «Спросить Gemini» в правом верхнем углу документа. Откроется панель, которая содержит как предварительно загруженные самоцветы, так и опцию «Создать самоцвет» (у Google есть отдельный справочный документ о том, как это сделать).
Google запустил экспериментальное приложение Doppl – с помощью искусственного интеллекта он показывает, как на вас будет сидеть одежда из онлайн магазина. Сначала приложение просит загрузить изображение вашего тела в полный рост. А затем можно использовать фотографии или скрины разной одежды, чтобы примерить его. Кроме того, приложение может превратить ваши изображения в короткое видео, сгенерированное ИИ, чтобы вы лучше представили, как эта одежда будет выглядеть в реальной жизни. Новое приложение базируется на недавно введенных функциях Google Shopping, позволяющих виртуально примерить одежду. Выведя эту функцию в отдельное приложение, Google делает ее более доступной.
ИИ-помощник Gemini получил доступ к телефонным звонкам, сообщениям, WhatsApp и другим встроенным функциям Android. Это означает, что пользователи смогут поручить Gemini, например совершить звонок контакта, отправить SMS или сообщение в мессенджере, а также установить будильник, используя голосовые команды. Google уверяет, что конфиденциальность пользователей остается под полным контролем. Если включена опция Gemini Apps, компания не будет использовать запросы для обучения ИИ. То есть даже с доступом к системным функциям диалоги с ботом не будут сохраняться для аналитики или улучшения модели. Ранее отключение Gemini Apps одновременно отключало и часть функционала ассистента. Теперь Google обещает сбалансировать конфиденциальность и удобство: управление останется в руках пользователя, а ШИ-ассистент будет работать без доступа к чувствительным данным.
В WhatsApp появилась функция, которая позволит пользователям обобщать непрочитанные длинные чаты с помощью ИИ. Функция работает на основе технологии Private Processing, которую Meta представила в апреле на конференции Llamacon. Она позволяет обрабатывать сообщения без нарушения сквозного шифрования и без доступа Meta к содержанию переписки. Сгенерированные итоги приватны — видеть их может только пользователь, пригласивший обобщения. Чтобы использовать функцию, нужно нажать на баннер над непрочитанными сообщениями с надписью Summarize privately. После этого Meta AI сформирует краткое резюме в нескольких пунктах.
Компания Midjourney, известная своими генеративными ИИ-моделями для создания изображений, представила модель V1 для создания видеороликов, которая будет конкурировать OpenAI Sora, Adobe Firefly и Google Veo. Однако Midjourney традиционно делает ставку на творческое сообщество, а не на корпоративные или рекламные задачи. Как и основная модель Midjourney, V1 работает только через Discord. Пользователь может загрузить собственное изображение или использовать картинку, сгенерированную другим ИИ этой же платформы. Доступ к V1 открыт с базовой подписки $10, однако неограниченные генерации возможны только в тарифах Pro ($60) и Mega ($120) в медленном режиме. Видео можно продлевать до 21 секунды, а в настройках доступны варианты с автоматической или текстовой анимацией, а также выбор уровня движения.
Lenovo представила ноутбук ThinkPad T14s Gen 6, в котором искусственный интеллект работает не в облаке, а непосредственно на устройстве. Это первая модель на платформе AMD Ryzen AI, которая обеспечивает локальную обработку ИИ-задач на чипе вместо облачных платформ. Например, он может работать с генеративными моделями, голосовым распознаванием и видеоанализом непосредственно на устройстве без задержек и без подключения к интернету. Кроме того, ИИ используется для автоматического улучшения видеосвязи (размытия фона, шумоподавления), ускорение работы с инструментами Copilot, ChatGPT, Whisper, Stable Diffusion, офлайн-распознавания голоса. Процессор Ryzen AI 7 PRO 360 с интегрированным нейронным модулем (NPU) может выполнять до 50 триллионов операций в секунду (TOPS) на задачах, связанных с искусственным интеллектом.
Google запустил Stitch, инструмент на базе искусственного интеллекта, который помогает разрабатывать интерфейсы веб- и мобильных приложений. Stitch можно попросить создать пользовательский интерфейс приложения с помощью текстового промпта или даже изображения. Инструмент поддерживает прямой экспорт в Figma и может предоставлять код, чтобы его можно было дорабатывать и работать с ним в IDE. Однако, хотя Stitch достаточно мощный, он не предназначен для того, чтобы стать полноценной платформой дизайна, как Figma или Adobe XD.
Viber запустил новые бесплатные функции, которые помогут малым бизнесам более эффективно общаться с клиентами и продвигать свои услуги. Теперь все чаты с клиентами будут храниться в отдельной папке. Это позволит бизнесу легко отслеживать запросы, оперативно отвечать. Чаты, начатые через QR-коды, ссылки или бизнес-поиск, будут автоматически появляться в папке «Клиенты». Также теперь бизнесы могут разрешить клиентам звонить им прямо в Viber, даже если номер телефона владельца не указан. Во время вызова отображается только имя и логотип компании. Кроме того, бизнесы могут выбрать для своего профиля две категории, которые лучше всего описывают их товары или услуги. Это облегчает для клиентов поиск бизнесов в поиске Viber. Результаты поиска адаптируются к местонахождению пользователя, показывая только бизнесы, находящиеся в той же стране и городе. А благодаря функции «Локальный поиск» результаты уточняются в районе или местности.
Илон Маск представил мессенджер XChat, который по сути является дополнительной функцией для обмена сообщениями между пользователями соцсети X/Твиттер. Он уже доступен платным пользователям. Интерфейс и функциональность мессенджера приближены к таким приложениям, как WhatsApp или Telegram. Среди основных возможностей – исчезающие сообщения, сквозное шифрование в стиле «биткоина», передача любых файлов и видеозвонки без использования телефона. По словам Маска, мессенджер является самым защищенным, т.к. использует «шифрования в стиле «биткоина». Правда, что это означает, пока никто не понимает, включая, видимо, и самого Маска.