Главная » Поиск продуктов » Бытовая электроника » Видение Vivo относительно ИИ и обработки изображений в будущих смартфонах
Исполнительный вице-президент и главный операционный директор Vivo Ху Байшань.

Видение Vivo относительно ИИ и обработки изображений в будущих смартфонах

В последнюю неделю 2024 года такие СМИ, как iFanr, посетили штаб-квартиру Vivo в Дунгуане, чтобы пообщаться с исполнительным вице-президентом и главным операционным директором Vivo Ху Байшанем. Они обсудили динамику рынка, прогресс и приложения ИИ, а также будущее направление и планирование продуктов Vivo. Это включало мысли о рынке складных экранов, планы и взгляды на очки MR, гуманоидных роботов, очки ИИ и сильную сторону Vivo: визуализацию.

Штаб-квартира Vivo в Дунгуане.

Ниже представлено краткое изложение обсуждения на уровне продукта (отредактировано iFanr для удобства чтения):

Телефото и видео требуют совершенствования; мобильному ИИ предстоит долгий путь развития

В: Каково ваше мнение о текущем состоянии ИИ? Заменит ли ИИ визуализацию как основной аргумент в пользу смартфонов в будущем? Достигли ли флагманские телефоны своего пика в возможностях визуализации?

Ху Байшань: Давайте сначала поговорим о визуализации. Наша конечная цель — заменить большинство сценариев DSLR-камер, так что еще есть значительный простор для совершенствования.

Как я уже упоминал, основная камера X200 Pro была уменьшена с 1-дюймового сенсора предыдущего флагмана до 1/1.28-дюймового сенсора, но пользовательский опыт не ухудшился. Это связано с тем, что вычислительная мощность чипа и алгоритмы обработки изображений значительно продвинулись вперед. Это говорит о том, что пользовательский опыт основной камеры достиг приличного уровня. Если бы мы оценивали ее, предположив, что обычная DSLR имеет 100 баллов, наша основная камера близка к 80-85 баллам.

Однако в плане телефото и видео все еще наблюдается значительный разрыв по сравнению с зеркальными камерами. Если продолжить подсчет, то основная камера имеет оценку 80-85, а телефото — около 60 баллов, что едва ли соответствует требованиям.

В концертных сценариях при 10-кратном зуме наш X200 Pro работает хорошо, а при 20-кратном вы можете распознать, кто это, снимая с внешней зоны ночью. Тем не менее, пользователи все еще не решаются делиться этими фотографиями в социальных сетях, потому что качество недостаточно хорошее, но 10-кратный зум презентабельный.

В области телефото наши смартфоны довольно далеки от зеркальных камер. Мы стремимся улучшить телефото до уровня 80 точек в течение 3–5 лет, и эта возможность все еще существует. Хотя использование внутреннего пространства смартфонов достигло своего предела, что еще мы можем улучшить? Чувствительность датчиков изображений все еще может быть улучшена с помощью технологий, и есть значительный потенциал для улучшения больших моделей и алгоритмов формирования изображений. Вот почему я уверен, что Vivo сможет достичь 80-точечного телефото в будущем.

Фотография относительно статична, поэтому у алгоритмов больше возможностей для игры, но видео динамично. Добавление кучи алгоритмов к видео оказало бы огромное давление на энергопотребление. Конечно, здесь также есть возможности для улучшения. Чипы сейчас производятся по 3 нм, а следующее поколение будет по 2 нм. Чипы SoC и даже будущие специализированные чипы обработки изображений будут совершенствоваться. Наш следующий шаг — применить возможности алгоритмов большой модели к видео, но общая логика видео динамична, поэтому возможности алгоритма по улучшению все еще будут слабее.

Будь то телефото или видео, все еще есть значительная дистанция до удовлетворения высоких требований пользователей, а сама технология имеет значительный потенциал для развития. Поэтому визуализация остается ключевым направлением для будущих флагманских смартфонов.

Что касается ИИ, то действительно, разработка больших моделей за последние два года была быстрой. Возвращаясь к самому телефону, ИИ все еще имеет свои ограничения. Самая большая проблема с телефонами — недостаточная вычислительная мощность. Я разделяю мобильный ИИ на три этапа:

Первый этап — это улучшение прошлых функций с помощью возможностей ИИ. Например, в последнее время вся мобильная индустрия была довольно популярна с удалением ИИ, функцией, которая существовала более десяти лет назад, но была плохо реализована из-за примитивных алгоритмов.

Раньше возможности распознавания голоса с использованием глубокого обучения имели показатель успешности в лучшем случае всего 90%. При таком показателе успешности вы бы обнаружили, что разговоры не могли длиться много раундов, так как каждый шаг слишком сильно искажался. С появлением генеративных больших моделей возможности распознавания голоса и семантического понимания значительно улучшились. У нас была функция под названием «Телефонный секретарь», впервые представленная в NEX 3, где люди могли сразу определить, что это традиционный ИИ, и звонок прерывался после нескольких предложений. Теперь, с поддержкой ИИ, люди не могут определить, что это говорит ИИ за короткое время.

Они по-прежнему основаны на улучшении конкретной функции или модуля, а не на общем искусственном интеллекте (AGI).

Второй этап, как я полагаю, — это интеграция возможностей большой модели в систему. Например, в прошлом поиск настройки функции был практически невозможен, потому что было слишком много опций меню, все перемешано. В будущем, с глубокой интеграцией ИИ в систему, телефоны будут четко понимать ваши намерения и знать, что делать дальше, делая телефонные взаимодействия более интеллектуальными. Например, наша первая попытка с «Atomic Island» — понять ваши намерения и предложить решения. Этот этап продлится довольно долго, потому что пользовательский опыт на этом этапе едва ли может быть удовлетворен текущей вычислительной мощностью.

Третий этап — это то, о чем мы упоминали на конференции VDC 2024, PhoneGPT. Мы продемонстрировали функцию заказа еды на вынос, и она могла быть успешно реализована. Однако каждый шаг имел только 85% успеха, и после трех шагов он не мог продолжаться, и это занимало много времени. Этот опыт — всего лишь модель, и пользовательский опыт совсем не хорош.

Чтобы действительно достичь требований PhoneGPT, спрос на вычислительную мощность должен быть не просто небольшим, а значительным. Текущая интегрированная архитектура, архитектура упаковки и пропускная способность недостаточны. Чтобы действительно достичь PhoneGPT, все требования к возможностям должны быть близки к текущим высокоскоростным хранилищам, возможностям на стороне сервера, возможностям пропускной способности и архитектуре SoC, чтобы иметь шанс.

Это похоже на визуализацию. Мы видим, что пользовательский спрос уже возник. Многие модели работают на облачных серверах. Наш внутренний вычислительный центр имеет около 10,000 130 вычислительных карт, и многие модели могут работать в облаке, например, модели с параметрами 2B, но этот масштаб не может работать на телефонах. Телефоны могут работать только с моделями с параметрами 3B или XNUMXB. Поэтому, чтобы действительно достичь PhoneGPT на телефонах, я оцениваю, что потребуется не менее пяти лет, чтобы удовлетворить требования к пользовательскому опыту.

Трек AI в настоящее время все еще находится на втором этапе. Это постепенное улучшение, а не скачок от 0 до 1. Таким образом, AI не является значительной движущей силой для текущего цикла замены телефонов, поскольку пользователи не испытали скачка от 0 до 1. Только когда такой скачок произойдет, и пользователи обнаружат, что PhoneGPT может делать так много вещей, у них возникнет сильное желание обновить свои телефоны.

Поскольку я отвечаю как за продукты, так и за технологии, то, что я раскрываю, должно отражать текущий уровень наших технологий или технологий всей отрасли. 

В: Какие аспекты в индустрии смартфонов отражают новое качество производительности и какие части являются наиболее важными?

Ху Байшань: Индустрия смартфонов — яркий пример производительности нового качества. Насколько я понимаю, производительность нового качества имеет три характеристики: высокие технологии, высокое качество и высокий динамизм, а также четыре новые функции. По этим стандартам смартфоны попадают в категорию производительности нового качества. На протяжении многих лет мы наблюдаем постоянное обновление новых технологий в смартфонах.

Мы сосредоточены на двух областях: визуализация и ИИ. В области визуализации за последние пять лет люди заметили быстрое улучшение фотографий на смартфоны в различных условиях. Это был стремительный прогресс.

Смартфоны заменили многие цифровые камеры, которые мы использовали в прошлом, даже заменили беззеркальные камеры, а в некоторых сценариях и зеркальные фотоаппараты. Все больше потребителей готовы платить за лучшие эффекты фотографии, тратя больше денег на телефоны, чтобы добиться этого.

В 2024 году мы выпустим X100 Ultra и X200 Pro, которые мы называем «концертными магическими устройствами». Концерты стали частым явлением в последние годы, и потребители хотят запечатлеть эти прекрасные моменты. Зачем на концертах нужны смартфоны? Зеркальные камеры нельзя проносить на концертные площадки, поэтому потребители могут использовать только телефоны, чтобы запечатлеть эти моменты.

Сфера ИИ похожа. ИИ только начинает развиваться, но он уже усилил многие области смартфонов. Я считаю, что индустрия смартфонов, как представитель нового качества производительности, несомненно, значима. Я также считаю, что в течение долгого времени смартфоны будут оставаться основным потребительским электронным продуктом, способствуя новому качеству производительности.

Смартфон Vivo X200 на столе.

Прототип Vivo MR появится в 2026 году, гуманоидные роботы станут более совершенными через десять лет

В: Как Vivo продвигается в области смешанной реальности (MR) и человекоподобных роботов?

Ху Байшань: Наш прогресс в области MR происходит относительно быстро. Команда Vivo MR выросла почти до 500 человек. Наша цель — к сентябрю или октябрю 2025 года сделать прототип MR-опыта с высокой точностью доступным в магазинах Vivo примерно в дюжине городов по всей стране. От бронирования до опыта на месте мы стремимся создать стандартизированный процесс, чтобы каждый мог его опробовать.

Для коммерциализации нам нужно рассмотреть всю экосистему MR, которая по-прежнему требует развлекательного и игрового контента. Поскольку Vivo не производит контент, мы полагаемся на то, что экосистема будет соответствовать требованиям времени. Многие показатели показывают, что отрасль движется в благоприятном направлении. Tencent увеличивает инвестиции в контент. Раньше они хотели производить оборудование, но недавно решили сосредоточиться на программном обеспечении, что хорошо для нас.

Я требую от команды MR найти сценарии, которые мы считаем существенными. Неважно, является ли целевая аудитория нишевой, но для них MR должен быть незаменимым.

Например, игры, в которые играют на телефонах или консолях, находятся на определенном уровне. Когда придет MR, пользователи поймут, что они были не на должном уровне, и опыт будет значительно улучшен. За исключением того, что они не будут постоянно носить с собой устройства MR, большую часть времени, когда у них будет время поиграть в игры, они будут обращаться к MR. Это существенный сценарий.

Что касается человекоподобных роботов, то в 2024 году мы также упоминали эту концепцию. Спрос очевиден: общество стремительно стареет.

С точки зрения тренда, роботы действительно являются направлением. Мы проанализировали некоторые ключевые пути для роботов, один из которых — пространственное восприятие. MR обладает сильными возможностями пространственного восприятия. Как только MR будет хорошо развита, пространственное восприятие роботов не будет проблемой.

Роботам также требуются гибкие руки и ноги и сильные способности к принятию решений. Мы считаем, что для создания идеального робота потребуется более десяти лет.

Пространственное восприятие и способность принимать решения не будут идеальными в краткосрочной перспективе, но возможности рук и ног будут улучшаться относительно быстро, подобно промышленным роботам, выполняющим специализированные задачи.

Идеальный робот может занять от десяти до пятнадцати лет, но мы можем внедрять его поэтапно. Например, мы можем начать с ограниченного диапазона, например, с роботов производственной линии, которые могут выполнять «две работы», но мы надеемся выполнять «десять работ» в будущем. Мы создаем эту возможность, но выпуск продукта не будет быстрым.

Наша текущая логика заключается в том, что эти роботы, которых мы внутри себя называем «сценарными» и «требованиями пользователя», имеют четкие потребности, но путь технического решения не полностью ясен. Как и в нашем предыдущем обсуждении изображений, пользователи хотят фотографии уровня DSLR. У роботов есть четкие потребности в сценариях пользователя, но технология не соответствует им. В течение следующих трех-пяти лет мы поймем состояние зрелости технологий. Основываясь на этом, мы можем установить продукт, способный решать определенные локальные сценарии в этой средней точке.

Короче говоря, нам нужно понять состояние технологий в ближайшие три-пять лет, включая возможности ИИ. Основываясь на этих технологических возможностях, мы можем внести некоторые коррективы в идеальные сценарии для удовлетворения конкретных потребностей. Это наш внутренний план цикла продукта.

В: Цепочка индустрии дополненной реальности развивается быстрее. Что вы думаете по этому поводу?

Ху Байшань: Что касается продуктов дополненной реальности, мы понимаем их следующим образом: с точки зрения спроса пользователя очки не могут быть слишком тяжелыми. Очки дополненной реальности с дисплеями тяжелые, около 40–50 граммов, что не очень удобно. Некоторые очки дополненной реальности имеют ограниченные возможности отображения. Мы пока не рискнули заняться этой категорией, но рассматриваем очки без дисплея. Независимо от того, над какой категорией продуктов мы работаем, нам нужно определить основные потребности пользователей и найти определенную группу пользователей, для которых продукт необходим. Недавно я обсуждал это с коллегами из команды по продукту и спросил их, определили ли они основных пользователей и сценарии. Они сказали, что нашли некоторых, и это прозвучало разумно.

У многих пользователей заняты руки во время работы. Нужен ли им кто-то еще, чтобы им помочь? Если есть только один человек и его руки заняты, для решения этой проблемы необходимо вспомогательное устройство. Мобильные телефоны или другие устройства не могут хорошо решить эту проблему. Поэтому логика позиционирования нашего устройства MR заключается в том, что оно необходимо для этой группы людей, и мы определили этих людей. Если продукт будет быстро развиваться, он появится к концу 2025 года или, самое позднее, к 2026 году.

Складной смартфон на столе.

Изменения в спросе на складные экраны, темпы производства продукции будут корректироваться

В: Рынок складных телефонов, который рос в течение 4 лет, стагнирует или даже идет на спад. Каковы планы vivo относительно складных телефонов?

Ху Байшань: Изначально производители возлагали большие надежды на складные экраны, поскольку это было существенное изменение формы продукта. С точки зрения потребностей пользователей, кто использует складные экраны?

Одна группа — это люди старше 45 лет, как я, чье зрение ухудшается. Складные телефоны решили многие проблемы, связанные с пресбиопией, поскольку им нужны большие экраны для чтения новостей или просмотра видео, что отвечает потребностям пожилых людей.

Вторая группа включает в себя профессионалов в области СМИ, таких как присутствующие здесь. Они используют складные телефоны для обработки большого объема информации, включая меня, для управления корпоративной электронной почтой и сообщениями.

При работе с информацией на моноблоке она обычно находится в портретном режиме, и вам приходится переключаться в альбомный режим, что не очень удобно, да и текст получается относительно мелким.

Независимо от группы, он отвечает потребностям конкретных людей. При создании продуктов нам нужно понимать, кто является основными пользователями. Когда впервые появились складные экраны, многие пользователи попробовали их из любопытства, но обнаружили, что они им не подходят.

У меня есть друг, который сказал, что помимо использования телефона для WeChat, звонков и текстовых сообщений, он в основном использует Douyin (TikTok), который работает в портретном режиме, поэтому складной экран для него бесполезен, и он не купит еще один складной телефон.

После первоначальной разработки, оставшиеся пользователи являются основными, как упоминалось ранее. Емкость рынка для первой и второй групп относительно невелика. Во многих сценариях, таких как игры, складные экраны не идеальны. Они имеют худшее рассеивание тепла и опыт управления по сравнению с моноблоками, поэтому складные экраны стали продуктами для определенных групп. Размер рынка зависит от масштаба этих конкретных групп и может стабилизироваться на уровне около пяти миллионов единиц.

Стоит ли нам делать складные телефоны? Да. С точки зрения потребностей пользователей, такие группы есть, но нам нужно это контролировать. В предыдущем поколении мы сделали две модели, одна из которых была сосредоточена на визуализации и производительности, а другая — на экономической эффективности. Мы планировали миллионы единиц в продаже, но в итоге получили сотни тысяч, что все еще ограничено. Двигаясь вперед, мы будем проводить итерации ежегодно, улучшая пользовательский опыт, так как всегда будут пользователи, которым нужны складные экраны. Например, некоторые пользователи используют один телефон для ежедневного общения в WeChat и социальных сетях, а другой — для обновлений фондового рынка и утверждения документов.

Кроме того, в 2023 году мировой рынок небольших складных устройств вырос, но в 2024 году объемы небольших складных устройств ведущих брендов сократились на 30–40%. Маловероятно, что Vivo выпустит небольшие складные устройства в будущем.

Смартфон vivo на столе.

Цены на флагманские телефоны продолжат расти, но опыт использования субфлагманских моделей уже весьма хорош

В: Цены на флагманские телефоны немного вырастут в 2025 году. Продолжится ли рост цен в 2026 году? Как vivo сбалансирует стоимость и цену?

Ху Байшань: Мы считаем, что рост цен продолжится из-за двух факторов. Первый очевиден: флагманская платформа SoC и полупроводниковый процесс продолжат совершенствоваться, поэтому рост цен неизбежен. Мы ведем переговоры с производителями SoC, чтобы смягчить рост цен, например, пожертвовав некоторой прибылью, чтобы поддержать или замедлить рост цен, например, увеличив их на $41 вместо $68, а оставшиеся $27 добавив в следующем году.

Второй фактор включает в себя формирование изображений, например, телеобъективы, которые далеки от совершенства. Нам нужно продолжать ежегодно инвестировать. Хотя пространство остается прежним, методы внедрения, такие как расположение объективов и реализация модулей, значительно изменятся. Эти изменения приведут к снижению производительности и увеличению себестоимости продукции.

Тенденция к росту цен на флагманские телефоны неизбежна. Для большинства обычных пользователей опыт использования субфлагманских телефонов уже довольно хорош. Например, платформа N-1 (субфлагманские телефоны, использующие флагманский чип предыдущего поколения) значительно улучшила пользовательский опыт. Мы также можем включить флагманскую визуализацию в продукты платформы N-1, чтобы удовлетворить покупательную способность пользователей.

Короче говоря, если пользователи стремятся к максимальному опыту в области обработки изображений, искусственного интеллекта и игр, им нужно будет потратить около 68 долларов. Если они не стремятся к максимальному опыту, платформа N-1 предлагает хороший внешний вид и достойный опыт. Для пользователей, которые не играют в самые интенсивные игры, а играют только в игры вроде Genshin Impact, платформы N-1 будет достаточно. Для фотографии, если им не нужен 20-кратный зум на концертах и ​​их устраивает 10-кратный зум, стандартная серия X может удовлетворить их потребности.

Таким образом, пользователи с высокой покупательной способностью и желанием получить максимальный опыт будут продвигаться вверх, но мы по-прежнему будем предлагать продукты по приемлемым ценам с хорошим опытом, чтобы удовлетворять потребности пользователей.

Источник из ифанр

Отказ от ответственности: информация, изложенная выше, предоставлена ​​ifanr.com независимо от Chovm.com. Chovm.com не делает никаких заявлений и не дает никаких гарантий относительно качества и надежности продавца и продукции. Chovm.com категорически отказывается от какой-либо ответственности за нарушения авторских прав на контент.

Оставьте комментарий

Ваш электронный адрес не будет опубликован. Обязательные поля помечены * *

Наверх