En la última semana de 2024, medios de comunicación como iFanr visitaron la sede de Vivo en Dongguan para conversar con el vicepresidente ejecutivo y director de operaciones de Vivo, Hu Baishan. Hablaron sobre la dinámica del mercado, el progreso y las aplicaciones de la IA, y la dirección y planificación futuras de los productos de Vivo. Esto incluyó ideas sobre el mercado de pantallas plegables, planes y opiniones sobre gafas de realidad aumentada, robots humanoides, gafas de IA y el punto fuerte de Vivo: la imagen.
![Sede de Vivo en Dongguan.](http://img.baba-blog.com/2025/01/Vivo-headquarters-in-Dongguan.png?x-oss-process=style%2Flarge)
A continuación se muestra un resumen de la conversación a nivel de producto (editado por iFanr para facilitar su lectura):
El teleobjetivo y el vídeo tienen margen de mejora; la IA móvil tiene un largo camino por recorrer
P: ¿Cuál es su opinión sobre el estado actual de la IA? ¿La IA reemplazará a la imagen como principal argumento de venta de los teléfonos inteligentes en el futuro? ¿Los teléfonos insignia han alcanzado su punto máximo en cuanto a capacidades de imagen?
Hu Bai Shan: Hablemos primero de la imagen. Nuestro objetivo final es reemplazar la mayoría de las cámaras DSLR, por lo que todavía hay mucho margen de mejora.
Como mencioné antes, la cámara principal del X200 Pro se ha reducido del sensor de 1 pulgada del buque insignia anterior a un sensor de 1/1.28 pulgadas, pero la experiencia del usuario no ha disminuido. Esto se debe a que la potencia de procesamiento del chip y los algoritmos de imagen han avanzado significativamente. Esto indica que la experiencia del usuario de la cámara principal ha alcanzado un nivel decente. Si tuviéramos que puntuarla, asumiendo que una DSLR convencional tiene 100 puntos, nuestra cámara principal está cerca de los 80 a 85 puntos.
Sin embargo, en cuanto a telefoto y vídeo, todavía hay una brecha considerable respecto a las DSLR. Si seguimos puntuando, la cámara principal se queda entre 80 y 85, mientras que el telefoto se queda en torno a los 60 puntos, apenas superándolo.
En escenarios de conciertos, con un zoom de 10x, nuestra X200 Pro funciona bien, y con un zoom de 20x, puedes reconocer quién es la persona cuando tomas fotos desde el área exterior por la noche. Sin embargo, los usuarios aún dudan en compartir estas fotos en las redes sociales porque la calidad no es lo suficientemente buena, pero 10x es presentable.
En el campo de la telefoto, la calidad de imagen de nuestros smartphones está bastante alejada de las DSLR. Nuestro objetivo es mejorar la telefoto hasta un nivel de 80 puntos en un plazo de 3 a 5 años, y esta oportunidad todavía existe. Aunque la utilización del espacio interno de los smartphones ha llegado a su límite, ¿en qué más podemos mejorar? La sensibilidad de los sensores de imagen todavía se puede mejorar mediante la tecnología, y hay un margen de mejora significativo en los modelos de gran tamaño y en los algoritmos de imagen. Por eso confío en que Vivo pueda lograr un telefoto de 80 puntos en el futuro.
La fotografía es relativamente estática, por lo que los algoritmos tienen más margen de maniobra, pero el vídeo es dinámico. Añadir un montón de algoritmos al vídeo supondría una enorme presión sobre el consumo energético. Por supuesto, también en este aspecto hay margen de mejora. Los chips actuales son de 3 nm y la próxima generación será de 2 nm. Los chips SoC, e incluso los futuros chips dedicados al procesamiento de imágenes, avanzarán. Nuestro próximo paso es aplicar las capacidades de los algoritmos de modelos grandes al vídeo, pero la lógica general del vídeo es dinámica, por lo que la capacidad de mejora del algoritmo seguirá siendo más débil.
Ya sea en telefoto o en vídeo, todavía queda un largo camino por recorrer para satisfacer las altas exigencias de los usuarios y la propia tecnología tiene un importante margen de desarrollo. Por ello, la fotografía sigue siendo un aspecto clave para los futuros smartphones emblemáticos.
En cuanto a la IA, de hecho, el desarrollo de modelos de gran tamaño ha sido rápido en los últimos dos años. Volviendo al teléfono en sí, la IA todavía tiene sus limitaciones. El mayor problema con los teléfonos es la falta de potencia de procesamiento. Divido la IA móvil en tres etapas:
La primera etapa consiste en mejorar las funciones anteriores con capacidades de IA. Por ejemplo, en los últimos tiempos, toda la industria de la telefonía móvil ha sido muy popular con la eliminación de datos mediante IA, una función que existía hace más de una década, pero que se ejecutó de manera deficiente debido a algoritmos primitivos.
En el pasado, las capacidades de reconocimiento de voz mediante aprendizaje profundo tenían una tasa de éxito de solo el 90% en el mejor de los casos. Con una tasa de éxito así, se podía comprobar que las conversaciones no podían durar muchas rondas, ya que cada paso se distorsionaba demasiado. Con la aparición de grandes modelos generativos, el reconocimiento de voz y las capacidades de comprensión semántica han mejorado significativamente. Teníamos una función llamada Phone Secretary, introducida por primera vez en el NEX 3, donde la gente podía saber inmediatamente que era una IA tradicional y la llamada se colgaba después de unas pocas frases. Ahora, con el apoyo de la IA, la gente no puede saber que es una IA la que habla en poco tiempo.
Éstas todavía se basan en la mejora de una función o módulo específico, lejos de la inteligencia artificial general (AGI).
La segunda etapa, creo, es la integración de grandes capacidades de modelos en el sistema. Por ejemplo, en el pasado, encontrar una función era casi imposible porque había demasiadas opciones de menú, todas desordenadas. En el futuro, con la IA profundamente integrada en el sistema, los teléfonos entenderán claramente tus intenciones y sabrán qué hacer a continuación, lo que hará que las interacciones telefónicas sean más inteligentes. Por ejemplo, nuestro intento inicial con “Atomic Island” es entender tus intenciones y proponer soluciones. Esta etapa durará bastante tiempo porque la experiencia del usuario en esta etapa apenas se puede satisfacer con la potencia informática actual.
La tercera etapa es la que mencionamos en la conferencia VDC 2024, PhoneGPT. La función que demostramos fue pedir comida para llevar y se pudo hacer con éxito. Sin embargo, cada paso tuvo una tasa de éxito de solo el 85 % y, después de tres pasos, no se pudo continuar y llevó mucho tiempo. Esta experiencia es solo un modelo y la experiencia del usuario no es buena en absoluto.
Para cumplir verdaderamente con los requisitos de PhoneGPT, la demanda de potencia informática no es solo un aumento leve, sino significativo. La arquitectura integrada actual, la arquitectura de empaquetado y el ancho de banda son insuficientes. Para lograr verdaderamente PhoneGPT, todos los requisitos de capacidad deben estar cerca del almacenamiento de alta velocidad actual, las capacidades del lado del servidor, las capacidades de ancho de banda y la arquitectura SoC para tener una oportunidad.
Esto es similar a la creación de imágenes. Podemos ver que la demanda de los usuarios ya ha surgido. Muchos modelos se ejecutan en servidores en la nube. Nuestro centro de potencia informática interna tiene casi 10,000 tarjetas informáticas y muchos modelos pueden ejecutarse en la nube, como los modelos con parámetros de 130B, pero esta escala no puede ejecutarse en teléfonos. Los teléfonos solo pueden ejecutar modelos con parámetros de 2B o 3B. Por lo tanto, para lograr realmente PhoneGPT en los teléfonos, estimo que se necesitarán al menos cinco años para satisfacer los requisitos de experiencia del usuario.
La IA todavía se encuentra en la segunda etapa. Se trata de una mejora gradual, no de un salto de 0 a 1. Por lo tanto, la IA no es una fuerza impulsora significativa para el ciclo actual de reemplazo de teléfonos porque los usuarios no han experimentado un salto de 0 a 1. Solo cuando se produzca dicho salto y los usuarios descubran que PhoneGPT puede hacer tantas cosas, tendrán un fuerte deseo de actualizar sus teléfonos.
Como soy responsable tanto de los productos como de la tecnología, lo que revelo debe reflejar el nivel actual de nuestra tecnología o la tecnología de toda la industria.
P: En la industria de los teléfonos inteligentes, ¿qué aspectos reflejan la nueva calidad de la productividad y qué partes son las más importantes?
Hu Bai Shan: La industria de los teléfonos inteligentes es un claro ejemplo de productividad de nueva calidad. Según tengo entendido, la productividad de nueva calidad tiene tres características: alta tecnología, alta calidad y alto dinamismo, junto con cuatro nuevas funciones. Según estos estándares, los teléfonos inteligentes entran en la categoría de productividad de nueva calidad. A lo largo de los años, hemos visto actualizaciones continuas de nuevas tecnologías en los teléfonos inteligentes.
Nos centramos principalmente en dos áreas: la fotografía y la inteligencia artificial. En el campo de la fotografía, en los últimos cinco años, la gente ha notado una rápida mejora en la fotografía con teléfonos inteligentes en diversas condiciones. Se trata de un avance vertiginoso.
Los teléfonos inteligentes han reemplazado a muchas de las cámaras digitales que utilizábamos en el pasado, incluso a las cámaras sin espejo y, en algunos casos, a las DSLR. Cada vez más consumidores están dispuestos a pagar por mejores efectos fotográficos y gastan más dinero en teléfonos para lograrlo.
En 2024, lanzaremos las cámaras X100 Ultra y X200 Pro, a las que llamamos "dispositivos mágicos para conciertos". Los conciertos han sido frecuentes en los últimos años y los consumidores quieren capturar estos hermosos momentos. ¿Por qué los conciertos necesitan teléfonos inteligentes? Las DSLR no se pueden llevar a los lugares de conciertos, por lo que los consumidores solo pueden usar teléfonos para capturar estos momentos.
El campo de la IA es similar. La IA está recién comenzando, pero ha potenciado muchas áreas de los teléfonos inteligentes. Creo que la industria de los teléfonos inteligentes, como representante de la nueva productividad de calidad, es indudablemente importante. También creo que durante mucho tiempo, los teléfonos inteligentes seguirán siendo el producto electrónico de consumo principal, contribuyendo a la nueva productividad de calidad.
![El teléfono inteligente Vivo X200 mostrado sobre una mesa.](http://img.baba-blog.com/2025/01/Vivo-X200-smartphone-displayed-on-a-table.jpg?x-oss-process=style%2Flarge)
El prototipo Vivo MR llegará en 2026, los robots humanoides madurarán en diez años
P: ¿Cómo está progresando Vivo en MR (Realidad Mixta) y robots humanoides?
Hu Bai Shan: Nuestro progreso en materia de realidad aumentada es relativamente rápido. El equipo de realidad aumentada de Vivo ha crecido hasta contar con casi 500 personas. Nuestro objetivo es tener un prototipo de experiencia de realidad aumentada de alta fidelidad disponible en las tiendas Vivo en alrededor de una docena de ciudades de todo el país para septiembre u octubre de 2025. Desde la reserva hasta la experiencia en el lugar, nuestro objetivo es crear un proceso estandarizado para que todos puedan probarlo.
Para la comercialización, necesitamos considerar todo el ecosistema de realidad aumentada, que aún requiere contenido de entretenimiento y juegos. Dado que Vivo no produce contenido, dependemos de que el ecosistema esté a la altura a tiempo. Muchos indicios muestran que la industria se está moviendo en una dirección favorable. Tencent está aumentando su inversión en contenido. Anteriormente, querían fabricar hardware, pero recientemente decidieron centrarse en el software, lo cual es bueno para nosotros.
Exijo al equipo de MR que encuentre escenarios que consideremos esenciales. No importa si el público objetivo es un nicho, pero para ellos, MR debe ser indispensable.
Por ejemplo, los juegos que se juegan en teléfonos o consolas están a un cierto nivel. Cuando llegue la realidad aumentada, los usuarios se darán cuenta de que no estaban a la altura y la experiencia mejorará significativamente. A excepción de que no llevan dispositivos de realidad aumentada todo el tiempo, la mayoría de las veces, cuando tienen tiempo para jugar, recurrirán a la realidad aumentada. Este es un escenario esencial.
En cuanto a los robots humanoides, en 2024 también mencionamos este concepto. La demanda es clara: la sociedad está envejeciendo rápidamente.
Desde una perspectiva de tendencias, los robots son, sin duda, una dirección. Hemos analizado algunos caminos clave para los robots, uno de los cuales es la percepción espacial. La realidad aumentada tiene fuertes capacidades de percepción espacial. Una vez que la realidad aumentada esté bien desarrollada, la percepción espacial de los robots no será un problema.
Los robots también requieren manos y pies flexibles y una gran capacidad de toma de decisiones. Creemos que para lograr el robot ideal se necesitarán más de diez años.
La percepción espacial y la capacidad de toma de decisiones no serán perfectas en el corto plazo, pero las capacidades de las manos y los pies mejorarán relativamente rápido, como los robots industriales que realizan tareas especializadas.
El robot ideal puede tardar entre diez y quince años en desarrollarse, pero podemos implementarlo en etapas. Por ejemplo, podemos empezar con una gama limitada, como robots de línea de producción, que pueden hacer "dos trabajos", pero esperamos hacer "diez trabajos" en el futuro. Estamos desarrollando esta capacidad, pero el lanzamiento del producto no será rápido.
Nuestra lógica actual es que estos robots, a los que internamente llamamos impulsados por escenarios y demandas de los usuarios, tienen necesidades claras, pero la vía de la solución técnica no está del todo clara. Al igual que en nuestro debate anterior sobre la fotografía, los usuarios quieren fotografías de nivel DSLR. Los robots tienen necesidades claras en cuanto a escenarios de uso, pero la tecnología no se corresponde con ellas. En los próximos tres a cinco años, comprenderemos el estado de madurez de la tecnología. En función de esto, podemos crear un producto con la capacidad de resolver ciertos escenarios locales en ese punto intermedio.
En resumen, necesitamos comprender el estado de la tecnología en los próximos tres a cinco años, incluidas las capacidades de inteligencia artificial. Con base en esta capacidad tecnológica, podemos hacer algunos ajustes en escenarios ideales para satisfacer necesidades específicas. Este es nuestro plan interno del ciclo del producto.
P: La cadena industrial de realidad aumentada está madurando más rápido. ¿Qué opinas al respecto?
Hu Bai Shan: En el caso de los productos de realidad aumentada, lo entendemos de esta manera: desde la perspectiva de la demanda del usuario, las gafas no pueden ser demasiado pesadas. Las gafas de realidad aumentada con pantalla son pesadas, alrededor de 40-50 gramos, lo que no es una buena experiencia. Algunas gafas de realidad aumentada tienen capacidades de visualización limitadas. Todavía no nos hemos aventurado en esta categoría, pero estamos considerando gafas sin pantalla. Independientemente de la categoría de producto en la que estemos trabajando, debemos identificar las necesidades básicas de los usuarios y encontrar un grupo de usuarios específico para el que el producto sea esencial. Recientemente, hablé con colegas del equipo de productos y les pregunté si habían identificado los usuarios y escenarios esenciales. Dijeron que habían encontrado algunos y que parecía razonable.
Muchos usuarios tienen las manos ocupadas mientras trabajan. ¿Necesitan que alguien más les ayude? Si solo hay una persona y tiene las manos ocupadas, se necesita un dispositivo auxiliar para resolver este problema. Los teléfonos móviles u otros dispositivos no pueden resolver bien este problema. Por lo tanto, la lógica de posicionamiento de nuestro dispositivo de RM es que es esencial para ese grupo de personas, y hemos identificado a estas personas. Si el producto avanza rápidamente, aparecerá a finales de 2025, o en 2026 a más tardar.
![Un teléfono inteligente plegable mostrado sobre una mesa.](http://img.baba-blog.com/2025/01/A-foldable-smartphone-displayed-on-a-table.jpg?x-oss-process=style%2Flarge)
Cambios en la demanda de pantallas plegables: el ritmo del producto se ajustará
P: El mercado de los teléfonos plegables, que lleva creciendo cuatro años, se ha estancado o incluso ha disminuido. ¿Cuál es el plan de Vivo para los teléfonos plegables?
Hu Bai Shan: Al principio, los fabricantes tenían grandes expectativas con respecto a las pantallas plegables porque se trataba de un cambio significativo en la forma del producto. Desde la perspectiva de las necesidades de los usuarios, ¿quién utiliza pantallas plegables?
Un grupo son las personas mayores de 45 años, como yo, cuya vista se está deteriorando. Los teléfonos plegables han solucionado muchos problemas relacionados con la presbicia, ya que necesitan pantallas más grandes para leer noticias o ver vídeos, atendiendo así las necesidades de las personas mayores.
El segundo grupo lo forman los profesionales de los medios de comunicación como los que están aquí presentes, que utilizan teléfonos plegables para manejar una gran cantidad de información, entre los que me incluyo, para gestionar correos electrónicos y mensajes de la empresa.
Al manejar información en un teléfono de barra, generalmente está en modo vertical y hay que cambiar al modo horizontal, lo que no es una buena experiencia y el texto es relativamente pequeño.
Independientemente del grupo, se trata de satisfacer las necesidades de personas específicas. A la hora de fabricar productos, debemos entender quiénes son los usuarios esenciales. Cuando salieron las pantallas plegables, muchos usuarios las probaron por curiosidad, pero descubrieron que no eran adecuadas para ellos.
Tengo un amigo que dijo que además de usar el teléfono para WeChat, llamadas y mensajes de texto, usa principalmente Douyin (TikTok), que está en modo vertical, por lo que la pantalla plegable es inútil para él y no comprará otro teléfono plegable.
Después del desarrollo inicial, los usuarios restantes son los esenciales, como se mencionó anteriormente. La capacidad de mercado para el primer y segundo grupo es relativamente pequeña. En muchos escenarios, como los juegos, las pantallas plegables no son ideales. Tienen una peor disipación de calor y experiencia de control en comparación con los teléfonos de barra, por lo que las pantallas plegables se han convertido en productos para grupos específicos. El tamaño del mercado depende de la escala de estos grupos específicos y puede estabilizarse en alrededor de cinco millones de unidades.
¿Deberíamos fabricar teléfonos plegables? Sí. Desde la perspectiva de las necesidades de los usuarios, existen esos grupos, pero tenemos que controlarlos. En la generación anterior, fabricamos dos modelos, uno centrado en la imagen y el rendimiento, y el otro en la rentabilidad. Planeamos vender millones de unidades, pero terminamos con cientos de miles, lo que sigue siendo limitado. En el futuro, realizaremos iteraciones anuales para mejorar la experiencia del usuario, ya que siempre habrá algunos usuarios que necesiten pantallas plegables. Por ejemplo, algunos usuarios usan un teléfono para WeChat y las interacciones sociales diarias y otro teléfono para actualizaciones del mercado de valores y aprobaciones de documentos.
Además, en el caso de los productos plegables pequeños, el mercado mundial creció en 2023, pero en 2024, los productos plegables pequeños de las marcas líderes disminuyeron entre un 30% y un 40%. Es poco probable que Vivo lance productos plegables pequeños en el futuro.
![Un teléfono inteligente vivo exhibido sobre una mesa.](http://img.baba-blog.com/2025/01/A-vivo-smartphone-displayed-on-a-table.jpg?x-oss-process=style%2Flarge)
Los precios de los teléfonos insignia seguirán aumentando, la experiencia con los teléfonos sub-insignia ya es bastante buena
P: Los precios de los teléfonos insignia aumentarán ligeramente en 2025. ¿Continuará el aumento de precios en 2026? ¿Cuál es el costo y el precio del Vivo Balance?
Hu Bai Shan: Creemos que el aumento de precios continuará debido a dos factores. El primero es claro: la plataforma de SoC insignia y el proceso de semiconductores seguirán mejorando, por lo que los aumentos de precios son inevitables. Estamos negociando con los fabricantes de SoC para moderar el aumento de precios, por ejemplo, sacrificando algunos márgenes de beneficio para mantener o ralentizar el aumento de precios, como aumentar 41 dólares en lugar de 68 dólares, y añadir los 27 dólares restantes al año siguiente.
El segundo factor incluye la imagen, como los teleobjetivos, que distan mucho de ser perfectos. Necesitamos seguir invirtiendo anualmente. Aunque el espacio sigue siendo el mismo, los métodos de implementación, como la disposición de los lentes y la implementación de los módulos, cambiarán significativamente. Estos cambios reducirán las tasas de rendimiento y aumentarán los costos del producto.
La tendencia al alza de los precios de los teléfonos insignia es inevitable. Para la mayoría de los usuarios comunes, la experiencia de los teléfonos sub-insignia ya es bastante buena. Por ejemplo, la plataforma N-1 (teléfonos sub-insignia que utilizan el chip insignia de la generación anterior) ha mejorado significativamente la experiencia del usuario. También podemos incluir imágenes de teléfonos insignia en los productos de la plataforma N-1 para satisfacer el poder adquisitivo de los usuarios.
En resumen, si los usuarios buscan la mejor experiencia en imágenes, IA y juegos, necesitarán gastar unos 68 dólares más. Si no buscan la mejor experiencia, la plataforma N-1 ofrece una buena apariencia y una experiencia decente. Para los usuarios que no juegan a los juegos más intensos y solo juegan a juegos como Genshin Impact, la plataforma N-1 es suficiente. Para la fotografía, si no necesitan un zoom de 20x en los conciertos y se conforman con un zoom de 10x, la serie X estándar puede satisfacer sus necesidades.
Por lo tanto, los usuarios con un fuerte poder adquisitivo y deseos de disfrutar de la mejor experiencia ascenderán, pero seguiremos ofreciendo productos a precios adecuados con buenas experiencias para satisfacer las necesidades de los usuarios.
Fuente de ifanr
Descargo de responsabilidad: La información establecida anteriormente es proporcionada por ifanr.com, independientemente de Chovm.com. Chovm.com no representa ni garantiza la calidad y confiabilidad del vendedor y los productos. Chovm.com renuncia expresamente a cualquier responsabilidad por violaciones relacionadas con los derechos de autor del contenido.