Home » Producten Sourcing » Consumer Electronics » Vivo's visie op AI en beeldvorming in toekomstige smartphones
Hu Baishan, Executive Vice President en Chief Operating Officer van Vivo.

Vivo's visie op AI en beeldvorming in toekomstige smartphones

In de laatste week van 2024 bezochten mediakanalen zoals iFanr het hoofdkantoor van Vivo in Dongguan om een ​​gesprek aan te gaan met Vivo's Executive Vice President en Chief Operating Officer, Hu Baishan. Ze bespraken de marktdynamiek, AI-voortgang en -toepassingen en de toekomstige richting en planning van Vivo-producten. Dit omvatte gedachten over de markt voor opvouwbare schermen, plannen en visies op MR-brillen, humanoïde robots, AI-brillen en Vivo's sterke punt: beeldvorming.

Vivo-hoofdkantoor in Dongguan.

Hieronder vindt u een samenvatting van het gesprek op productniveau (bewerkt door iFanr voor de leesbaarheid):

Telefoto en video kunnen nog verbeterd worden; mobiele AI heeft nog een lange weg te gaan

V: Wat is uw mening over de huidige staat van AI? Zal AI in de toekomst beeldvorming vervangen als het primaire verkoopargument voor smartphones? Hebben vlaggenschiptelefoons hun piek bereikt in beeldvormingsmogelijkheden?

Hu Baishan: Laten we het eerst over beeldvorming hebben. Ons uiteindelijke doel is om de meeste DSLR-camerascenario's te vervangen, dus er is nog steeds veel ruimte voor verbetering.

Zoals ik al eerder zei, is de hoofdcamera van de X200 Pro teruggebracht van de 1-inch sensor van het vorige vlaggenschip naar een 1/1.28-inch sensor, maar de gebruikerservaring is niet afgenomen. Dit komt doordat de chipverwerkingskracht en beeldalgoritmen aanzienlijke stappen hebben gemaakt. Dit geeft aan dat de gebruikerservaring van de hoofdcamera een behoorlijk niveau heeft bereikt. Als we het zouden scoren, ervan uitgaande dat een conventionele DSLR 100 punten krijgt, komt onze hoofdcamera dicht bij 80 tot 85 punten.

Echter, in termen van telephoto en video is er nog steeds een behoorlijke kloof vergeleken met DSLR's. Als we doorgaan met scoren, is de hoofdcamera 80 tot 85, terwijl telephoto rond de 60 punten zit, net voorbij.

In concertscenario's presteert onze X10 Pro goed bij 200x zoom en bij 20x kun je herkennen wie de persoon is als je 's nachts vanaf de buitenkant fotografeert. Gebruikers aarzelen echter nog steeds om deze foto's op sociale media te delen omdat de kwaliteit niet goed genoeg is, maar 10x is presentabel.

Op het gebied van telefoto's is onze smartphone-beeldvorming behoorlijk ver verwijderd van DSLR's. We streven ernaar om telefoto binnen 80 tot 3 jaar te verbeteren tot een niveau van 5 punten, en deze mogelijkheid bestaat nog steeds. Hoewel het interne ruimtegebruik van smartphones zijn limiet heeft bereikt, waar kunnen we nog meer verbeteren? De gevoeligheid van beeldsensoren kan nog steeds worden verbeterd door technologie, en er is aanzienlijke ruimte voor verbetering in grote modellen en beeldalgoritmen. Daarom heb ik er vertrouwen in dat Vivo in de toekomst een telefoto van 80 punten kan bereiken.

Fotografie is relatief statisch, dus algoritmes hebben meer speelruimte, maar video is dynamisch. Het toevoegen van een heleboel algoritmes aan video zou een enorme druk op het stroomverbruik leggen. Natuurlijk is er ook hier ruimte voor verbetering. Chips zijn nu op 3nm, en de volgende generatie zal 2nm zijn. SoC-chips, en zelfs toekomstige speciale beeldverwerkingschips, zullen vooruitgaan. Onze volgende stap is om de mogelijkheden van grote modelalgoritmen toe te passen op video, maar de algehele logica van video is dynamisch, dus de verbeteringsmogelijkheden van het algoritme zullen nog steeds zwakker zijn.

Of het nu telefoto of video is, er is nog een aanzienlijke afstand tot het voldoen aan de hoge eisen van gebruikers, en de technologie zelf heeft nog veel ruimte voor ontwikkeling. Daarom blijft beeldvorming een belangrijk aandachtspunt voor toekomstige vlaggenschip-smartphones.

Wat AI betreft, inderdaad, de ontwikkeling van grote modellen is de afgelopen twee jaar snel gegaan. Terugkerend naar de telefoon zelf, AI heeft nog steeds zijn beperkingen. Het grootste probleem met telefoons is onvoldoende rekenkracht. Ik verdeel mobiele AI in drie fasen:

De eerste fase is het verbeteren van eerdere functies met AI-mogelijkheden. De afgelopen tijd is de hele mobiele industrie bijvoorbeeld behoorlijk populair geworden met het verwijderen van AI, een functie die al meer dan tien jaar bestond, maar slecht werd uitgevoerd vanwege primitieve algoritmen.

In het verleden hadden spraakherkenningsmogelijkheden met deep learning een succespercentage van slechts 90% op zijn best. Met zo'n succespercentage zou je merken dat gesprekken niet lang konden duren, omdat elke stap te veel zou vervormen. Met de opkomst van generatieve grote modellen zijn spraakherkennings- en semantische begripsmogelijkheden aanzienlijk verbeterd. We hadden een functie genaamd Phone Secretary, voor het eerst geïntroduceerd op de NEX 3, waarbij mensen meteen konden zien dat het traditionele AI was en het gesprek na een paar zinnen werd opgehangen. Nu, met AI-ondersteuning, kunnen mensen niet binnen korte tijd horen dat het AI is die spreekt.

Deze zijn nog steeds gebaseerd op de verbetering van een specifieke functie of module, ver verwijderd van algemene kunstmatige intelligentie (AGI).

De tweede fase is volgens mij het integreren van grote modelmogelijkheden in het systeem. In het verleden was het bijvoorbeeld bijna onmogelijk om een ​​functie-instelling te vinden, omdat er te veel menuopties waren, die allemaal door elkaar stonden. In de toekomst, met AI diep geïntegreerd in het systeem, zullen telefoons duidelijk uw bedoelingen begrijpen en weten wat ze vervolgens moeten doen, waardoor telefooninteracties intelligenter worden. Onze eerste poging met "Atomic Island" is bijvoorbeeld om uw bedoelingen te begrijpen en oplossingen voor te stellen. Deze fase zal vrij lang duren, omdat de gebruikerservaring in deze fase nauwelijks kan worden gehaald met de huidige computerkracht.

De derde fase is wat we noemden op de VDC 2024-conferentie, PhoneGPT. De functie die we demonstreerden was het bestellen van afhaalmaaltijden, en dat kon succesvol worden gedaan. Echter, elke stap had slechts een succespercentage van 85%, en na drie stappen kon het niet doorgaan, en het duurde lang. Deze ervaring is slechts een model, en de gebruikerservaring is helemaal niet goed.

Om echt aan de vereisten van PhoneGPT te voldoen, is de vraag naar computerkracht niet slechts een lichte toename, maar een significante. De huidige geïntegreerde architectuur, verpakkingsarchitectuur en bandbreedte zijn onvoldoende. Om PhoneGPT echt te bereiken, moet de volledige capaciteitsvereiste dicht bij de huidige snelle opslag, server-side-capaciteiten, bandbreedtecapaciteiten en SoC-architectuur liggen om een ​​kans te maken.

Dit is vergelijkbaar met imaging. We kunnen zien dat de vraag van gebruikers al is ontstaan. Veel modellen draaien op cloudservers. Ons interne computing power center heeft bijna 10,000 computing cards en veel modellen kunnen draaien op de cloud, zoals modellen met 130B parameters, maar deze schaal kan niet op telefoons draaien. Telefoons kunnen alleen modellen draaien met 2B of 3B parameters. Dus om PhoneGPT echt op telefoons te bereiken, schat ik dat het minstens vijf jaar zal duren om te voldoen aan de eisen van de gebruikerservaring.

Het AI-traject bevindt zich momenteel nog in de tweede fase. Het is een geleidelijke verbetering, geen sprong van 0 naar 1. Daarom is AI geen belangrijke drijvende kracht voor de huidige vervangingscyclus van telefoons, omdat gebruikers geen sprong van 0 naar 1 hebben meegemaakt. Alleen wanneer zo'n sprong plaatsvindt en gebruikers ontdekken dat PhoneGPT zoveel dingen kan, zullen ze een sterke wens hebben om hun telefoons te upgraden.

Omdat ik verantwoordelijk ben voor zowel producten als technologie, moet wat ik onthul een weerspiegeling zijn van het huidige niveau van onze technologie of van de technologie in de gehele sector. 

V: Welke aspecten weerspiegelen de nieuwe kwaliteit van productiviteit in de smartphonebranche en welke onderdelen zijn het belangrijkst?

Hu Baishan: De smartphone-industrie is een goed voorbeeld van nieuwe kwaliteitsproductiviteit. Zoals ik het begrijp, heeft nieuwe kwaliteitsproductiviteit drie kenmerken: hoge technologie, hoge kwaliteit en hoge dynamiek, samen met vier nieuwe functies. Volgens deze normen vallen smartphones onder de categorie nieuwe kwaliteitsproductiviteit. In de loop der jaren hebben we voortdurend updates van nieuwe technologie in smartphones gezien.

We richten ons sterk op twee gebieden: beeldvorming en AI. Op het gebied van beeldvorming hebben mensen de afgelopen vijf jaar de snelle verbetering in smartphonefotografie onder verschillende omstandigheden opgemerkt. Dit is een snelle vooruitgang geweest.

Smartphones hebben veel digitale camera's die we in het verleden gebruikten vervangen, zelfs spiegelloze camera's en in sommige gevallen DSLR's. Meer consumenten zijn bereid om te betalen voor betere fotografische effecten en geven meer geld uit aan telefoons om dit te bereiken.

In 2024 brengen we de X100 Ultra en X200 Pro uit, die we de "concert magic devices" noemen. Concerten zijn de laatste jaren vaak geweest en consumenten willen deze mooie momenten vastleggen. Waarom hebben concerten smartphones nodig? DSLR's kunnen niet worden meegenomen naar concertlocaties, dus consumenten kunnen alleen telefoons gebruiken om deze momenten vast te leggen.

Het AI-veld is vergelijkbaar. AI staat nog maar aan het begin, maar het heeft veel smartphonegebieden versterkt. Ik geloof dat de smartphone-industrie, als vertegenwoordiger van nieuwe kwaliteitsproductiviteit, ongetwijfeld belangrijk is. Ik geloof ook dat smartphones nog lang het belangrijkste consumentenelektronicaproduct zullen blijven, dat bijdraagt ​​aan nieuwe kwaliteitsproductiviteit.

Vivo X200-smartphone op een tafel.

Vivo MR-prototype komt in 2026, humanoïde robots worden binnen tien jaar volwassen

V: Hoe boekt Vivo vooruitgang op het gebied van MR (Mixed Reality) en humanoïde robots?

Hu Baishan: Onze MR-voortgang is relatief snel. Het Vivo MR-team is gegroeid tot bijna 500 mensen. Ons doel is om een ​​high-fidelity MR-ervaringsprototype beschikbaar te hebben in Vivo-winkels in ongeveer een dozijn steden in het hele land tegen september of oktober 2025. Van boeking tot ervaring op locatie, we streven ernaar om een ​​gestandaardiseerd proces te creëren zodat iedereen het kan uitproberen.

Voor commercialisering moeten we kijken naar het hele MR-ecosysteem, dat nog steeds entertainment- en gamingcontent nodig heeft. Omdat Vivo geen content produceert, vertrouwen we erop dat het ecosysteem op tijd bij elkaar past. Veel indicaties laten zien dat de industrie in een gunstige richting beweegt. Tencent verhoogt zijn investeringen in content. Eerder wilden ze hardware maken, maar onlangs besloten ze zich te richten op software, wat goed voor ons is.

Ik vraag het MR-team om scenario's te vinden die wij als essentieel beschouwen. Het maakt niet uit of de doelgroep niche is, maar voor hen moet MR onmisbaar zijn.

Bijvoorbeeld, games die op telefoons of consoles worden gespeeld, zijn op een bepaald niveau. Wanneer MR opduikt, zullen gebruikers beseffen dat die ondermaats waren en zal de ervaring aanzienlijk worden verbeterd. Behalve dat ze niet altijd MR-apparaten bij zich dragen, zullen ze meestal, wanneer ze tijd hebben om games te spelen, naar MR overstappen. Dit is een essentieel scenario.

Wat betreft humanoïde robots, in 2024 hebben we dit concept ook genoemd. De vraag is duidelijk: de maatschappij vergrijst snel.

Vanuit een trendperspectief zijn robots inderdaad een richting. We hebben een aantal belangrijke paden voor robots geanalyseerd, waarvan ruimtelijke perceptie er één is. MR heeft sterke ruimtelijke perceptiemogelijkheden. Zodra MR goed ontwikkeld is, zal de ruimtelijke perceptie van robots geen probleem meer zijn.

Robots vereisen ook flexibele handen en voeten en sterke beslissingsvaardigheden. Om de ideale robot te bereiken, denken we dat het meer dan tien jaar zal duren.

Ruimtelijk inzicht en besluitvormingsvermogen zullen op korte termijn niet perfect zijn, maar de hand- en voetvaardigheden zullen relatief snel verbeteren, vergelijkbaar met industriële robots die gespecialiseerde taken uitvoeren.

Het kan tien tot vijftien jaar duren om de ideale robot te bereiken, maar we kunnen hem in fasen implementeren. We kunnen bijvoorbeeld beginnen met een beperkt bereik, zoals productielijnrobots, die misschien "twee taken" kunnen uitvoeren, maar we hopen in de toekomst "tien taken" uit te voeren. We bouwen deze mogelijkheid, maar de productrelease zal niet snel zijn.

Onze huidige logica is dat deze robots, die we intern scenario- en gebruikersvraaggestuurd noemen, duidelijke behoeften hebben, maar het technische oplossingspad is niet helemaal duidelijk. Net als in onze vorige discussie over beeldvorming willen gebruikers fotografie op DSLR-niveau. Robots hebben duidelijke behoeften van gebruikersscenario's, maar de technologie komt niet overeen. In de komende drie tot vijf jaar zullen we de staat van technologische volwassenheid begrijpen. Op basis hiervan kunnen we een product instellen met de mogelijkheid om bepaalde lokale scenario's op dat middelpunt op te lossen.

Kortom, we moeten de stand van de technologie in de komende drie tot vijf jaar begrijpen, inclusief AI-mogelijkheden. Op basis van deze technologische mogelijkheden kunnen we in ideale scenario's enkele aanpassingen doen om aan specifieke behoeften te voldoen. Dit is ons interne productcyclusplan.

V: De AR-industrieketen wordt sneller volwassen. Wat vindt u hiervan?

Hu Baishan: Voor AR-producten begrijpen we ze op deze manier: vanuit het perspectief van de gebruikersvraag mogen brillen niet te zwaar zijn. AR-brillen met displays zijn zwaar, ongeveer 40-50 gram, wat geen goede ervaring is. Sommige AR-brillen hebben beperkte displaymogelijkheden. We hebben ons nog niet in deze categorie gewaagd, maar we overwegen brillen zonder display. Ongeacht aan welke productcategorie we werken, moeten we de basisbehoeften van de gebruikers identificeren en een specifieke gebruikersgroep vinden voor wie het product essentieel is. Onlangs sprak ik met collega's van het productteam en ik vroeg hen of ze de essentiële gebruikers en scenario's hadden geïdentificeerd. Ze zeiden dat ze er een paar hadden gevonden en dat klonk redelijk.

Veel gebruikers hebben hun handen bezig tijdens het werken. Hebben ze iemand anders nodig om hen te helpen? Als er maar één persoon is en hun handen zijn bezet, is een hulpapparaat nodig om dit probleem op te lossen. Mobiele telefoons of andere apparaten kunnen dit probleem niet goed oplossen. Daarom is de positioneringslogica van ons MR-apparaat dat het essentieel is voor die groep mensen, en we hebben deze mensen geïdentificeerd. Als het product snel vordert, zal het eind 2025 verschijnen, of uiterlijk in 2026.

Een opvouwbare smartphone op tafel.

Veranderingen in de vraag naar opvouwbare schermen, producttempo zal zich aanpassen

V: De markt voor opvouwbare telefoons, die al 4 jaar groeit, stagneert of daalt zelfs. Wat is het plan van vivo voor opvouwbare telefoons?

Hu Baishan: Aanvankelijk hadden fabrikanten hoge verwachtingen van opvouwbare schermen omdat het een significante verandering in productvorm was. Vanuit het perspectief van gebruikersbehoeften, wie gebruikt opvouwbare schermen?

Eén groep zijn mensen van boven de 45 jaar, zoals ik, wiens zicht achteruitgaat. Opvouwbare telefoons hebben veel problemen met betrekking tot presbyopie opgelost, omdat ze grotere schermen nodig hebben om nieuws te lezen of video's te bekijken, wat tegemoetkomt aan de behoeften van oudere mensen.

De tweede groep bestaat uit mediaprofessionals zoals die hier aanwezig zijn. Zij gebruiken opvouwbare telefoons om een ​​grote hoeveelheid informatie te verwerken, waaronder ikzelf, om bedrijfsmails en berichten te beheren.

Wanneer u informatie op een bartelefoon verwerkt, staat deze meestal in de portretmodus en moet u overschakelen naar de landschapsmodus. Dit is geen prettige ervaring en de tekst is relatief klein.

Ongeacht de groep, het richt zich op de behoeften van specifieke mensen. Bij het maken van producten moeten we begrijpen wie de essentiële gebruikers zijn. Toen opvouwbare schermen voor het eerst uitkwamen, probeerden veel gebruikers ze uit nieuwsgierigheid, maar ze ontdekten dat ze niet geschikt voor hen waren.

Ik heb een vriend die zei dat hij zijn telefoon niet alleen gebruikt voor WeChat, bellen en sms'en, maar vooral Douyin (TikTok). Die staat in portretmodus, dus het opvouwbare scherm is voor hem nutteloos en hij zal geen nieuwe opvouwbare telefoon kopen.

Na de eerste ontwikkeling zijn de resterende gebruikers de essentiële, zoals eerder vermeld. De marktcapaciteit voor de eerste en tweede groep is relatief klein. In veel scenario's, zoals gaming, zijn opvouwbare schermen niet ideaal. Ze hebben een slechtere warmteafvoer en bedieningservaring vergeleken met bartelefoons, dus opvouwbare schermen zijn producten geworden voor specifieke groepen. De omvang van de markt is afhankelijk van de omvang van deze specifieke groepen en kan zich stabiliseren op ongeveer vijf miljoen eenheden.

Moeten we voor ons opvouwbare telefoons maken? Ja. Vanuit het perspectief van de behoeften van gebruikers zijn er die groepen, maar we moeten het beheersen. In de vorige generatie maakten we twee modellen, één gericht op beeldvorming en prestaties, en de andere op kosteneffectiviteit. We planden voor miljoenen eenheden in verkoop, maar eindigden met honderdduizenden, wat nog steeds beperkt is. In de toekomst zullen we jaarlijks itereren en de gebruikerservaring verbeteren, omdat er altijd gebruikers zullen zijn die opvouwbare schermen nodig hebben. Sommige gebruikers gebruiken bijvoorbeeld één telefoon voor dagelijkse WeChat en sociale interacties en een andere telefoon voor beursupdates en goedkeuringen van documenten.

Bovendien groeide de wereldwijde markt voor kleine opvouwbare producten in 2023, maar in 2024 daalden de kleine opvouwbare producten van toonaangevende merken met 30% tot 40%. Het is onwaarschijnlijk dat Vivo in de toekomst kleine opvouwbare producten uitbrengt.

Een vivo-smartphone op een tafel.

Prijzen van vlaggenschiptelefoons blijven stijgen, ervaring met sub-vlaggenschepen is al behoorlijk goed

V: Prijzen van vlaggenschiptelefoons zullen in 2025 licht stijgen. Zal de prijsstijging in 2026 doorzetten? Wat zijn de kosten en de prijs van vivo balance?

Hu Baishan: Wij geloven dat de prijsstijging zal aanhouden vanwege twee factoren. De eerste is duidelijk: het vlaggenschip SoC-platform en het halfgeleiderproces zullen blijven verbeteren, dus prijsstijgingen zijn onvermijdelijk. We onderhandelen met SoC-fabrikanten om de prijsstijging te matigen, bijvoorbeeld door wat winstmarges op te offeren om de prijsstijging te handhaven of te vertragen, zoals een verhoging van $ 41 in plaats van $ 68, waarbij de resterende $ 27 het jaar daarop wordt toegevoegd.

De tweede factor omvat beeldvorming, zoals telelenzen, die verre van perfect zijn. We moeten jaarlijks blijven investeren. Hoewel de ruimte hetzelfde blijft, zullen de implementatiemethoden, zoals lensopstelling en module-implementatie, aanzienlijk veranderen. Deze veranderingen zullen de opbrengstpercentages verlagen en de productkosten verhogen.

De stijgende trend in de prijzen van vlaggenschiptelefoons is onvermijdelijk. Voor de meeste gewone gebruikers is de sub-vlaggenschipervaring al behoorlijk goed. Het N-1-platform (sub-vlaggenschiptelefoons die de vorige generatie vlaggenschipchip gebruiken) heeft bijvoorbeeld de gebruikerservaring aanzienlijk verbeterd. We kunnen ook vlaggenschipimaging opnemen in N-1-platformproducten om tegemoet te komen aan de koopkracht van gebruikers.

Kortom, als gebruikers de ultieme ervaring in beeldvorming, AI en gaming nastreven, moeten ze ongeveer $ 68 meer uitgeven. Als ze niet de ultieme ervaring nastreven, biedt het N-1-platform een ​​goed uiterlijk en een behoorlijke ervaring. Voor gebruikers die niet de meest intense games spelen en alleen games als Genshin Impact spelen, is het N-1-platform voldoende. Voor fotografie, als ze geen 20x zoom nodig hebben bij concerten en tevreden zijn met 10x zoom, kan de standaard X-serie aan hun behoeften voldoen.

Gebruikers met een hoge koopkracht en een verlangen naar de ultieme ervaring zullen dus een stapje hogerop komen, maar we zullen nog steeds producten aanbieden tegen passende prijzen met goede ervaringen om aan de behoeften van de gebruikers te voldoen.

Bron van als een

Disclaimer: De hierboven vermelde informatie wordt verstrekt door ifanr.com, onafhankelijk van Chovm.com. Chovm.com geeft geen verklaringen en garanties met betrekking tot de kwaliteit en betrouwbaarheid van de verkoper en producten. Chovm.com wijst uitdrukkelijk elke aansprakelijkheid af voor inbreuken met betrekking tot het auteursrecht op inhoud.

Laat een bericht achter

Uw e-mailadres wordt niet gepubliceerd. Verplichte velden zijn gemarkeerd *

Scroll naar boven