2024년 마지막 주에 iFanr과 같은 미디어 매체가 Vivo의 동관 본사를 방문하여 Vivo의 전무이사 겸 최고운영책임자인 후 바이산과 대화를 나누었습니다. 그들은 시장 역학, AI 진행 상황 및 응용 프로그램, Vivo 제품의 미래 방향 및 계획에 대해 논의했습니다. 여기에는 폴더블 스크린 시장에 대한 생각, MR 안경, 휴머노이드 로봇, AI 안경, Vivo의 강점인 이미징에 대한 계획 및 견해가 포함되었습니다.

아래는 제품 수준 대화의 요약입니다(가독성을 위해 iFanr에서 편집):
망원 및 비디오는 개선의 여지가 있고 모바일 AI는 갈 길이 멀다
Q: 현재 AI의 상태에 대한 당신의 견해는 무엇입니까? 미래에 AI가 스마트폰의 주요 판매 포인트로서 이미징을 대체할까요? 플래그십 폰이 이미징 기능에서 정점에 도달했습니까?
후바이산: 먼저 이미징에 대해 이야기해 보겠습니다. 우리의 궁극적인 목표는 대부분의 DSLR 카메라 시나리오를 대체하는 것이므로 여전히 개선의 여지가 상당히 있습니다.
앞서 언급했듯이 X200 Pro의 메인 카메라는 이전 플래그십의 1인치 센서에서 1/1.28인치 센서로 줄어들었지만 사용자 경험은 떨어지지 않았습니다. 이는 칩 처리 능력과 이미징 알고리즘이 상당한 진전을 이루었기 때문입니다. 이는 메인 카메라의 사용자 경험이 적절한 수준에 도달했음을 나타냅니다. 점수를 매긴다면 기존 DSLR을 100점으로 가정할 때, 저희 메인 카메라는 80~85점에 가깝습니다.
하지만 망원과 비디오 면에서는 여전히 DSLR과 비교해 상당한 격차가 있습니다. 점수를 계속 매기면 메인 카메라는 80~85점, 망원은 60점대로 간신히 통과합니다.
콘서트 시나리오에서 10배 줌에서 X200 Pro는 좋은 성능을 발휘하고, 20배에서는 밤에 외곽에서 촬영할 때 그 사람이 누구인지 알아볼 수 있습니다. 그러나 사용자들은 여전히 품질이 충분하지 않기 때문에 소셜 미디어에 이 사진을 공유하는 것을 주저하지만, 10배는 괜찮은 수준입니다.
망원 영역에서 우리의 스마트폰 이미징은 DSLR과는 상당히 거리가 있습니다. 우리는 80~3년 안에 망원을 5포인트 수준으로 개선하는 것을 목표로 하고 있으며, 이러한 기회는 여전히 존재합니다. 스마트폰의 내부 공간 활용이 한계에 도달했지만, 어디에서 개선할 수 있을까요? 이미징 센서의 감도는 여전히 기술을 통해 향상될 수 있으며, 대형 모델과 이미징 알고리즘에는 상당한 개선 여지가 있습니다. 이것이 제가 Vivo가 미래에 80포인트 망원을 달성할 수 있다고 확신하는 이유입니다.
사진은 비교적 정적이므로 알고리즘이 더 많은 역할을 할 수 있지만 비디오는 동적입니다. 비디오에 알고리즘을 많이 추가하면 전력 소비에 엄청난 압박을 가할 것입니다. 물론 여기서도 개선의 여지가 있습니다. 칩은 현재 3nm이고 차세대는 2nm가 될 것입니다. SoC 칩과 미래의 전용 이미징 처리 칩도 발전할 것입니다. 다음 단계는 비디오에 대규모 모델 알고리즘 기능을 적용하는 것이지만 비디오의 전반적인 논리는 동적이므로 알고리즘의 향상 기능은 여전히 약할 것입니다.
망원이든 비디오든 사용자의 높은 요구를 충족하는 데는 여전히 상당한 거리가 있으며, 기술 자체도 상당한 개발 여지가 있습니다. 따라서 이미징은 미래의 플래그십 스마트폰의 핵심 초점으로 남아 있습니다.
AI에 관해서는 실제로 지난 2년 동안 대형 모델의 개발이 빠르게 진행되었습니다. 전화 자체로 돌아가서, AI는 여전히 한계가 있습니다. 전화의 가장 큰 문제는 컴퓨팅 파워가 부족하다는 것입니다. 저는 모바일 AI를 세 단계로 나눕니다.
첫 번째 단계는 AI 역량으로 과거 기능을 강화하는 것입니다. 예를 들어, 최근 모바일 산업 전체에서 AI 제거가 꽤 인기를 끌었는데, 이 기능은 10년 전에 존재했지만 원시 알고리즘으로 인해 제대로 실행되지 않았습니다.
과거에는 딥 러닝을 사용한 음성 인식 기능의 성공률이 기껏해야 90%에 불과했습니다. 이러한 성공률로는 각 단계가 너무 많이 왜곡되어 대화가 여러 라운드 동안 지속될 수 없다는 것을 알게 될 것입니다. 생성적 대형 모델의 등장으로 음성 인식 및 의미 이해 기능이 크게 향상되었습니다. NEX 3에 처음 도입된 Phone Secretary라는 기능이 있었는데, 사람들은 그것이 전통적인 AI라는 것을 즉시 알아차리고 몇 문장 후에 전화를 끊었습니다. 이제 AI 지원으로 사람들은 짧은 시간 안에 AI가 말하는 것을 알아차릴 수 없습니다.
이러한 기술은 여전히 특정 기능이나 모듈의 향상에 기반을 두고 있으며, 일반적인 인공지능(AGI)과는 거리가 멉니다.
두 번째 단계는 대규모 모델 기능을 시스템에 통합하는 것이라고 생각합니다. 예를 들어, 과거에는 메뉴 옵션이 너무 많고 모두 뒤섞여 있어서 기능 설정을 찾는 것이 거의 불가능했습니다. 미래에는 AI가 시스템에 깊이 통합되면서 휴대전화가 사용자의 의도를 명확하게 이해하고 다음에 무엇을 해야 할지 알게 되어 휴대전화 상호 작용이 더욱 지능적으로 될 것입니다. 예를 들어, "Atomic Island"에 대한 우리의 초기 시도는 사용자의 의도를 이해하고 해결책을 제안하는 것입니다. 이 단계는 꽤 오래 걸릴 것입니다. 이 단계의 사용자 경험은 현재 컴퓨팅 성능으로는 간신히 충족할 수 있기 때문입니다.
세 번째 단계는 VDC 2024 컨퍼런스에서 언급한 PhoneGPT입니다. 우리가 시연한 기능은 테이크아웃 주문이었고, 성공적으로 수행할 수 있었습니다. 그러나 각 단계의 성공률은 85%에 불과했고, 세 단계를 거친 후에는 진행할 수 없었고, 시간이 오래 걸렸습니다. 이 경험은 단지 모델일 뿐이며, 사용자 경험은 전혀 좋지 않습니다.
PhoneGPT의 요구 사항을 진정으로 달성하려면 컴퓨팅 파워에 대한 수요가 약간 증가하는 것이 아니라 상당히 증가해야 합니다. 현재의 통합 아키텍처, 패키징 아키텍처, 대역폭은 부족합니다. PhoneGPT를 진정으로 달성하려면 전체 기능 요구 사항이 현재의 고속 스토리지, 서버 측 기능, 대역폭 기능, SoC 아키텍처와 비슷해야 기회가 생깁니다.
이는 이미징과 유사합니다. 사용자 수요가 이미 나타난 것을 볼 수 있습니다. 많은 모델이 클라우드 서버에서 실행됩니다. 당사의 내부 컴퓨팅 파워 센터에는 약 10,000개의 컴퓨팅 카드가 있으며, 130B 매개변수가 있는 모델과 같이 많은 모델이 클라우드에서 실행될 수 있지만, 이 규모는 휴대전화에서 실행할 수 없습니다. 휴대전화는 2B 또는 3B 매개변수가 있는 모델만 실행할 수 있습니다. 따라서 휴대전화에서 PhoneGPT를 진정으로 구현하려면 사용자 경험 요구 사항을 충족하는 데 최소 XNUMX년이 걸릴 것으로 예상합니다.
AI 트랙은 현재 두 번째 단계에 있습니다. 0에서 1로 도약하는 것이 아니라 점진적인 개선입니다. 따라서 AI는 현재 휴대폰 교체 주기의 중요한 원동력이 아닙니다. 사용자는 0에서 1로 도약하는 것을 경험하지 못했기 때문입니다. 그러한 도약이 일어나고 사용자가 PhoneGPT가 많은 일을 할 수 있다는 것을 알게 되어야 휴대폰을 업그레이드하려는 강한 욕구가 생길 것입니다.
저는 제품과 기술 두 가지 모두를 책임지고 있기 때문에, 제가 공개하는 내용은 우리 기술이나 전체 산업의 기술의 현재 수준을 반영해야 합니다.
질문: 스마트폰 산업에서 새로운 생산성의 질을 반영하는 측면은 무엇이며, 가장 중요한 부분은 무엇입니까?
후바이산: 스마트폰 산업은 새로운 품질 생산성의 대표적인 예입니다. 제가 이해하기로는 새로운 품질 생산성에는 하이테크, 하이 품질, 하이 다이내미즘이라는 세 가지 특징과 네 가지 새로운 기능이 있습니다. 이러한 기준에 따르면 스마트폰은 새로운 품질 생산성 범주에 속합니다. 수년에 걸쳐 우리는 스마트폰에서 새로운 기술이 지속적으로 업데이트되는 것을 보았습니다.
우리는 이미징과 AI라는 두 분야에 중점을 두고 있습니다. 이미징 분야에서는 지난 5년 동안 다양한 조건에서 스마트폰 사진의 빠른 개선을 사람들이 알아차렸습니다. 이는 빠른 속도의 발전이었습니다.
스마트폰은 우리가 과거에 사용했던 많은 디지털 카메라를 대체했고, 심지어 미러리스 카메라도 대체했으며, 어떤 경우에는 DSLR도 대체했습니다. 더 많은 소비자가 더 나은 사진 효과를 위해 기꺼이 비용을 지불하고, 이를 달성하기 위해 휴대전화에 더 많은 돈을 쓰고 있습니다.
2024년에는 "콘서트 매직 디바이스"라고 부르는 X100 Ultra와 X200 Pro를 출시할 예정입니다. 최근 몇 년 동안 콘서트가 잦아졌고, 소비자들은 이 아름다운 순간을 포착하고 싶어합니다. 콘서트에 스마트폰이 필요한 이유는 무엇일까요? DSLR은 콘서트장으로 가져갈 수 없으므로 소비자들은 휴대전화로만 이 순간을 포착할 수 있습니다.
AI 분야도 비슷합니다. AI는 이제 막 시작 단계이지만 스마트폰의 많은 분야에 힘을 실어 주었습니다. 저는 스마트폰 산업이 새로운 품질 생산성의 대표로서 의심할 여지 없이 중요하다고 믿습니다. 또한 저는 스마트폰이 오랫동안 핵심 소비자 전자 제품으로 남아 새로운 품질 생산성에 기여할 것이라고 믿습니다.

Vivo MR 프로토타입 2026년 출시, 휴머노이드 로봇 XNUMX년 내 성숙
질문: Vivo는 MR(혼합현실) 및 휴머노이드 로봇 분야에서 어떻게 발전하고 있나요?
후바이산: 저희의 MR 진행은 비교적 빠릅니다. Vivo MR 팀은 500명에 가까운 규모로 성장했습니다. 저희의 목표는 2025년 XNUMX월 또는 XNUMX월까지 전국 XNUMX개 도시의 Vivo 매장에서 고충실도 MR 경험 프로토타입을 제공하는 것입니다. 예약부터 현장 경험까지, 저희는 모든 사람이 시도해 볼 수 있는 표준화된 프로세스를 만드는 것을 목표로 합니다.
상용화를 위해서는 여전히 엔터테인먼트와 게임 콘텐츠가 필요한 전체 MR 생태계를 살펴봐야 합니다. Vivo는 콘텐츠를 생산하지 않기 때문에 생태계가 제때 맞춰줄 것을 기대합니다. 많은 지표에서 업계가 유리한 방향으로 움직이고 있음을 알 수 있습니다. Tencent는 콘텐츠에 대한 투자를 늘리고 있습니다. 이전에는 하드웨어를 만들고 싶었지만 최근에는 소프트웨어에 집중하기로 결정했는데, 이는 우리에게 좋은 일입니다.
저는 MR 팀에 필수적이라고 생각하는 시나리오를 찾도록 요구합니다. 타겟 고객이 틈새 시장이더라도 그들에게는 MR이 없어서는 안 될 것입니다.
예를 들어, 휴대폰이나 콘솔에서 플레이하는 게임은 어느 정도 수준입니다. MR이 도입되면 사용자는 이러한 게임이 열등하다는 것을 깨닫게 되고 경험이 상당히 향상될 것입니다. 항상 MR 기기를 가지고 다니지 않는 경우를 제외하고, 대부분 게임을 할 시간이 있을 때 MR로 전환합니다. 이는 필수적인 시나리오입니다.
휴머노이드 로봇에 관해서, 2024년에도 우리는 이 개념을 언급했습니다. 수요는 분명합니다. 사회는 빠르게 고령화되고 있습니다.
트렌드 관점에서 로봇은 실제로 방향입니다. 우리는 로봇의 핵심 경로를 분석했는데, 그 중 하나는 공간 지각입니다. MR은 강력한 공간 지각 능력을 가지고 있습니다. MR이 잘 개발되면 로봇의 공간 지각은 문제가 되지 않을 것입니다.
로봇은 또한 유연한 손과 발, 그리고 강력한 의사결정 능력을 필요로 합니다. 이상적인 로봇을 달성하려면 10년 이상 걸릴 것으로 생각합니다.
공간 지각과 의사결정 능력은 단기적으로 완벽하지 않겠지만, 산업용 로봇이 특수한 작업을 수행하는 것처럼 손과 발의 능력은 비교적 빠르게 향상될 것입니다.
이상적인 로봇을 구현하는 데는 10~15년이 걸릴 수 있지만, 단계적으로 구현할 수 있습니다. 예를 들어, 생산 라인 로봇과 같이 "2가지 작업"을 수행할 수 있는 제한된 범위에서 시작할 수 있지만, 미래에는 "10가지 작업"을 수행할 수 있기를 바랍니다. 이 기능을 구축하고 있지만 제품 출시는 빠르지 않을 것입니다.
우리의 현재 논리는 내부적으로 시나리오 및 사용자 수요 주도형이라고 부르는 이러한 로봇은 명확한 요구 사항이 있지만 기술적 솔루션 경로는 완전히 명확하지 않다는 것입니다. 이미징에 대한 이전 논의와 마찬가지로 사용자는 DSLR 수준의 사진을 원합니다. 로봇은 명확한 사용자 시나리오 요구 사항이 있지만 기술은 일치하지 않습니다. 앞으로 3~5년 안에 기술 성숙도 상태를 이해할 것입니다. 이를 바탕으로 해당 중간 지점에서 특정 로컬 시나리오를 해결할 수 있는 기능을 갖춘 제품을 설정할 수 있습니다.
간단히 말해서, 우리는 AI 역량을 포함하여 향후 3~5년 동안의 기술 상태를 이해해야 합니다. 이러한 기술 역량을 바탕으로 특정 요구 사항을 충족하기 위해 이상적인 시나리오에서 일부 조정을 할 수 있습니다. 이것이 우리의 내부 제품 주기 계획입니다.
Q: AR 산업 체인이 더 빨리 성숙해지고 있습니다. 이에 대해 어떻게 생각하십니까?
후바이산: AR 제품의 경우, 우리는 다음과 같이 이해합니다. 사용자 수요 관점에서 안경은 너무 무거울 수 없습니다. 디스플레이가 있는 AR 안경은 무겁고, 약 40~50그램으로 좋은 경험이 아닙니다. 일부 AR 안경은 디스플레이 기능이 제한적입니다. 우리는 아직 이 범주에 진출하지 않았지만, 비디스플레이 안경을 고려하고 있습니다. 어떤 제품 범주를 작업하든, 사용자의 기본적인 요구 사항을 파악하고 제품이 필수적인 특정 사용자 그룹을 찾아야 합니다. 최근에 제품 팀의 동료들과 논의하면서 필수 사용자와 시나리오를 파악했는지 물었습니다. 그들은 몇 가지를 찾았다고 말했고, 그것은 타당해 보였습니다.
많은 사용자들이 일하는 동안 손을 바쁘게 움직입니다. 다른 사람이 그들을 도울 필요가 있을까요? 한 사람만 있고 손이 바쁘다면 이 문제를 해결하기 위해 보조 장치가 필요합니다. 휴대전화나 다른 장치는 이 문제를 잘 해결할 수 없습니다. 따라서 우리 MR 장치의 위치 논리는 그 그룹의 사람들에게 필수적이며, 우리는 이 사람들을 식별했습니다. 제품이 빠르게 진행되면 2025년 말, 늦어도 2026년까지 등장할 것입니다.

폴더블 스크린 수요 변화, 제품 페이스 조정될 듯
Q: 4년간 성장해 온 폴더블폰 시장이 정체되거나 심지어 쇠퇴하고 있습니다. 비보의 폴더블폰에 대한 계획은 무엇입니까?
후바이산: 처음에 제조업체들은 폴더블 스크린에 대한 기대가 컸습니다. 제품 형태의 상당한 변화였기 때문입니다. 사용자 요구의 관점에서 폴더블 스크린을 사용하는 사람은 누구일까요?
한 그룹은 저처럼 시력이 나빠지는 45세 이상의 사람들입니다. 폴더블 폰은 노안과 관련된 많은 문제를 해결했습니다. 뉴스를 읽거나 비디오를 보려면 더 큰 화면이 필요하기 때문에 노인의 요구를 충족합니다.
두 번째 그룹에는 여기 있는 사람들과 같은 미디어 전문가들이 포함됩니다. 그들은 폴더블 폰을 사용하여 저를 포함한 많은 양의 정보를 처리하고 회사 이메일과 메시지를 관리합니다.
바형 폰에서 정보를 처리할 때는 대개 세로 모드이며, 가로 모드로 전환해야 하는데 이는 좋은 경험이 아니며 텍스트도 비교적 작습니다.
그룹에 관계없이 특정 사람들의 요구를 충족합니다. 제품을 만들 때 필수적인 사용자가 누구인지 이해해야 합니다. 폴더블 스크린이 처음 나왔을 때 많은 사용자가 호기심에 시도했지만 자신에게 적합하지 않다는 것을 알게 되었습니다.
제 친구는 위챗, 전화, 문자 메시지 외에는 주로 더우인(틱톡)을 사용하는데, 더우인은 세로 모드로 사용하기 때문에 폴더블 화면은 쓸모가 없고 앞으로는 폴더블 폰을 다시 사지 않을 거라고 말했습니다.
초기 개발 후 남은 사용자는 앞서 언급했듯이 필수적인 사용자입니다. 첫 번째 및 두 번째 그룹의 시장 용량은 비교적 작습니다. 게임과 같은 많은 시나리오에서 폴더블 화면은 이상적이지 않습니다. 바 폰에 비해 열 발산 및 제어 경험이 더 나쁘기 때문에 폴더블 화면은 특정 그룹을 위한 제품이 되었습니다. 시장 규모는 이러한 특정 그룹의 규모에 따라 달라지며 약 500만 대에서 안정될 수 있습니다.
우리는 폴더블 폰을 만들어야 할까요? 그렇습니다. 사용자 요구의 관점에서 보면 그러한 그룹이 있지만, 우리는 그것을 통제해야 합니다. 이전 세대에서는 두 가지 모델을 만들었는데, 하나는 이미징과 성능에 초점을 맞추고 다른 하나는 비용 효율성에 초점을 맞췄습니다. 우리는 수백만 대의 판매를 계획했지만 수십만 대에 그쳤고, 여전히 제한적입니다. 앞으로는 폴더블 화면이 필요한 사용자가 항상 있을 것이므로 매년 반복하여 사용자 경험을 개선할 것입니다. 예를 들어, 일부 사용자는 일상적인 WeChat과 소셜 상호 작용에 한 대의 폰을 사용하고 주식 시장 업데이트와 문서 승인에 다른 폰을 사용합니다.
또한, 소형 폴더블 제품의 경우, 글로벌 시장은 2023년에 성장했지만, 2024년에는 선두 브랜드의 소형 폴더블 제품이 30%~40% 감소했습니다. Vivo는 앞으로도 소형 폴더블 제품을 출시하지 않을 가능성이 큽니다.

플래그십 폰 가격은 계속 상승할 것이고, 서브 플래그십 경험은 이미 꽤 좋다
Q: 플래그십 폰 가격은 2025년에 약간 상승할 것입니다. 2026년에도 가격 상승이 계속될까요? vivo balance 비용과 가격은 어떻습니까?
후바이산: 우리는 두 가지 요인으로 인해 가격 인상이 계속될 것이라고 믿습니다. 첫 번째는 분명합니다. 주력 SoC 플랫폼과 반도체 공정은 계속 개선될 것이므로 가격 인상은 불가피합니다. 우리는 SoC 제조업체와 가격 인상을 완화하기 위해 협상하고 있습니다. 예를 들어, 일부 이익 마진을 희생하여 가격 인상을 유지하거나 늦추는 것입니다. 예를 들어, 41달러 대신 68달러를 인상하고 나머지 27달러는 다음 해에 추가하는 것입니다.
두 번째 요인에는 완벽과는 거리가 먼 망원 렌즈와 같은 이미징이 포함됩니다. 우리는 매년 투자를 계속해야 합니다. 공간은 동일하지만 렌즈 배열 및 모듈 구현과 같은 구현 방법은 상당히 변경될 것입니다. 이러한 변화는 수율을 낮추고 제품 비용을 증가시킬 것입니다.
플래그십 폰 가격의 상승 추세는 불가피합니다. 대부분의 일반 사용자에게는 하위 플래그십 경험이 이미 꽤 좋습니다. 예를 들어, N-1 플랫폼(이전 세대 플래그십 칩을 사용하는 하위 플래그십 폰)은 사용자 경험을 크게 개선했습니다. 또한 사용자의 구매력을 충족시키기 위해 N-1 플랫폼 제품에 플래그십 이미징을 포함할 수도 있습니다.
간단히 말해, 사용자가 영상, AI, 게임에서 궁극적인 경험을 추구한다면 약 68달러를 더 지출해야 합니다. 궁극적인 경험을 추구하지 않는다면 N-1 플랫폼은 좋은 외관과 괜찮은 경험을 제공합니다. 가장 강렬한 게임을 하지 않고 Genshin Impact와 같은 게임만 하는 사용자에게는 N-1 플랫폼으로 충분합니다. 사진 촬영의 경우 콘서트에서 20배 줌이 필요하지 않고 10배 줌으로 만족한다면 표준 X 시리즈가 그들의 요구를 충족시킬 수 있습니다.
따라서 구매력이 강하고 최고의 경험을 원하는 사용자는 상위권으로 이동하겠지만, 우리는 여전히 사용자의 요구에 부응하기 위해 적절한 가격대에 좋은 경험과 함께 제품을 제공할 것입니다.
출처 이판르
면책 조항: 위에 제시된 정보는 Chovm.com과 독립적으로 ifanr.com에서 제공합니다. Chovm.com은 판매자와 제품의 품질과 신뢰성에 대해 어떠한 진술과 보증도 하지 않습니다. Chovm.com은 콘텐츠의 저작권과 관련된 위반에 대한 모든 책임을 명시적으로 부인합니다.