Beranda » Sumber Produk » Pengguna Elektronik » Visi Vivo untuk AI dan Pencitraan di Ponsel Pintar Masa Depan
Wakil Presiden Eksekutif dan Chief Operating Officer Vivo, Hu Baishan.

Visi Vivo untuk AI dan Pencitraan di Ponsel Pintar Masa Depan

Pada minggu terakhir tahun 2024, media seperti iFanr mengunjungi kantor pusat Vivo di Dongguan untuk berbincang dengan Wakil Presiden Eksekutif dan Chief Operating Officer Vivo, Hu Baishan. Mereka membahas dinamika pasar, kemajuan dan aplikasi AI, serta arah dan perencanaan masa depan produk Vivo. Ini termasuk pemikiran tentang pasar layar lipat, rencana dan pandangan tentang kacamata MR, robot humanoid, kacamata AI, dan keunggulan Vivo: pencitraan.

Kantor pusat Vivo di Dongguan.

Berikut adalah ringkasan percakapan tingkat produk (diedit oleh iFanr agar mudah dibaca):

Telefoto dan Video Masih Bisa Ditingkatkan; AI Seluler Masih Harus Banyak Berkembang

T: Bagaimana pandangan Anda tentang kondisi AI saat ini? Akankah AI menggantikan pencitraan sebagai nilai jual utama ponsel pintar di masa mendatang? Apakah ponsel unggulan telah mencapai puncaknya dalam kemampuan pencitraan?

Hu Baishan: Mari kita bahas tentang pencitraan terlebih dahulu. Sasaran akhir kita adalah mengganti sebagian besar skenario kamera DSLR, jadi masih ada banyak hal yang bisa ditingkatkan.

Seperti yang saya sebutkan sebelumnya, kamera utama X200 Pro telah diperkecil dari sensor 1 inci pada flagship sebelumnya menjadi sensor 1/1.28 inci, namun pengalaman pengguna tidak menurun. Ini karena daya pemrosesan chip dan algoritma pencitraan telah membuat langkah maju yang signifikan. Ini menunjukkan bahwa pengalaman pengguna kamera utama telah mencapai level yang layak. Jika kami harus memberi skor, dengan asumsi DSLR konvensional adalah 100 poin, kamera utama kami mendekati 80 hingga 85 poin.

Namun, dalam hal telefoto dan video, masih terdapat kesenjangan yang cukup besar dibandingkan dengan DSLR. Jika kita teruskan penilaian, kamera utama berada pada skor 80 hingga 85, sedangkan telefoto berada pada sekitar 60 poin, nyaris tidak melewatinya.

Dalam skenario konser, pada zoom 10x, X200 Pro kami berkinerja baik, dan pada zoom 20x, Anda dapat mengenali siapa orang tersebut saat mengambil gambar dari area luar pada malam hari. Namun, pengguna masih ragu untuk membagikan foto-foto ini di media sosial karena kualitasnya tidak cukup baik, tetapi zoom 10x cukup bagus.

Di bidang telefoto, pencitraan ponsel pintar kami masih jauh dari DSLR. Kami bermaksud meningkatkan telefoto ke level 80 titik dalam waktu 3 hingga 5 tahun, dan peluang ini masih ada. Meskipun pemanfaatan ruang internal ponsel pintar telah mencapai batasnya, di mana lagi kami dapat meningkatkannya? Sensitivitas sensor pencitraan masih dapat ditingkatkan melalui teknologi, dan masih ada ruang yang signifikan untuk peningkatan pada model besar dan algoritme pencitraan. Inilah sebabnya saya yakin bahwa Vivo dapat mencapai telefoto 80 titik di masa mendatang.

Fotografi relatif statis, jadi algoritme punya lebih banyak ruang untuk bermain, tetapi video bersifat dinamis. Menambahkan banyak algoritme ke video akan memberi tekanan besar pada konsumsi daya. Tentu saja, ada ruang untuk perbaikan di sini juga. Chip sekarang berukuran 3nm, dan generasi berikutnya akan berukuran 2nm. Chip SoC, dan bahkan chip pemrosesan gambar khusus di masa mendatang, akan maju. Langkah kami berikutnya adalah menerapkan kapabilitas algoritme model besar ke video, tetapi logika video secara keseluruhan bersifat dinamis, jadi kapabilitas peningkatan algoritme akan tetap lebih lemah.

Baik itu telefoto maupun video, masih ada jarak yang cukup jauh untuk memenuhi tuntutan tinggi pengguna, dan teknologi itu sendiri masih memiliki ruang yang signifikan untuk dikembangkan. Oleh karena itu, pencitraan tetap menjadi fokus utama untuk ponsel pintar unggulan di masa mendatang.

Mengenai AI, memang, pengembangan model-model besar telah berlangsung cepat selama dua tahun terakhir. Kembali ke telepon itu sendiri, AI masih memiliki keterbatasan. Masalah terbesar dengan telepon adalah daya komputasi yang tidak memadai. Saya membagi AI seluler menjadi tiga tahap:

Tahap pertama adalah meningkatkan fungsi-fungsi terdahulu dengan kemampuan AI. Misalnya, akhir-akhir ini, seluruh industri seluler cukup populer dengan penghapusan AI, sebuah fitur yang sudah ada lebih dari satu dekade lalu tetapi tidak dijalankan dengan baik karena algoritmanya yang primitif.

Di masa lalu, kemampuan pengenalan suara menggunakan pembelajaran mendalam memiliki tingkat keberhasilan paling tinggi hanya 90%. Dengan tingkat keberhasilan seperti itu, Anda akan menemukan bahwa percakapan tidak dapat berlangsung selama beberapa putaran, karena setiap langkah akan terlalu terdistorsi. Dengan munculnya model besar yang generatif, kemampuan pengenalan suara dan pemahaman semantik telah meningkat secara signifikan. Kami memiliki fitur yang disebut Phone Secretary, yang pertama kali diperkenalkan pada NEX 3, di mana orang dapat langsung mengetahui bahwa itu adalah AI tradisional, dan panggilan akan ditutup setelah beberapa kalimat. Sekarang, dengan dukungan AI, orang tidak dapat mengetahui bahwa itu adalah AI yang berbicara dalam waktu singkat.

Ini masih didasarkan pada peningkatan fungsi atau modul tertentu, jauh dari kecerdasan buatan umum (AGI).

Tahap kedua, menurut saya, adalah mengintegrasikan kapabilitas model besar ke dalam sistem. Misalnya, di masa lalu, menemukan pengaturan fungsi hampir mustahil karena ada terlalu banyak opsi menu, semuanya campur aduk. Di masa mendatang, dengan AI yang terintegrasi secara mendalam ke dalam sistem, ponsel akan memahami dengan jelas maksud Anda dan tahu apa yang harus dilakukan selanjutnya, sehingga interaksi ponsel menjadi lebih cerdas. Misalnya, upaya awal kami dengan "Atomic Island" adalah memahami maksud Anda dan mengusulkan solusi. Tahap ini akan berlangsung cukup lama karena pengalaman pengguna pada tahap ini hampir tidak dapat dipenuhi dengan daya komputasi saat ini.

Tahap ketiga adalah apa yang kami sebutkan di konferensi VDC 2024, PhoneGPT. Fitur yang kami tunjukkan adalah memesan makanan untuk dibawa pulang, dan itu dapat dilakukan dengan sukses. Namun, setiap langkah hanya memiliki tingkat keberhasilan 85%, dan setelah tiga langkah, itu tidak dapat dilanjutkan, dan butuh waktu lama. Pengalaman ini hanyalah sebuah model, dan pengalaman pengguna sama sekali tidak bagus.

Untuk benar-benar mencapai persyaratan PhoneGPT, permintaan daya komputasi tidak hanya sedikit meningkat, tetapi juga signifikan. Arsitektur terintegrasi, arsitektur pengemasan, dan lebar pita saat ini tidak memadai. Untuk benar-benar mencapai PhoneGPT, seluruh persyaratan kemampuan harus mendekati penyimpanan berkecepatan tinggi saat ini, kemampuan sisi server, kemampuan lebar pita, dan arsitektur SoC agar memiliki peluang.

Hal ini serupa dengan pencitraan. Kita dapat melihat bahwa permintaan pengguna telah muncul. Banyak model berjalan di server cloud. Pusat daya komputasi internal kami memiliki hampir 10,000 kartu komputasi, dan banyak model dapat berjalan di cloud, seperti model dengan parameter 130B, tetapi skala ini tidak dapat berjalan di ponsel. Ponsel hanya dapat menjalankan model dengan parameter 2B atau 3B. Jadi, untuk benar-benar mencapai PhoneGPT di ponsel, saya memperkirakan akan memakan waktu setidaknya lima tahun untuk memenuhi persyaratan pengalaman pengguna.

Jalur AI saat ini masih dalam tahap kedua. Ini adalah peningkatan bertahap, bukan lompatan dari 0 ke 1. Oleh karena itu, AI bukanlah kekuatan pendorong yang signifikan untuk siklus penggantian ponsel saat ini karena pengguna belum mengalami lompatan dari 0 ke 1. Hanya ketika lompatan tersebut terjadi, dan pengguna menemukan bahwa PhoneGPT dapat melakukan banyak hal, mereka akan memiliki keinginan kuat untuk memperbarui ponsel mereka.

Karena saya bertanggung jawab atas produk dan teknologi, apa yang saya ungkapkan harus mencerminkan tingkat teknologi saat ini atau teknologi seluruh industri. 

T: Dalam industri telepon pintar, aspek apa yang mencerminkan kualitas produktivitas baru, dan bagian mana yang paling penting?

Hu Baishan: Industri telepon pintar adalah contoh utama produktivitas kualitas baru. Sejauh pemahaman saya, produktivitas kualitas baru memiliki tiga karakteristik: teknologi tinggi, kualitas tinggi, dan dinamisme tinggi, beserta empat fitur baru. Berdasarkan standar ini, telepon pintar termasuk dalam kategori produktivitas kualitas baru. Selama bertahun-tahun, kita telah melihat pembaruan berkelanjutan dari teknologi baru di telepon pintar.

Kami berfokus pada dua bidang: pencitraan dan AI. Dalam bidang pencitraan, selama lima tahun terakhir, orang-orang telah menyadari adanya peningkatan pesat dalam fotografi ponsel pintar dalam berbagai kondisi. Ini merupakan kemajuan yang pesat.

Ponsel pintar telah menggantikan banyak kamera digital yang kita gunakan di masa lalu, bahkan menggantikan kamera mirrorless, dan dalam beberapa skenario, DSLR. Lebih banyak konsumen yang bersedia membayar untuk efek fotografi yang lebih baik, menghabiskan lebih banyak uang untuk ponsel demi mencapainya.

Pada tahun 2024, kami akan merilis X100 Ultra dan X200 Pro, yang kami sebut sebagai "perangkat ajaib konser". Konser telah sering diadakan dalam beberapa tahun terakhir, dan konsumen ingin mengabadikan momen-momen indah ini. Mengapa konser membutuhkan ponsel pintar? DSLR tidak dapat dibawa ke tempat konser, jadi konsumen hanya dapat menggunakan ponsel untuk mengabadikan momen-momen ini.

Bidang AI juga serupa. AI baru saja dimulai, tetapi telah memberdayakan banyak bidang ponsel pintar. Saya yakin industri ponsel pintar, sebagai representasi produktivitas kualitas baru, tidak diragukan lagi signifikan. Saya juga percaya bahwa untuk waktu yang lama, ponsel pintar akan tetap menjadi produk elektronik konsumen inti, yang berkontribusi pada produktivitas kualitas baru.

Ponsel pintar Vivo X200 dipajang di atas meja.

Prototipe Vivo MR Hadir Tahun 2026, Robot Humanoid Akan Matang dalam Sepuluh Tahun

T: Bagaimana kemajuan Vivo dalam MR (Mixed Reality) dan robot humanoid?

Hu Baishan: Kemajuan MR kami relatif cepat. Tim MR Vivo telah berkembang hingga hampir 500 orang. Sasaran kami adalah menyediakan prototipe pengalaman MR dengan ketelitian tinggi di toko-toko Vivo di sekitar selusin kota di seluruh negeri pada bulan September atau Oktober 2025. Dari pemesanan hingga pengalaman di tempat, kami bertujuan untuk menciptakan proses standar agar semua orang dapat mencobanya.

Untuk komersialisasi, kita perlu melihat seluruh ekosistem MR, yang masih membutuhkan konten hiburan dan game. Karena Vivo tidak memproduksi konten, kita mengandalkan ekosistem untuk mengimbanginya tepat waktu. Banyak indikasi yang menunjukkan industri ini bergerak ke arah yang menguntungkan. Tencent meningkatkan investasinya dalam konten. Sebelumnya, mereka ingin membuat perangkat keras, tetapi baru-baru ini mereka memutuskan untuk fokus pada perangkat lunak, yang bagus untuk kita.

Saya meminta tim MR untuk menemukan skenario yang kami anggap penting. Tidak masalah jika target audiensnya adalah ceruk pasar, tetapi bagi mereka, MR haruslah sangat diperlukan.

Misalnya, gim yang dimainkan di ponsel atau konsol berada pada level tertentu. Ketika MR hadir, pengguna akan menyadari bahwa gim tersebut di bawah standar, dan pengalaman bermain akan meningkat secara signifikan. Selain tidak membawa perangkat MR sepanjang waktu, sebagian besar waktu, ketika mereka punya waktu untuk bermain gim, mereka akan beralih ke MR. Ini adalah skenario yang penting.

Mengenai robot humanoid, pada tahun 2024, kami juga menyebutkan konsep ini. Permintaannya jelas: masyarakat menua dengan cepat.

Dari perspektif tren, robot memang merupakan sebuah arah. Kami telah menganalisis beberapa jalur utama bagi robot, salah satunya adalah persepsi spasial. MR memiliki kemampuan persepsi spasial yang kuat. Setelah MR dikembangkan dengan baik, persepsi spasial robot tidak akan menjadi masalah.

Robot juga memerlukan tangan dan kaki yang fleksibel serta kemampuan pengambilan keputusan yang kuat. Untuk mencapai robot yang ideal, kami yakin akan memakan waktu lebih dari sepuluh tahun.

Persepsi spasial dan kemampuan pengambilan keputusan tidak akan sempurna dalam jangka pendek, tetapi kemampuan tangan dan kaki akan meningkat relatif cepat, seperti robot industri yang melakukan tugas khusus.

Robot yang ideal mungkin memerlukan waktu sepuluh hingga lima belas tahun untuk terwujud, tetapi kita dapat menerapkannya secara bertahap. Misalnya, kita dapat memulai dengan rentang yang terbatas, seperti robot lini produksi, yang mungkin dapat melakukan "dua pekerjaan", tetapi kita berharap dapat melakukan "sepuluh pekerjaan" di masa mendatang. Kita sedang membangun kemampuan ini, tetapi peluncuran produk tidak akan cepat.

Logika kami saat ini adalah bahwa robot-robot ini, yang secara internal kami sebut sebagai skenario dan permintaan pengguna, memiliki kebutuhan yang jelas, tetapi jalur solusi teknisnya tidak sepenuhnya jelas. Seperti pembahasan kami sebelumnya tentang pencitraan, pengguna menginginkan fotografi tingkat DSLR. Robot memiliki kebutuhan skenario pengguna yang jelas, tetapi teknologinya tidak sesuai. Dalam tiga hingga lima tahun ke depan, kami akan memahami status kematangan teknologi. Berdasarkan hal ini, kami dapat menetapkan produk dengan kemampuan untuk memecahkan skenario lokal tertentu di titik tengah tersebut.

Singkatnya, kita perlu memahami keadaan teknologi dalam tiga hingga lima tahun ke depan, termasuk kemampuan AI. Berdasarkan kemampuan teknologi ini, kita dapat membuat beberapa penyesuaian dalam skenario ideal untuk memenuhi kebutuhan tertentu. Ini adalah rencana siklus produk internal kita.

T: Rantai industri AR semakin matang. Apa pendapat Anda tentang hal ini?

Hu Baishan: Untuk produk AR, kami memahaminya seperti ini: dari perspektif permintaan pengguna, kacamata tidak boleh terlalu berat. Kacamata AR dengan layar berat, sekitar 40-50 gram, yang tidak memberikan pengalaman yang baik. Beberapa kacamata AR memiliki kemampuan layar terbatas. Kami belum merambah ke kategori ini, tetapi kami mempertimbangkan kacamata tanpa layar. Apa pun kategori produk yang sedang kami garap, kami perlu mengidentifikasi kebutuhan dasar pengguna dan menemukan kelompok pengguna tertentu yang sangat membutuhkan produk tersebut. Baru-baru ini, saya berdiskusi dengan rekan-rekan dari tim produk, dan saya bertanya kepada mereka apakah mereka telah mengidentifikasi pengguna dan skenario penting. Mereka mengatakan telah menemukan beberapa, dan kedengarannya masuk akal.

Banyak pengguna yang tangannya sibuk bekerja. Apakah mereka membutuhkan orang lain untuk membantu mereka? Jika hanya ada satu orang dan tangannya sibuk, diperlukan perangkat tambahan untuk mengatasi masalah ini. Ponsel atau perangkat lain tidak dapat mengatasi masalah ini dengan baik. Oleh karena itu, logika penempatan perangkat MR kami adalah bahwa perangkat ini penting bagi kelompok orang tersebut, dan kami telah mengidentifikasi orang-orang ini. Jika produk ini berkembang pesat, produk ini akan muncul pada akhir tahun 2025, atau paling lambat tahun 2026.

Sebuah telepon pintar yang dapat dilipat ditampilkan di atas meja.

Perubahan Permintaan Layar Lipat, Laju Produk Akan Disesuaikan

T: Pasar ponsel lipat yang telah tumbuh selama 4 tahun, mengalami stagnasi atau bahkan penurunan. Apa rencana vivo untuk ponsel lipat?

Hu Baishan: Awalnya, produsen memiliki ekspektasi tinggi terhadap layar lipat karena ini merupakan perubahan signifikan dalam bentuk produk. Dari perspektif kebutuhan pengguna, siapa yang menggunakan layar lipat?

Satu kelompok adalah orang-orang berusia di atas 45 tahun, seperti saya, yang penglihatannya memburuk. Ponsel lipat telah memecahkan banyak masalah yang berkaitan dengan presbiopia, karena mereka membutuhkan layar yang lebih besar untuk membaca berita atau menonton video, memenuhi kebutuhan orang-orang yang lebih tua.

Kelompok kedua mencakup para profesional media seperti yang hadir di sini. Mereka menggunakan ponsel lipat untuk menangani sejumlah besar informasi, termasuk saya, untuk mengelola email dan pesan perusahaan.

Saat menangani informasi di telepon bar, biasanya dalam mode potret, dan Anda harus beralih ke mode lanskap, yang bukan pengalaman yang baik, dan teksnya relatif kecil.

Terlepas dari kelompoknya, layar lipat ditujukan untuk memenuhi kebutuhan orang-orang tertentu. Saat membuat produk, kita perlu memahami siapa saja pengguna utamanya. Saat layar lipat pertama kali muncul, banyak pengguna mencobanya karena penasaran, tetapi mereka merasa layar lipat tidak cocok untuk mereka.

Saya punya teman yang bilang bahwa selain menggunakan ponsel untuk WeChat, panggilan, dan pesan teks, ia terutama menggunakan Douyin (TikTok), yang dalam mode potret, jadi layar yang dapat dilipat tidak berguna baginya, dan ia tidak akan membeli ponsel yang dapat dilipat lagi.

Setelah pengembangan awal, pengguna yang tersisa adalah yang paling penting, seperti yang disebutkan sebelumnya. Kapasitas pasar untuk kelompok pertama dan kedua relatif kecil. Dalam banyak skenario, seperti bermain game, layar lipat tidaklah ideal. Layar lipat memiliki pembuangan panas dan pengalaman kontrol yang lebih buruk dibandingkan dengan telepon genggam, sehingga layar lipat telah menjadi produk untuk kelompok tertentu. Ukuran pasar bergantung pada skala kelompok tertentu ini dan dapat stabil pada sekitar lima juta unit.

Bagi kami, haruskah kami membuat ponsel yang dapat dilipat? Ya. Dari perspektif kebutuhan pengguna, ada kelompok-kelompok tersebut, tetapi kami perlu mengendalikannya. Pada generasi sebelumnya, kami membuat dua model, satu berfokus pada pencitraan dan kinerja, dan yang lainnya pada efektivitas biaya. Kami merencanakan penjualan jutaan unit tetapi berakhir dengan ratusan ribu, yang masih terbatas. Ke depannya, kami akan mengulanginya setiap tahun, meningkatkan pengalaman pengguna, karena akan selalu ada beberapa pengguna yang membutuhkan layar yang dapat dilipat. Misalnya, beberapa pengguna menggunakan satu ponsel untuk WeChat dan interaksi sosial harian dan ponsel lainnya untuk pembaruan pasar saham dan persetujuan dokumen.

Selain itu, untuk produk lipat kecil, pasar global tumbuh pada tahun 2023, tetapi pada tahun 2024, produk lipat kecil merek terkemuka menurun 30% hingga 40%. Vivo tidak mungkin merilis produk lipat kecil di masa mendatang.

Sebuah telepon pintar vivo dipajang di atas meja.

Harga Ponsel Flagship Bakal Terus Naik, Pengalaman Sub-Flagship Sudah Cukup Baik

T: Harga ponsel flagship akan sedikit naik pada tahun 2025. Apakah kenaikan harga akan terus berlanjut pada tahun 2026? Bagaimana vivo menyeimbangkan biaya dan harga?

Hu Baishan: Kami yakin kenaikan harga akan terus berlanjut karena dua faktor. Yang pertama jelas: platform SoC andalan dan proses semikonduktor akan terus membaik, sehingga kenaikan harga tidak dapat dihindari. Kami sedang bernegosiasi dengan produsen SoC untuk memoderasi kenaikan harga, misalnya, dengan mengorbankan sebagian margin keuntungan untuk mempertahankan atau memperlambat kenaikan harga, seperti menaikkan harga sebesar $41, bukan $68, dengan sisa $27 ditambahkan pada tahun berikutnya.

Faktor kedua mencakup pencitraan, seperti lensa telefoto, yang masih jauh dari kata sempurna. Kita perlu terus berinvestasi setiap tahun. Meskipun ruangnya tetap sama, metode penerapannya, seperti pengaturan lensa dan penerapan modul, akan berubah secara signifikan. Perubahan ini akan mengurangi tingkat hasil dan meningkatkan biaya produk.

Tren kenaikan harga ponsel flagship tidak dapat dihindari. Bagi sebagian besar pengguna biasa, pengalaman ponsel sub-flagship sudah cukup baik. Misalnya, platform N-1 (ponsel sub-flagship yang menggunakan chip flagship generasi sebelumnya) telah meningkatkan pengalaman pengguna secara signifikan. Kami juga dapat menyertakan pencitraan flagship dalam produk platform N-1 untuk memenuhi daya beli pengguna.

Singkatnya, jika pengguna mengejar pengalaman terbaik dalam pencitraan, AI, dan permainan, mereka perlu mengeluarkan sekitar $68 lebih banyak. Jika mereka tidak mengejar pengalaman terbaik, platform N-1 menawarkan tampilan yang bagus dan pengalaman yang layak. Bagi pengguna yang tidak memainkan permainan yang paling intens dan hanya memainkan permainan seperti Genshin Impact, platform N-1 sudah cukup. Untuk fotografi, jika mereka tidak membutuhkan zoom 20x di konser dan puas dengan zoom 10x, seri X standar dapat memenuhi kebutuhan mereka.

Oleh karena itu, pengguna dengan daya beli kuat dan keinginan untuk mendapatkan pengalaman terbaik akan naik, tetapi kami akan tetap menawarkan produk pada titik harga yang sesuai dengan pengalaman yang baik untuk memenuhi kebutuhan pengguna.

Sumber dari jika

Penafian: Informasi yang diuraikan di atas disediakan oleh ifanr.com, independen dari Chovm.com. Chovm.com tidak membuat pernyataan dan jaminan mengenai kualitas dan keandalan penjual dan produk. Chovm.com secara tegas melepaskan tanggung jawab apa pun atas pelanggaran yang berkaitan dengan hak cipta konten.

Tinggalkan Komentar

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai *

Gulir ke Atas