Beranda » Berita Terkini » Fitur Terjemahan Baru Xiaohongshu: Ensiklopedia Meme
Pemberitahuan resmi dari Xiaohongshu.

Fitur Terjemahan Baru Xiaohongshu: Ensiklopedia Meme

Setelah banyak penantian, fitur terjemahan Xiaohongshu akhirnya hadir pada minggu ketiga bulan Januari 2025! Berikut beberapa tips dan hal yang perlu diketahui👇🏻:

– Perbarui Xiaohongshu (Red Note) ke versi terbaru.

– Coba ubah pengaturan bahasa Anda, termasuk pengaturan Xiaohongshu dan sistem telepon.

– Saat ini hanya mendukung terjemahan satu bahasa; bahasa campuran atau emoji tidak akan memicunya.

– Jika masih tidak berhasil, beberapa pengguna menyarankan trik “kill-it”: posting komentar dalam bahasa Inggris, keluar dari aplikasi, lalu buka kembali Xiaohongshu untuk mengaktifkan fitur terjemahan

Pengembang Xiaohongshu sangat cepat, dan pengguna mengatakan mereka belum pernah melihat pembaruan secepat ini. Apakah ini "kecepatan China" yang legendaris?

Pembaruan resmi Xiaohongshu
Tangkapan layar dalam artikel ini berasal dari pengguna Xiaohongshu, nama pengguna ditampilkan dalam gambar

Semua orang di seluruh dunia senang, kecuali perangkat lunak penerjemah lol. Meskipun baru diluncurkan seminggu, penerjemahannya berjalan dengan sangat baik, sehingga memudahkan penelusuran lintas batas. Bahasa gaul internet China seperti “u1s1,” “yyds,” dan “cpdd” dipahami dan diberi anotasi secara akurat.

  • u1s1 – Sejujurnya
  • yyds – Selamanya yang terbaik, Abadi
  • cpdd – Pencarian pasangan, Mencari pasangan

Rekan kami mengakui bahwa dia tidak tahu apa arti "cpdd"—bukti bahwa manusia tidak sebanding dengan GPT. Xiaohongshu, apakah Anda membuat alat penerjemahan atau ensiklopedia meme? Bonus tambahannya adalah dialek bahasa Mandarin juga sedang diterjemahkan.

Bahkan jika ada kesalahan dalam teks asli, hal itu tidak akan memengaruhi terjemahan. Xiaohongshu dengan cermat membuat anotasi pada kesalahan tersebut.

Kismis dengan hamparan teks

Xiaohongshu, Anda benar-benar mempertimbangkan untuk mengajar bahasa untuk saya, saya tersentuh. 

Jelas, fitur terjemahan baru di Xiaohongshu didukung oleh model bahasa besar, dan pengguna ingin menguji model di baliknya. Misalnya, mereka memulai dengan terjemahan sederhana, lalu menulis beberapa baris puisi.

Karakter Pokémon dengan hamparan teks.

Beberapa bahkan mengetik serangkaian kode Morse untuk diterjemahkan—ini Xiaohongshu, bukan film mata-mata!

Terjemahan kode morse dengan hamparan teks.

Menyatakan secara sepihak: Xiaohongshu sekarang adalah perangkat lunak penerjemahan multifungsi yang paling kuat.

Menangani tugas penerjemahan dengan model bahasa yang besar sudah cukup efektif, tetapi pada platform sosial yang kaya konten seperti Xiaohongshu, masih banyak tantangan.

Keragaman bahasa merupakan tantangan terbesar. Beberapa istilah khusus budaya, ungkapan idiomatik, atau metafora, seperti idiom dan bahasa gaul, sulit diterjemahkan secara akurat.

Ada pula nama dan nama panggilan yang mungkin tidak dapat dibedakan dengan baik oleh model tersebut antara hal yang perlu diterjemahkan dan hal yang sebaiknya tetap tidak diubah.

Misalnya, “orange man” diterjemahkan langsung menjadi “橙人,” namun sebenarnya merujuk pada Trump.

GIF kesalahan penerjemahan dengan hamparan teks.

Di luar akurasi, pengguna awam mungkin tidak menyadari sumber daya komputasi yang dibutuhkan untuk penerjemahan.

Pada platform yang kaya konten seperti Xiaohongshu, pengguna mungkin hanya mengunggah beberapa surat atau catatan sepanjang beberapa ratus kata. Sebagai perbandingan, menerjemahkan konten yang lebih panjang menghabiskan lebih banyak sumber daya dan meningkatkan beban sistem.

Selain itu, dengan pengguna dari berbagai negara, distribusi zona waktu yang luas berarti sistem jarang mengalami waktu muat yang rendah.

Saat kedua belah pihak terjaga, tumpang tindih singkat dalam zona waktu dapat menyebabkan lonjakan tiba-tiba dalam permintaan penerjemahan, yang mengharuskan sistem menangani sejumlah besar permintaan bersamaan dalam waktu singkat, yang merupakan ujian signifikan terhadap kemampuan pemrosesan bersamaan.

Xiaohongshu terlalu keren

Belum ada informasi akurat mengenai model mana yang digunakan fitur terjemahan baru tersebut. Berdasarkan "interogasi" beberapa pengguna, tampaknya itu adalah GPT. Beberapa pengguna "menginterogasi" dan menemukan bahwa itu adalah Zhipu.

GIF model GPT-4 dengan hamparan teks.

Jika mempertimbangkan masalah biaya, sulit untuk memastikannya. GPT memiliki banyak parameter dan biaya komputasi yang tinggi, sehingga tidak cocok untuk diterapkan di lingkungan dengan keterbatasan sumber daya.

Pilihan yang lebih memungkinkan adalah memilih model siswa dan menggunakan GPT sebagai model guru untuk distilasi. Model siswa biasanya memiliki lebih sedikit parameter dan kecepatan inferensi yang lebih cepat, sambil mencoba mempertahankan kemampuan model guru.

Pada saat yang sama, pendekatan ini mungkin lebih menjanjikan bagi Xiaohongshu.

Xiaohongshu telah lama mengeksplorasi teknologi AI seperti model bahasa besar dan sistem multimodal, tetapi selalu berfokus pada pengoptimalan algoritma. Sebelumnya, mereka telah mengembangkan beberapa fitur AI kecil.

Hanya sedikit orang yang tahu bahwa pada konferensi AAAI 2024, tim algoritma pencarian Xiaohongshu mengusulkan ide baru untuk penyulingan model.

Tim algoritma pencarian Xiaohongshu di konferensi AAAI 2024.

Tim algoritma pencarian Xiaohongshu memperkenalkan kerangka kerja inovatif yang sepenuhnya memanfaatkan pengetahuan sampel negatif selama penyulingan kemampuan inferensi model besar.

"Sampel negatif" adalah konsep yang menarik. Distilasi tradisional umumnya hanya berfokus pada sampel positif, yang dapat dimengerti: guru mengajarkan siswa cara yang benar untuk memecahkan masalah, memastikan mereka memahami dan menirunya.

Namun, selama bersekolah, Anda mungkin juga menyimpan “buku kesalahan”, yang mencatat kesalahan dan area di mana pemahaman Anda lemah. Kesalahan-kesalahan ini adalah “sampel negatif”Di bagian komentar Xiaohongshu, terjemahan yang tidak akurat adalah sampel negatif.

Sama seperti “kesalahan” yang mengandung informasi penting, sampel negatif dapat membantu model siswa mengidentifikasi prediksi yang salah, meningkatkan kemampuan diskriminasi mereka, meningkatkan penanganan sampel yang sulit, dan menjaga konsistensi dalam ekspresi bahasa yang kompleks.

Misalnya, jika Anda ingin membahas istilah keuangan dengan teman-teman internasional di bagian komentar, kata “bank” mungkin sering muncul. Kata ini juga memiliki arti lain: “tepi sungai”, dan dapat juga digunakan sebagai kata kerja.

Melalui pembelajaran sampel negatif, model dilatih untuk mengenali ekspresi polisemi, mengoreksi logika penerjemahan, dan menghasilkan konten yang lebih alami.

Keuntungan dari sampel negatif juga mencakup dukungan terhadap bahasa yang kurang umum. Penting untuk dicatat bahwa ini bukan hanya untuk pengguna Amerika; pengguna dari seluruh dunia juga ikut bergabung: Serbia, Peru, dan beberapa wilayah adat di Australia.

GIF yang menunjukkan beragam pengguna global berinteraksi dengan Xiaohongshu.

Dengan memanfaatkan sampel negatif (termasuk pola kesalahan penerjemahan umum), model siswa dapat mengidentifikasi dan menghindari kesalahan yang sering terjadi, sehingga meningkatkan kemampuan penerjemahan untuk bahasa dengan sumber daya rendah.

Kerangka kerja yang diusulkan oleh tim Xiaohongshu adalah aplikasi distilasi yang inovatif, awalnya ditujukan untuk mengekstraksi kemampuan penalaran kompleks dari model bahasa besar dan mentransfernya ke model kecil yang terspesialisasi. Pada saat itu, belum jelas tugas spesifik apa yang dapat diselesaikan, dan penerjemahan tampaknya bukan fokusnya.

Mungkin tidak seorang pun tahu bahwa kerangka kerja ini, setahun kemudian, akan membantu Xiaohongshu menjadi jembatan komunikasi internasional.

Seperti kata pepatah: kesempatan selalu berpihak pada mereka yang siap.

Sumber dari jika

Penafian: Informasi yang diuraikan di atas disediakan oleh ifanr.com, independen dari Chovm.com. Chovm.com tidak membuat pernyataan dan jaminan mengenai kualitas dan keandalan penjual dan produk. Chovm.com secara tegas melepaskan tanggung jawab apa pun atas pelanggaran yang berkaitan dengan hak cipta konten.

Tinggalkan Komentar

Alamat email Anda tidak akan dipublikasikan. Bidang yang harus diisi ditandai *

Gulir ke Atas