Главная » Новости » Новая статья о переводе Xiaohongshu: энциклопедия мемов
Официальное уведомление от Сяохуншу.

Новая статья о переводе Xiaohongshu: энциклопедия мемов

После долгих ожиданий функция перевода Xiaohongshu наконец-то появилась в третьи выходные января 2025 года! Вот несколько советов и вещей, которые нужно знать👇🏻:

– Обновите Xiaohongshu (Red Note) до последней версии.

– Попробуйте изменить языковые настройки, включая настройки Xiaohongshu и телефонной системы.

– В настоящее время поддерживается только одноязычный перевод; смешанные языки или эмодзи не будут его активировать.

– Если приложение все еще не работает, некоторые пользователи предлагают трюк «kill-it»: опубликуйте комментарий на английском языке, выйдите из приложения, а затем снова откройте Xiaohongshu, чтобы активировать функцию перевода.

Разработчики Xiaohongshu невероятно быстры, пользователи говорят, что никогда не видели таких быстрых обновлений. Это легендарная «китайская скорость»?

Официальное обновление Xiaohongshu
Скриншоты в этой статье предоставлены пользователями Xiaohongshu, имена пользователей показаны на изображениях.

Все в мире в восторге, за исключением программ-переводчиков lol. Несмотря на то, что запуск состоялся всего через неделю, перевод работает отлично, делая трансграничный просмотр легким. Китайский интернет-сленг, такой как «u1s1», «yyds» и «cpdd», точно понимается и аннотируется.

  • u1s1 – Честно говоря
  • yyds – Навсегда лучший, Бессмертный
  • cpdd – Поиск пары, Ищу пару

Наша коллега призналась, что не знает, что означает «cpdd» — доказательство того, что люди не подходят для GPT. Xiaohongshu, вы создаете инструмент для перевода или энциклопедию мемов? Дополнительным бонусом является то, что китайские диалекты также переводятся.

Даже если в исходном тексте есть ошибки, это не повлияет на перевод. Сяохуншу вдумчиво их комментирует.

Изюминка с наложением текста

Сяохуншу, ты действительно думаешь о том, чтобы преподавать мне языки, я тронут. 

Очевидно, что новая функция перевода на Xiaohongshu поддерживается большая языковая модель, и пользователи горят желанием протестировать модель, лежащую в ее основе. Например, они начинают с простого перевода, затем пишут несколько строк стихов.

Персонаж Покемон с наложенным текстом.

Некоторые даже набирают строку азбуки Морзе, чтобы программа ее перевела — это «Сяохуншу», а не шпионский триллер!

Перевод азбуки Морзе с наложением текста.

Односторонне заявляем: Xiaohongshu на сегодняшний день является самой мощной многофункциональной программой для перевода.

Выполнение задач перевода с использованием большой языковой модели уже достаточно эффективно, но на такой насыщенной контентом социальной платформе, как Xiaohongshu, все еще существует множество проблем.

Разнообразие языка является наиболее сложным. Некоторые культурно-специфические термины, идиоматические выражения или метафоры, такие как идиомы и сленг, трудно перевести точно.

Существуют также имена и прозвища, которые модель может не очень хорошо различать, поскольку они требуют перевода, а некоторые следует оставить без изменений.

Например, «orange man» было напрямую переведено как «橙人», но на самом деле это относится к Трампу.

GIF-изображение ошибки перевода с наложенным текстом.

Помимо точности, обычные пользователи могут не осознавать, какие вычислительные ресурсы требуются для перевода.

На платформе с таким богатым контентом, как Xiaohongshu, пользователи могут публиковать всего несколько писем или заметок длиной в несколько сотен слов. Для сравнения, перевод более длинного контента потребляет больше ресурсов и увеличивает нагрузку на систему.

Кроме того, поскольку пользователи находятся в разных странах, а часовые пояса сильно разбросаны, система редко испытывает низкую загрузку.

Когда обе стороны бодрствуют, кратковременное совпадение часовых поясов может привести к внезапному всплеску запросов на перевод, требуя от системы обработки большого количества одновременных запросов за короткое время, что является серьезной проверкой ее возможностей параллельной обработки.

Сяохуншу слишком крутой

Пока нет точной информации о том, какую модель использует новая функция перевода. По «допросу» некоторых пользователей, похоже, это GPT. Некоторые пользователи «допросили» и обнаружили, что это Zhipu.

GIF-изображение модели GPT-4 с наложенным текстом.

Учитывая вопрос стоимости, трудно сказать наверняка. GPT имеет большое количество параметров и высокие вычислительные затраты, что делает его непригодным для развертывания в средах с ограниченными ресурсами.

Более приемлемым вариантом может быть выбор модели ученика и использование GPT в качестве модели учителя для дистилляции. Модели учеников обычно имеют меньше параметров и более высокую скорость вывода, при этом пытаясь сохранить возможности модели учителя.

В то же время этот подход может оказаться более перспективным для Сяохуншу.

Xiaohongshu давно изучает технологии ИИ, такие как большие языковые модели и многомодальные системы, но всегда фокусируется на оптимизации алгоритмов. Ранее они разработали несколько небольших функций ИИ.

Мало кто знает, что на конференции AAAI 2024 года команда поисковых алгоритмов Сяохуншу предложила новую идею дистилляции моделей.

Команда поисковых алгоритмов Xiaohongshu на конференции AAAI 2024 года.

Команда поискового алгоритма Xiaohongshu представила инновационную структуру, которая полностью использует отрицательные знания образца во время вычленения возможностей вывода большой модели.

«Отрицательные образцы» — интересная концепция. Традиционная дистилляция обычно фокусируется только на положительных образцах, что понятно: учителя обучают студентов правильному способу решения задач, гарантируя, что они поймут и будут подражать.

Однако во время учебы в школе вы, вероятно, также вели «книгу ошибок», записывая ошибки и моменты, в которых ваше понимание было слабым. Эти ошибки — «отрицательные образцы».. В разделе комментариев Сяохуншу неточные переводы являются отрицательными примерами.

Так же, как «ошибки» содержат важную информацию, отрицательные образцы могут помочь моделям учащихся выявлять неверные прогнозы, повышать их способность к различению, улучшать обработку сложных образцов и поддерживать последовательность в сложных языковых выражениях.

Например, если вы хотите обсудить финансовые термины с друзьями из других стран в разделе комментариев, слово «bank» может часто встречаться. У него также есть другие значения: «riverbank», и его также можно использовать в качестве глагола.

Благодаря обучению на основе отрицательной выборки модель обучается распознавать многозначные выражения, корректировать логику перевода и генерировать более естественный контент.

Преимущество отрицательных образцов также распространяется на поддержку менее распространенных языков. Важно отметить, что это касается не только американских пользователей; к ним присоединяются пользователи со всего мира: Сербии, Перу и некоторых коренных регионов Австралии.

GIF-анимация, на которой изображены пользователи со всего мира, взаимодействующие с Xiaohongshu.

Используя отрицательные образцы (включая распространенные модели ошибок перевода), модели учащихся могут выявлять и избегать частых ошибок, расширяя возможности перевода для языков с низким уровнем ресурсов.

Структура, предложенная командой Xiaohongshu это инновационное применение дистилляции, изначально нацеленный на извлечение сложных возможностей рассуждения из больших языковых моделей и перенос их в специализированные малые модели. В то время не было ясно, какие конкретные задачи можно было бы выполнить, и перевод, похоже, не был в центре внимания.

Возможно, никто не знал, что эта структура год спустя поможет Сяохуншу стать мостом для международного общения.

Как говорится в пословице: шанс всегда улыбается подготовленным.

Источник из ифанр

Отказ от ответственности: информация, изложенная выше, предоставлена ​​ifanr.com независимо от Chovm.com. Chovm.com не делает никаких заявлений и не дает никаких гарантий относительно качества и надежности продавца и продукции. Chovm.com категорически отказывается от какой-либо ответственности за нарушения авторских прав на контент.

Оставьте комментарий

Ваш электронный адрес не будет опубликован. Обязательные поля помечены * *

Наверх