АРМАДА
Индексация и ранжирование автопереводного контента
На страницу Пред.  1, 2
Новая тема Написать ответ
Ср Июн 08, 2016 4:07 pm Start Post: Индексация и ранжирование автопереводного контента 

ashiko
V.I.P.
Зарегистрирован: 02.08.2010
Сообщений: 4127
Обратиться по нику
# Добавлено:Чт Июл 21, 2016 2:44 pmОтветить с цитатой
Цитата:
автоматический транслейт иногда такие перлы выдает :mrrgreen:


Неудивительно, особенно если учесть, что много языковых пар переводятся машиной (в частности, Гуглом) не напрямую, а через язык-посредник. Подобие "глухого телефона" получается Smile

Ализандр
V.I.P.
Зарегистрирован: 06.04.2010
Сообщений: 4647
Обратиться по нику
# Добавлено:Пт Июл 22, 2016 1:03 pmОтветить с цитатой
Цитата:
А молдавский до 1989 года вообще кириллицей писался, единственный из романских языков.


А вон, кстати, выше Nea Cool'a и Deragru ярко отожгли - и тебе по-румынски, и по-молдавски, и на латинице, и на кириллице сбацали Smile :thup: . Приходилось бывать в Молдавии, знакомо Smile .

Кстати, Nea, я смотрю, ты у нас на форуме на многих языках шарашишь Smile . Переводчица или полиглотка? Wink

azsx
Свой
Зарегистрирован: 06.06.2009
Сообщений: 65
Обратиться по нику
# Добавлено:Вс Июл 24, 2016 3:09 pmОтветить с цитатой
есть запрос, например moscow. Есть 1 миллион страниц, которые имеют хороший показатель по ПФ по просмотрам. Например, собрали кеи, спарсили хрефером. Выделяем на страницах текстовую часть, сокращаем теги, разбиваем текст по пассажам. Чем больше в вашем переводе будет совпадений на пассажах, тем меньше вам надо редактировать переведенный текст. Логично, что лучше заранее переводить абзацами на несколько переводчиков и сверять каждый вариант на лучшие совпадения с идеалом. Наверное, для борьбы с фильтрами лучше проблемный текст ваще не размещать. Всё можно автоматизировать, профит.

Graf
V.I.P.
Зарегистрирован: 14.07.2014
Сообщений: 2004
Обратиться по нику
# Добавлено:Пн Июл 25, 2016 9:29 amОтветить с цитатой
azsx, интересный способ. :thup: Никогда про такой не слышал.

Nea Cool'a
Опытный
Зарегистрирован: 14.09.2015
Сообщений: 134
Обратиться по нику
# Добавлено:Ср Июл 27, 2016 7:58 pmОтветить с цитатой
Цитата:
Переводчица или полиглотка? Wink


La historia calla... История умалчивает, в смысле Smile .

Цитата:
разбиваем текст по пассажам


+1, классный способ! :thup: И да, при работе с пассажами надо учитывать вот такую штуку, к примеру:

Сегодня с утра шёл дождь. Солнце не светило - тут два пассажа.

Сегодня с утра шёл дождь.Солнце не светило - а вот тут пассаж всего один.

azsx
Свой
Зарегистрирован: 06.06.2009
Сообщений: 65
Обратиться по нику
# Добавлено:Чт Июл 28, 2016 2:57 amОтветить с цитатой
Nea Cool'a никогда о таком не слышал, нельзя ли источник - определение пассаж?
В моем понимании пассаж - это неделимая часть предложения. Типа
Сегодня с утра
шёл дождь
Солнце не светило
зы
а ваш вариант - это перевод текста предложениями, логично что тексты будут синематически правильными на входе, не?

Coooler
V.I.P.
Зарегистрирован: 21.06.2010
Сообщений: 4368
Обратиться по нику
# Добавлено:Чт Июл 28, 2016 9:21 amОтветить с цитатой
Цитата:
И да, при работе с пассажами надо учитывать вот такую штуку, к примеру


И в чём же эта самая штука? Одинаковые же твои примеры.

azsx
Свой
Зарегистрирован: 06.06.2009
Сообщений: 65
Обратиться по нику
# Добавлено:Чт Июл 28, 2016 11:08 amОтветить с цитатой
Coooler обратите, пожалуйста, внимание. Точка не обязательно рвет пассаж, например "и т.д", а также другие сокращения. Ну это как я понимаю.

niramus +
Опытный
Зарегистрирован: 05.12.2009
Сообщений: 477
Contest (Сумма: 1)
Обратиться по нику
# Добавлено:Чт Июл 28, 2016 7:12 pmОтветить с цитатой
Nea Cool'a писал(а):
Цитата:
Переводчица или полиглотка? Wink


La historia calla... История умалчивает, в смысле Smile .

Цитата:
разбиваем текст по пассажам


+1, классный способ! :thup: И да, при работе с пассажами надо учитывать вот такую штуку, к примеру:

Сегодня с утра шёл дождь. Солнце не светило - тут два пассажа.

Сегодня с утра шёл дождь.Солнце не светило - а вот тут пассаж всего один.



Означает ли это что ИИПС никогда не будет умнее человека, если ИИПС не отличает существительное от глагола прошедшего рода - ?

И разве ИИПС может быть настолько неумной, чтобы проглатывать точки?

Тогда будущие дорвеи будут строиться по принципу изобретения новых слов, которые постепенно будут вживляться в "живой" форум. А за тем уже ИИПС будет подстраиваться под них.

Doc
V.I.P.
Зарегистрирован: 31.03.2010
Сообщений: 4909
Обратиться по нику
# Добавлено:Пт Июл 29, 2016 3:22 pmОтветить с цитатой
Цитата:
не отличает существительное от глагола прошедшего рода


Не знаю насчет частей речи, но сейчас для Гугла слово в единственном и множественном числе может расцениваться как 2 разных ключевика

Irbis
V.I.P.
Зарегистрирован: 11.03.2010
Сообщений: 3641
Обратиться по нику
# Добавлено:Пт Авг 19, 2016 1:50 pmОтветить с цитатой
Понимающие язык машины были бы очень полезны. Но на данном этапе мы не знаем, как их построить.

Skyworker
V.I.P.
Зарегистрирован: 25.12.2013
Сообщений: 11415
Обратиться по нику
# Добавлено:Сб Авг 20, 2016 3:08 amОтветить с цитатой
Coooler писал(а):
Цитата:
И да, при работе с пассажами надо учитывать вот такую штуку, к примеру


И в чём же эта самая штука? Одинаковые же твои примеры.

Разница все-таки есть. В одном тексте пробел между предложениями есть, а в другом нет. Вопрос знатокам: синонимизация текстов даёт какой-то эффект, если она производится без потери смысла?
Надежный и отзывчивый VPS хостинг для серьезных проектов -|||- Проверенная годами пуш партнерка с выплатой по запросу

ceber
V.I.P.
Зарегистрирован: 13.05.2010
Сообщений: 4290
Обратиться по нику
# Добавлено:Пн Авг 22, 2016 9:35 amОтветить с цитатой
Цитата:
Вопрос знатокам: синонимизация текстов даёт какой-то эффект, если она производится без потери смысла?


Думаю, да. Сравните:

Шла Саша по шоссе и сосала сушку.
Прогуливалась Саша по дороге и облизывала рогалик.

Graf
V.I.P.
Зарегистрирован: 14.07.2014
Сообщений: 2004
Обратиться по нику
# Добавлено:Пт Мар 17, 2017 1:30 pmОтветить с цитатой
Google Translate недавно подключил русский язык к переводу с глубинным обучением (нейронные сети). Так что, качество переводов должно еще больше возрасти.
Новая тема Написать ответ    ГЛАВНАЯ ~ ПОИСКОВЫЕ СИСТЕМЫ

Перейти:  





Генеральный спонсор



Партнеры