На страницу Пред. 1, 2, 3 След. |
|
Пт Янв 11, 2008 12:51 pm |
Start Post: Синонимизация |
Kerk Профессионал |
Зарегистрирован: 30.09.2007
Сообщений: 550
|
Обратиться по нику
|
Kerk |
Ответить с цитатой | | |
|
Я сейчас бьюсь над синонимайзером. Зачем такие штуки нужны - совершенно очевидно, но вот какое качество результата для него достаточно? Есессно, живого рерайтера практически невозможно заменить, но хотеть приблизиться к нему можно.. так вот.. какое качество автоматического рерайта будет удовлетворительным?
И вообще какого рода рерайт "любит" гугл?
Хотелось бы конкретнее сформулировать себе конечную цель, иначе это синонимайзер можно до пенсии писать
Работа сейчас идет в двух направлениях:
1. Замена слов на синонимы (не по словарю синонимов, а по смыслу)
2. Перестановка местами однородных членов предложения |
|
|
|
|
|
|
db Опытный |
Зарегистрирован: 04.12.2006
Сообщений: 210
|
Обратиться по нику
|
db |
Ответить с цитатой | | |
|
Вацлав писал(а): |
Некоторые маленькие хитрости я опустил, но не из вредного желания сохранить секреты (мои новые генераторы построены на крайне сложных алгоритмах с привлечением и нейросетей и основ ИИ)
|
|
|
|
|
|
|
|
Kerk Профессионал |
Зарегистрирован: 30.09.2007
Сообщений: 550
|
Обратиться по нику
|
Kerk |
Ответить с цитатой | | |
|
db, в этой фразе содержится офигенно полезная информация
В любом случае, речь о другом сейчас, не о генерации текста, а о рерайтинге. |
|
|
|
|
|
|
vitvirtual виртуальный |
Зарегистрирован: 11.06.2007
Сообщений: 9061
|
Обратиться по нику
|
vitvirtual |
Ответить с цитатой | | |
|
качественной "для людей" синонимизации сложно добиться, как вариант, можно вручную после автоматической синонимизации текст редактировать, времени намного меньше нужно, чем для ручного рерайта, а для доров и ботов в принципе любая подойдет |
|
|
|
|
|
www.King-Servers.com - Dedicated Servers от 65$, VDS от 25$ |
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
db писал(а): |
Вацлав писал(а): |
Некоторые маленькие хитрости я опустил, но не из вредного желания сохранить секреты (мои новые генераторы построены на крайне сложных алгоритмах с привлечением и нейросетей и основ ИИ)
|
|
Ах это... Ну да прозачный намёк . Я тоже так умею намекать. Kerk, тебе оказаказывается нейросети нужны были намёк понятен? |
|
|
|
|
|
|
db Опытный |
Зарегистрирован: 04.12.2006
Сообщений: 210
|
Обратиться по нику
|
db |
Ответить с цитатой | | |
|
информация как раз полезная .... нейронка это вещь ))) правда, я про генерацию, а вы про рерайт |
|
|
|
|
|
|
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
db писал(а): |
информация как раз полезная .... нейронка это вещь ))) правда, я про генерацию, а вы про рерайт
|
Ты всё в тему говоришь не прибедняйся. Сам по себе рерайтинг никого бы не интересовал если бы можно было генерить читаемый подогнанный по смыслу "текст для людей". Рерайтинг - только замена такому генератору имхо. Ну или хотябы как плоскогубцы и гвоздодёр - разные инструменты, которые могут исполнять одну функцию одинаково хорошо[offtop](ну или я гвоздодёром пользоваться не умею что у меня плоскогубцами так же получается).[/offtop] |
|
|
|
|
|
|
Kerk Профессионал |
Зарегистрирован: 30.09.2007
Сообщений: 550
|
Обратиться по нику
|
Kerk |
Ответить с цитатой | | |
|
"Нейронка" без конкретики - это просто красивое слово
Мне бы все-таки хотелось бы обсудить не КАК делать, а ЧТО делать. Каких изменений достаточно для того, чтобы гугл считал отрерайченную статью уникальной. |
|
|
|
|
|
Я — лучший программист, хочу поработать |
Вацлав Сетевой Гугляка |
Зарегистрирован: 21.02.2006
Сообщений: 4965
|
Обратиться по нику
|
Вацлав |
Ответить с цитатой | | |
|
Дорогие коллеги, я бы с удовольствием дал более подробные описания методики работы правильного синонимайзера, но к сожалению не имею на это права. |
|
|
|
|
|
Второе пришествие Вацлава. Камингсуново. |
Kerk Профессионал |
Зарегистрирован: 30.09.2007
Сообщений: 550
|
Обратиться по нику
|
Kerk |
Ответить с цитатой | | |
|
Вацлав, я не спрашиваю об алгоритмах. Представь, что даешь рекомендации человеку-рерайтеру. Зря я о софте заговорил, мне хочется поговорить о рерайтинге самом по себе. |
|
|
|
|
|
Я — лучший программист, хочу поработать |
Вацлав Сетевой Гугляка |
Зарегистрирован: 21.02.2006
Сообщений: 4965
|
Обратиться по нику
|
Вацлав |
Ответить с цитатой | | |
|
Понимаешь, тут дело в том, что идея лежит на поверхности. Абсолютно на виду. И стоит ее облечь в словесную форму "рекомендаций", как любой мало-мальски умный человек поймет и алгоритм А я весьма высокого мнения об интеллекте аудитории Армады. |
|
|
|
|
|
Второе пришествие Вацлава. Камингсуново. |
vitvirtual виртуальный |
Зарегистрирован: 11.06.2007
Сообщений: 9061
|
Обратиться по нику
|
vitvirtual |
Ответить с цитатой | | |
|
кстати мне кажется, что синонимайзинг английского проще настроить, чем русского - я пробовал один не особо продвинутый синонимайзар, встроенный в sql базу для парсера статей - английские предложения более правильно строятся, чем русские, при одном и том же проценте синонимайзинга - но я не разработчик а юзер, в тонкостях не особо разбираюсь |
|
|
|
|
|
www.King-Servers.com - Dedicated Servers от 65$, VDS от 25$ |
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
Вацлав, а нам не надо этого ничего. У нас щас два конкретных не разрешенных вопроса. А именно:
Kerk писал(а): |
Работа сейчас идет в двух направлениях:
1. Замена слов на синонимы (не по словарю синонимов, а по смыслу)
2. Перестановка местами однородных членов предложения
|
Имеет ли смысл?
и ещё
Kerk писал(а): |
сначала хотелось бы выяснить какой рерайт удовлетворит гугл. Считает ли он предложения "He will buy a book for me" и "He will buy me a book" разными? Как вообще дубли выявляются?
|
ваше мнение?
ммм и к Kerk вопрос. Ща перечитал то что процитировал и
"Замена слов на синонимы (не по словарю синонимов, а по смыслу)" как ты прокоментируешь данное в скобках? |
|
|
|
|
|
|
Kerk Профессионал |
Зарегистрирован: 30.09.2007
Сообщений: 550
|
Обратиться по нику
|
Kerk |
Ответить с цитатой | | |
|
Cabal писал(а): |
"Замена слов на синонимы (не по словарю синонимов, а по смыслу)" как ты прокоментируешь данное в скобках?
|
Ну "по смыслу" - эт очень громко сказано, конечно
Если вкратце, то словарь синонимов у меня используется в связке с статистическими данными, результат довольно разумный получается. |
|
|
|
|
|
Я — лучший программист, хочу поработать |
Taburetkin Гуру |
Зарегистрирован: 25.02.2007
Сообщений: 1426
|
Обратиться по нику
|
Taburetkin |
Ответить с цитатой | | |
|
Я уже писал много раз - простая синономизация НЕ делает контент уникальным. Это уже обсуждалось-переобсуждалось много раз. Уже отвечалось-переотвечалось столько же.
Конкретный вопрос к представителям Гугла год назад:
вопрос: Я представитель партнерки и даю аффилиатам тексты. Поэтому мой сайт уходит вниз из за "дублированного" контента. Что делать?
ответ: разбавьте ваш текст дополнительным уникальным текстом где-то 1/3 и будет вам уникальный текст.
Есть такой способ. Автоматом берется:
rss для текста из разных источников, yahoo pipes, видео из многочисленных видео сервисов, картинки от flikr, какие-то статьи из article директорий, куски объявлений из Craig List например, что-то из ebay, куски из answers, wiki, dictionary и проч.
Все перемешивается:
текст
видео
текст
картинка
объявление
ebay
проч
Фантазия откуда что брать ваша |
|
|
|
|
|
|
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
Taburetkin, собственно я помню. Отсюда и идея заменять например существительные их определениемиями из толкового словаря. Получается что каждое предложение разбавляется несколькими словами, а не тупо что-то чем-то заменяется. Как тебе идейка? |
|
|
|
|
|
|
|