На страницу Пред. 1, 2, 3 След. |
|
|
![]() inferno[DGT] Свой |
Зарегистрирован: 22.07.2007
Сообщ.: 70
|
Обратиться по нику
|
|
Пост, конечно, хорош. Но не нужно принимать его за ТЗ. ОГРОМНОЕ кол-во нюансов опущено. С партнером примерно месяцев 6-7 назад решили создать подобную систему генерации. Было перерыто огромное кол-во материала, пробовали, делали. Добились неплохих результатов(еще ни один дор не забанен). Но все равно в системе постоянно что-то меняется, улучшается и оптимизируется. По прочтению сего поста появилось как минимум 2 новые идеи по улучшению генератора.
Content is King. Вацлав, принимай респекты  |
|
|
|
|
|
Выделенные сервера в Европе и США. Самые правильные цены, самое трепетное отношение к клиентам |
![]() ABC Свой |
Зарегистрирован: 17.10.2007
Сообщ.: 3
|
Обратиться по нику
|
|
| Сколько будет стоить денег заказать такой генератор текстов у программиста? |
|
|
|
|
|
|
![]() inferno[DGT] Свой |
Зарегистрирован: 22.07.2007
Сообщ.: 70
|
Обратиться по нику
|
|
Тут не в деньгах дело
Программисту нужно знать, что писать. Нужны четкие алгоритмы генерации. |
|
|
|
|
|
Выделенные сервера в Европе и США. Самые правильные цены, самое трепетное отношение к клиентам |
![]() Sirgey Свой |
Зарегистрирован: 06.05.2007
Сообщ.: 109
|
Обратиться по нику
|
|
По моему нормальный алгоритм, а вы все ругаете потому - что не хотите подать виду.
Вацлав - респект!
Главный вопрос тут - набивка баз и конструкций. Автоматом это сделать нельзя, так как в инглише, как и в русском есть слова которые меняют смысл и часть речи. В результате если автоматом забивать - будут ошибки, если вручную - то долго и будет палиться по общему шаблону предложения.
Имхо, ссылки рулят, а для генерации доров и марков подойдёт.
To inferno[DGT]: хочешь скажу почему не забанено? потому - что по гестам не срали, в топ не вылазили и траф не шёл. Проспамь по гестам/форумам, выйди в топ и получи траф. Забанят. |
|
|
|
|
|
Мой блог о SEO, водке, фотках и другой ерунде, а тут конвертим мусор Bucks loads |
![]() FOX Свой |
Зарегистрирован: 11.03.2007
Сообщ.: 49
|
Обратиться по нику
|
|
| На серджинсе уже двое предоставляют сервис по размножению русскоязычных статей... там из 1 статьи при самом минимальном участии человека делается 1К статей сохраняющих смысл и логичискцую структуру оригинальной, тоесть получаются тексты для людей и поисковики их видят как разные и не клеют. Генерит довольно прилично судя по демкам и отзывам тех кто пользовался. Для английских текстов таких сервисов пока нет к сожалению, я вот лично лучше платил бы за такое размножение стаей чем за пиаристые ссылки. |
|
|
|
|
|
|
![]() Hello_Kitty hellokitty.armadaboard.com |
Зарегистрирован: 30.04.2007
Сообщ.: 7070
|
Обратиться по нику
|
|
| FOX, дай в личку контакты этих субъектов с серчэнджинса. или топик тот в личку напиши. |
|
|
|
|
|
Русский Биллинг - начни свой SMS-бизнес с нами!
Блог Hello Kitty - Кота Специального Назначения. |
![]() BrokenBrake Бомжевед |
Зарегистрирован: 15.02.2007
Сообщ.: 2220
|
Обратиться по нику
|
|
| Насколько я знаю, эти люди размножают статьи полуручным методом. Там не генератор текстов, просто автоматизация некоторых рутинных задач по синонимизации. |
|
|
|
|
|
Действительно одной кнопкой! Отзывы. |
![]() FOX Свой |
Зарегистрирован: 11.03.2007
Сообщ.: 49
|
Обратиться по нику
|
|
| Да там насколько я понял с описания на сайте есть часть ручной работы, но учитывая какими масштабами можно ворочать то это просто пыль на сапогах... замутить такое бы под инглыш.. ух |
|
|
|
|
|
|
![]() Dark Elf Опытный |
Зарегистрирован: 23.12.2007
Сообщ.: 286
|
Обратиться по нику
|
|
Можно прочитать на aot.ru как это на самом деле выглядит с научной точки зрения и даже скачать софт для экспериментов. Это что касается семантики.
Мы делали немножко другой генератор, именно ГЕНЕРАТОР текстов, основанный на алгоритме "Элиза" почти 50-летней давности. А именно на фокусе внимания. Смысл в том, что читая фразу в тексте человек в качестве локального контекста воспринимает только несколько предыдущих фраз и общий контекст. То есть по мере его продвижения по тексту, его фокус внимания скользит вперед. Соответственно, программа, генерирующая текст, должна использовать тот же принцип. Используя систему джокеров, можно генерировать текст вполне релевантный глобальному контексту, хотя и не несущий никакой практической ценности, но вполне связный и читаемый. Более того, использовав модель цифровой ДНК, можно создать популяцию полиморфных зверушек, совершенствующих алгоритм (вернее около 100 его параметров, выступающих в роли генов) для генерации текстов, наиболее удовлетворяющих пожеланиям СЕ. Ограниченно-публичное тестирование алгоритма БОБОТ-666 должно было начаться в середине декабря, даже на паре форумов были набраны тестеры, был сделан официальный сайт (bobot.net.ru), но по некоторым причинам отложено. Результаты жизнедеятельности самой ранней версии лежат здесь dolphin-cafe.narod.ru Это мысли о заработке в Инете  |
|
|
|
|
|
Бабло здесь!|Хостинг в US от $2.99 (5G/250G) здесь|Блог про адалт-блоги здесь|Блогдира здесь |
![]() Cabal Профессионал |
Зарегистрирован: 20.10.2007
Сообщ.: 685
|
Обратиться по нику
|
|
| Dark Elf, весьма кошерно. На человека правда непохоже но это вроде бы даже можно читать. |
|
|
|
|
|
|
![]() db Свой |
Зарегистрирован: 04.12.2006
Сообщ.: 195
|
Обратиться по нику
|
|
Вацлав
Порадовал однако, только слегка поздновато.... я месяц голову ломал как ТЗ програмеру поставить, в итоге поулчился более разширенный вариант... Прогер идею подхватил, в тему въехал, обещал еще нейронку под это дело обучить... бум надеятся получится толковое...  |
|
|
|
|
|
|
![]() Kerk Опытный |
Зарегистрирован: 30.09.2007
Сообщ.: 363
|
Обратиться по нику
|
|
| Я распарсил словарь английской морфологии с aot.ru в базу FireBird (вся информация о слове вытаскивается одним SQL-запросом). Подумываю выложить для скачивания, но сомневаюсь, ибо FireBird не особо популярен у веб-мастеров, а в MySQL я не буду переводить из принципа. |
|
|
|
|
|
Я — лучший программист, icq 269102
 |
![]() db Свой |
Зарегистрирован: 04.12.2006
Сообщ.: 195
|
Обратиться по нику
|
|
| выкладывай в FB, приймем как родненькую ) |
|
|
|
|
|
|
![]() Rabbit Кролики - это не только ценный мех |
Зарегистрирован: 01.08.2005
Сообщ.: 18651
|
Обратиться по нику
|
|
|
Гость, деньги тут
!
GlavMed - новый конкурс по низкочастотникам!
RenGoDating - $2 за анкету серфера, супер конвертация. |
![]() alexf2000 Свой |
Зарегистрирован: 28.10.2005
Сообщ.: 48
|
Обратиться по нику
|
|
Описанный алгоритм будет делать текст, который ничем не отличается от простейшего синонимайзера (http://awt.win32utils.com/synonyms/), текст из него будет вылезать абсолютно нечитаемый. А чтобы он был действительно грамматически верным, надо решить одну небольшую задачку о которой скромно умолчали - определять к какой части речи относится слово в контексте предложения. Один небезизвестный производитель п/о для машинного перевода эту задачку решает уже лет 15, но особых прорывов в качестве машинногоперевода что-то пока не заметно.
Разница с синонимайзером у этого алгоритма только в том, как распределяется работа - для этой реализации нужно сначала набрать базы шаблонов фраз, сами базы слов и потом можно быстро генерить много бреда. А для синонимайзера нужен просто любой текст который потом перекраивается синонимами, базы которых есть в готовом виде. То есть чтобы получить средненький результат, нужно затратить усилия которые лучше пустить в мирных целях - на расстановку ссылок на текст полученный из цепей Маркова.  |
|
|
|
|
|
Самый интересный SEO-блог: http://alexf.name/ |
|
|