Вс Апр 18, 2010 6:52 am |
Start Post: Существует чекалка своей ссылки на блогдирах? |
groko Свой |
Зарегистрирован: 15.08.2009
Сообщений: 51
|
Обратиться по нику
|
groko |
Ответить с цитатой | | |
|
Нужен скрипт или сервис для проверки наличия своей ссылки в блогдирах. Смсысл в том, чтобы проверив наличие своей ссылки убрать ресипы на диры, которые тебя не залистили или удалили. Поиск по форуму и гуглю вменяемых результатов не дал, в лучшем случае находятся те, которые еще могут проверить морды, а мне надо чтобы я ввел домен, а скрипт уже прошерстил все страницы в поисках моей линки. Может есть что-то со списком блогдир? А лучше, чтобы я сам туда мог вводить свой список. Я полагаю он должен работать как-то по принципу поисковых пауков. |
|
|
|
|
skylander + + Опытный |
Зарегистрирован: 29.06.2009
Сообщений: 317
|
Обратиться по нику
|
skylander + + |
Ответить с цитатой | | |
|
IseeDeadPeople писал(а): |
groko,
//..
цена 300 $, в случаи поиска линка-как-текст на меин и всем домене (глубина - весь домен).
за последний вариант, я врятли возьмуся, по причине того что,
могу невыполнить правильно итерацию всех страниц домена (какие то стр. могут ускользнуть),
в пхп нет потоков
да и чтоб в один поток проверить один линк на скажем так 25 блог-дирах,
потребуеться несколько дней работы скрипта (а это уже надо КРОН задействовать, + дополнительные работы по установке + разделение движка и веб-интерфейса, + отдельно формирование логов), ну и может 500+ Мб трафика - после нескольких таких проверок, твои ИП хостера, откуда будет чек идти, любая блогдира забанит.
//..
тем более, ТЗ я описал выше - тебе только уточнить им.
|
сервер-сайд скрипт который работает по крону бесконечно и чекает до посинения 1 домен в 1 поток.
те - что б этот скрипт запускался копией в 2-3-n задаче параллельно и чекал следующий домен.
таким образом реализуется условная многозадачность в пхп
(можно и чекать ссылки - например сохранять ссылки в кеш, а из кеша уже их чекать, опять же по крону в несколько условно говоря потоков)
насчёт нескольких дней - да, типа того, перелопатить блогдиру или любой другой гс - дело не быстрое
делать запросы через гугл - забанят ип, да и не факт что ссылка уже проиндексировалась в гугле после размещения в блогдире..
а вот блогдир/гс тебя забанит врядли - примет тебя за очередного робота который пролазивает по всем дирам и в каждую заупу засовывает нос, это нормально. |
|
|
|
|