На страницу Пред. 1, 2, 3, 4 След. |
|
Вт Мар 16, 2010 7:40 pm |
Start Post: Парсер для буржуйнета |
Tupac-G Свой |
Зарегистрирован: 13.03.2010
Сообщений: 61
|
Обратиться по нику
|
Tupac-G |
Ответить с цитатой | | |
|
Кто какой бы парсер именно для google посоветовал? А то я ищу и почти все для Яндекса... Спасибо зарание. |
|
|
|
|
|
|
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
У меня нет. Я бы выложил. Это ж не я аффтар. А аффтара я на форуме уже очень давно не видел. Сам расстроен, я от туда регулярку хотел дёрнуть но думал как нибудь когда время будет качну по новой и тогда... Короче удалил тогда и всё теперь, превед |
|
|
|
|
|
Cabal - патентованный зануда. |
StrukOff + + + Опытный |
Зарегистрирован: 25.12.2009
Сообщений: 128
|
Обратиться по нику
|
|
|
Выгодно продать или купить мобильный адалт трафик можно на Mpay69.biz |
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
Подумал тут. Как то не хорошо я выгляжу в этом топике, посылая ТС качать то чего нет, да и humanbot тоже вроде огочён ... Так что я отложил дела и дописал старую версию адвордс-парсера от pepper до функционала последней каким его помню(может чего и забыл). Качаем:
gap1.5 Cabal Edition
Короче опять можно выбирать адальт/не адальт и опять есть статистика по ключевикам.
Замечания и предложения можно озвучивать в этом топике. Никакой поддержки по аське/мылу нет. |
|
Последний раз редактировалось: Cabal (Пт Мар 19, 2010 3:34 pm), всего редактировалось 4 раз(а) |
|
|
|
|
Cabal - патентованный зануда. |
Tupac-G Свой |
Зарегистрирован: 13.03.2010
Сообщений: 61
|
Обратиться по нику
|
|
|
|
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
Осенило как исправить проблему описанную мной в примечании ReadMe.txt. Вчера тормознуло то, что аффтар всё написал именно так как написал а я хотел только дополнить а не исправлять чужой код и такое очевидное решение просто мне не постучалось хотя я смотрел на код в упор.
Теперь при штатном завершении парсинга options.ini удаляется без вашего участия и исключение которое выскакивало если вы забыли его удалить и начали парсить новые слова больше не будет вас тревожить. Скачать поправленный скрипт можно по ссылке в прошлом посте. Ссылка заменена, если качали вчера перекачайте. |
|
|
|
|
|
Cabal - патентованный зануда. |
humanbot Профессионал |
Зарегистрирован: 05.03.2009
Сообщений: 535
|
Обратиться по нику
|
humanbot |
Ответить с цитатой | | |
|
Cabal еще раз спасибо за парсер (плюсанул скока мог ) .
И про список стоимости кликов, в этом сервисе есть стоимость клика.
Но данный столбец подключается выпадающем меню, а это скорее проблема (я не прогер, мне не понять )
А результат подключенного столбца с ценами выглядит:
Но все равно, огромное тебе человеческое спасибо. Данный парсер мега рульная софтина. |
|
|
|
|
|
|
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
|
Последний раз редактировалось: Cabal (Сб Мар 20, 2010 12:43 am), всего редактировалось 1 раз |
|
|
|
|
Cabal - патентованный зануда. |
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
Забыл предупредить. Это совершенно виртуальный параметр и если честно хз зачем он тебе нужен. Цена за клик почти наверняка будет другой если ты только не покупатель . Но хозяин барин. |
|
|
|
|
|
Cabal - патентованный зануда. |
IseeDeadPeople Объединенная Электрическая |
Зарегистрирован: 06.12.2005
Сообщений: 21800
|
Обратиться по нику
|
IseeDeadPeople |
Ответить с цитатой | | |
|
у меня есть Агресс Парсер (бесплатный)
+ конфиг файлы, отлаженные для гугля мной (там самому можно любую СЕ подключать, в макросах конфиг файлов просто разобраться)
+ может работать и без проксей.. и через них.
Цитата: |
А я запустил его но выдало ошибку типо " неможет найти c:\php\php.exe " Незнаю что за ...
|
а это конечно жесть.
попробуй php.net чтоли:
http://www.php.net/downloads.php
или в Яндексе/Гугле "скачать php под windows"~
________
|
|
|
|
|
|
sex |
Dark Elf + V.I.P. |
Зарегистрирован: 23.12.2007
Сообщений: 1545
|
Обратиться по нику
|
Dark Elf + |
Ответить с цитатой | | |
|
seobook.com и греби кеи лопатой бесплатно и без геморроя прямо в CSV, можно даже тренды по кеям посмотреть (т.е. как изменялся спрос на данные кеи в течении какого-то времени). |
|
|
|
|
|
Мой старый блог про адалт-блоги
Тёмные — это те, кто хочет свободы и независимости, не стремятся к власти, не навязывают своих глупых желаний окружающим. |
StrukOff + + + Опытный |
Зарегистрирован: 25.12.2009
Сообщений: 128
|
Обратиться по нику
|
StrukOff + + + |
Ответить с цитатой | | |
|
adamant, скрипт парсера просто чудесный, спасибо!
А как можно сделать так чтобы когда гугл просит ввести капчу чтоб он автоматом брал прокси из списка и продолжал? Было бы очень здорово тогда |
|
|
|
|
|
Выгодно продать или купить мобильный адалт трафик можно на Mpay69.biz |
IseeDeadPeople Объединенная Электрическая |
Зарегистрирован: 06.12.2005
Сообщений: 21800
|
Обратиться по нику
|
|
|
sex |
Cabal Гуру |
Зарегистрирован: 20.10.2007
Сообщений: 1360
|
Обратиться по нику
|
Cabal |
Ответить с цитатой | | |
|
StrukOff писал(а): |
adamant, скрипт парсера просто чудесный, спасибо!
А как можно сделать так чтобы когда гугл просит ввести капчу чтоб он автоматом брал прокси из списка и продолжал? Было бы очень здорово тогда
|
Раз я тут всёравно дописываю чужие скрипты... Моя версия вот такая будет:
[offtop]
<?php
set_time_limit(0);
$n = 100; // количество серчей в выдаче
$timeout = 10;//тайм-аут между запросами к Г
$keywords = file('keywords.txt') or die('keywords.txt is empty!'); // файл с ключами
$proxy_list = file('proxy.txt') or die('proxy.txt is empty!'); //файл спроксями
function get($url,$proxy) {
$ch = curl_init();
curl_setopt($ch, CURLOPT_URL,$url);
curl_setopt($ch, CURLOPT_RETURNTRANSFER,1);
curl_setopt($ch, CURLOPT_USERAGENT, 'Mozilla/5.0 (Windows; U; Windows NT 5.1; ru; rv:1.9.0.1) Gecko/2008070208');
curl_setopt($ch, CURLOPT_TIMEOUT, 15);
if($proxy!=false){
curl_setopt($ch, CURLOPT_PROXY, "$proxy");
}
$ss=curl_exec($ch);
curl_close($ch);
return $ss;
}
function googlelinkparse($keyword,$n) {
global $proxy_list;
$proxy = false;
$keyword = str_replace(' ','+',$keyword);
$url = 'http://www.google.ru/search?q='.$keyword.'&num=1000&fil
ter=0&start='.$n.'0';
while(1){
$file = get($url, $proxy);
if (strstr($file, 'Google</title>')){
#print "ОК!\r\n";
break;
}else{
$proxy = trim(array_pop($proxy_list)) or die('proxy is empty!');
}
}
$exp = "<a\s[^>]*href=(\"??)([^\" >]*?)\\1[^>]*>(.*)<\/a>";
if (preg_match_all("/$exp/siU", $file, $matches, PREG_SET_ORDER)) {
$c = count($matches);
for ($i=0; $i<$c; $i++) {
if (strstr($matches[$i][2],'http://') && !strstr($matches[$i][2],'google') && !strstr($matches[$i][2],'search?q=cache') && !strstr($matches[$i][2],'youtube') && !strstr($matches[$i][2],'/aclk?sa')) {
$links[] = $matches[$i][2];
}
}
}
return $links;
}
for ($ll=0; $ll<count($keywords);$ll++){
$keyword = trim($keywords[$ll]);
for ($i=0; $i<$n; $i++) {
$link = googlelinkparse($keyword,$i);
$c = count($link);
if($i<($n-1)){$rn="\r\n";}else{$rn='';}
error_log(implode("\r\n",$link).$rn,3,'links.txt');
sleep($timeout);
}
}
?>
[/offtop] |
|
Последний раз редактировалось: Cabal (Чт Мар 25, 2010 2:08 pm), всего редактировалось 7 раз(а) |
|
|
|
|
Cabal - патентованный зануда. |
zeoman V.I.P. |
Зарегистрирован: 19.03.2008
Сообщений: 3708
|
Обратиться по нику
|
|
|
|
StrukOff + + + Опытный |
Зарегистрирован: 25.12.2009
Сообщений: 128
|
Обратиться по нику
|
StrukOff + + + |
Ответить с цитатой | | |
|
Cabal, спасибо большущее
Ток выдает такую вот фигню:
Код: |
Parse error: syntax error, unexpected T_VARIABLE in Z:\home\parser\www\par.php on line 7
|
|
|
|
|
|
|
Выгодно продать или купить мобильный адалт трафик можно на Mpay69.biz |
|