Выдрать Содержимое html Страниц? > ТЕХНИЧЕСКИЕ ВОПРОСЫ

Выдрать Содержимое html Страниц?

Новая тема	Написать ответ	ГЛАВНАЯ ~ ТЕХНИЧЕСКИЕ ВОПРОСЫ

tvsm22
Профессионал

Зарегистрирован: 03.03.2008
Сообщений: 556

Обратиться по нику

# Добавлено:Пн Сен 24, 2012 4:16 pm

Добавить в избранное

Ответить с цитатой

Нужно вытащить содержимое html страниц, которое находится между двумя строками:

текст


Выдрать и сохранить результат как отдельные html. Тобишь берем страницу html, убираем все лишнее, оставляя только между этими строками, сохраняем страницу.

Кто подскажет, чем это лучше сделать? Всего около 500 страниц. Далее планирую экспортировать это дело в Joomla при помощи zebroid'а

sabirovsk.ru - Игровое оборудование для детских садов

DK +
wordpress

Зарегистрирован: 18.06.2008
Сообщений: 2425

Обратиться по нику

# Добавлено:Пн Сен 24, 2012 4:45 pm

Ответить с цитатой

парсером

sydoow
V.I.P.

Зарегистрирован: 29.06.2007
Сообщений: 8213

Обратиться по нику

# Добавлено:Пн Сен 24, 2012 11:13 pm

Ответить с цитатой

Если немного через попу, то я бы сделал так:
1) выкачал все страницы какой нибудь качалкой;
2) выдрал нужное содержимое текстпайпом.

Yabuti
V.I.P.

Зарегистрирован: 28.11.2008
Сообщений: 16263

Обратиться по нику

# Добавлено:Вт Сен 25, 2012 9:11 am

Ответить с цитатой

Два метода:
1) php-функция:

Код:

function get_content($t) {
$t = "_целевой_урл_";
$html = file_get_contents($t);
$html = charset_x_win($html);
$start_table = '';
$end_table = '';
$start = strpos($html, $start_table);
$end = strpos($html, $end_table);
return substr($html, $start, $end - $start);
}

2) В Datacol создать новый парсер, указав границы  и .

Вообще практически любым парсером можно это сделать - ContentDownloader и т.д.
Drinks or Beer

Ксен ВПС и выделенные серверы от PQCService.net с бесплатным администрированием в 7 локациях, icq: 87244588
--

DrKronos
SEO-доктор

Зарегистрирован: 11.03.2008
Сообщений: 13024

Обратиться по нику

# Добавлено:Вт Сен 25, 2012 10:18 am

Ответить с цитатой

http://habrahabr.ru/post/115710/

Здесь могла быть ваша реклама

FreeDomain
Свой

Зарегистрирован: 20.01.2010
Сообщений: 2

Обратиться по нику

# Добавлено:Сб Окт 27, 2012 11:05 pm

Ответить с цитатой

Зенка справится . Даже бесплатная демо-версия. Настроить - 20-30 минут.

Новая тема

Написать ответ

ГЛАВНАЯ ~ ТЕХНИЧЕСКИЕ ВОПРОСЫ

Перейти:

Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете голосовать в опросах

Генеральный спонсор

Партнеры

	Любое использование материалов, размещенных на ArmadaBoard.com, без разрешения владельцев ArmadaBoard.com запрещено.