|
|
![]() Li-Hua Чинамэн |
Зарегистрирован: 25.12.2005
Сообщений: 11544
|
Обратиться по нику
|
Li-Hua |
Ответить с цитатой | | |
|
Каким софтом(кроме самописного скрипта) можно обработать текстовый файл в формате:
рандомный_текст-домен
рандомный_текст-домен
рандомный_текст-домен
рандомный_текст-домен
Из которого мне нужно удалить все домены(строки полностью) которые например .ru
А также все строки в которых встречается упоминание определенных букв, например ft.com, удаляется строка microsoft.com |
|
|
|
|
|
|
![]() creator123 Гуру |
Зарегистрирован: 25.07.2007
Сообщений: 1145
|
Обратиться по нику
|
creator123 |
Ответить с цитатой | | |
|
либо скрипт на bash в пару строк. либо на php в 5 строк.
Дольше искать софт, чем писать скрипт.
зачем искать проблемы там где их нет. |
|
|
|
|
|
<----- если понравился пост, жмакай сюды <----- |
![]() creator123 Гуру |
Зарегистрирован: 25.07.2007
Сообщений: 1145
|
Обратиться по нику
|
creator123 |
Ответить с цитатой | | |
|
точнее даже не так: на любом любимом языке это пишется за 10 минут |
|
|
|
|
|
<----- если понравился пост, жмакай сюды <----- |
![]() Li-Hua Чинамэн |
Зарегистрирован: 25.12.2005
Сообщений: 11544
|
Обратиться по нику
|
Li-Hua |
Ответить с цитатой | | |
|
Цитата: |
точнее даже не так: на любом любимом языке это пишется за 10 минут
|
ясно, просто нет у меня любимого языка, программингом не владею совсем. мне проще софтину качнуть и обработать файлы. |
|
|
|
|
|
|
![]() lizendir Свой |
Зарегистрирован: 07.07.2006
Сообщений: 65
|
Обратиться по нику
|
lizendir |
Ответить с цитатой | | |
|
Знать язык очень даже полезно. На python это выглядело бы, примерно, так:
Код: |
import sys
BLACK_LIST = ['foo', 'bar', 'st.com']
lines = [x.split() for x in file(sys.argv[1]) if x.split()]
for line in lines:
tld = line.rstrip('.', 1)[-1]
if tld == 'ru':
continue
for item in BLACK_LIST:
if item in line:
continue
print line
|
|
|
|
|
|
|
Парсинг сайтов, сбор и обработка данных |
![]() Li-Hua Чинамэн |
Зарегистрирован: 25.12.2005
Сообщений: 11544
|
Обратиться по нику
|
|
|
|
![]() Venator Опытный |
Зарегистрирован: 23.12.2006
Сообщений: 437
|
Обратиться по нику
|
|
|
НЕТ налогу на недвижимость! |
![]() lizendir Свой |
Зарегистрирован: 07.07.2006
Сообщений: 65
|
Обратиться по нику
|
|
|
Парсинг сайтов, сбор и обработка данных |
![]() pepper Опытный |
Зарегистрирован: 10.04.2008
Сообщений: 184
|
Обратиться по нику
|
|
|
|
![]() lizendir Свой |
Зарегистрирован: 07.07.2006
Сообщений: 65
|
Обратиться по нику
|
lizendir |
Ответить с цитатой | | |
|
> Вроде 2.6.2 посвежее будет
В mainstream пока 2.5 юзают. В 2.6 программы могут работать не так, как ожидалось раньше, т.к. он задумывался как переходная версия между 2.5 и 3.0 |
|
|
|
|
|
Парсинг сайтов, сбор и обработка данных |
![]() pepper Опытный |
Зарегистрирован: 10.04.2008
Сообщений: 184
|
Обратиться по нику
|
pepper |
Ответить с цитатой | | |
|
Тоже сначала сидел на 2.5, но прочитал what's new лист и не нашел критичных для моих скриптов изменений. Рано или поздно надо будет и к 3 привыкать.
По теме: TextPipe должен помочь |
|
|
|
|
|
|
|