Мануал по написанию грабберов!

15.34K
.
Venser, Так вот его и граблю =) Заменял.. Не получается.. И так и так блин..
.
И так , у меня проблема . Вот сделал первую станицу граба http://fonaz.ru/news/нужно подсказать как ограбить вторую страницу! грабим http://www.euro-football.ru
Кусок граба <?php
header("Content-type:text/html; charset=utf-8");
if (!$_GET['tdir'])
{ $tdir = "";
} else {
$tdir = $_GET['tdir'];
} if ($_GET['tdirp'])
{ $tdir = $_GET['tdirp'];
} $file = file("http://www.euro-football.ru/".$tdir);
$file = @implode("", $file);
$file = iconv("windows-1251", "UTF-8", $file);
$file=preg_replace('/<html>
(.*?)class="mmenu">/si','',$file);
.
Кто поможет обойти регистрацию в грабе спайса?
граб работал вроде,я дурак возьми и поставь в него другой ник и пароль и хз че вышло! Поменял обратно ноль!
Че посоветуете? Вот пример работы http://maxmobi.org.ru/maxagruz ... 1.php
.
Народ, вот строчка:

$file=preg_replace('/<?xml(.*?)<div class=\"mainmenu\">/si','',$file);

Зачем здесь si? Что он делает?
.
Z3RO (28.06.2010/13:10)
Народ, вот строчка:
$file=preg_replace('/<?xml(.*?)<div class=\"mainmenu\">/si','',$file);
Зачем здесь si? Что он делает?
Так надо, не убирай его
Если честно то хз, наверна что-то типа i (модификатор)
.
Z3RO, это модификаторы регулярных выражений.
i - регистронезависимость,
s - при поиске совпадений не учитываются пробелы, табуляции, разрывы строки и т.п.
.
А как зделать, чтобы скрипт подавлял любую ссылку?
.
Ау. Кароч мне нужно, чтобы все ссылки с другого сайта(который я граблю) ставали просто текстом.
.
Вырезай сам адрес сылки
.
Тут такая ситуация: ссылки добавляются по 10 раз в день, а мне надо, чтобы все ссылки были текстом.
Всего: 586