Мануал по написанию грабберов!

15.32K
.
как вырезат ногу сайта (там счетчики навигация и счетчик онлайна);
.
Толи Ангел Ада, толи Бес в Раю
я решил грабить сайт,а там кодировка windows-1251,а на джоне вить ЮТФ-8...Выходит что в грабе вместо текста иерографы...как такой сайт сграбить в его же кодировке?
.
Think different
emaks, //Получаешь страницу сайта
$content = iconv('windows-1251', 'utf-8', $content); //Конвертируем в ютф 8
.
Менделеев
emaks, <meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

поставь в грабе
.
Think different
fanatos (12.12.2012 / 22:47)
emaks, <meta http-equiv="Content-Type" content="text/html; charset=windows-1251" />

поставь в грабе
.
Толи Ангел Ада, толи Бес в Раю
Folour (12.12.2012 / 22:53)
а вот и нифига...
.
Think different
emaks (12.12.2012 / 22:57)
а вот и нифига...
ОМГ, что нифига? Вставить мета тег что-бы поменять кодировку?
А знаешь ли ты что он вставляется между <head></head> и что при наличии его у тебя весь сайт в карякулях будет
.
Think different
Kazzone-1x-net, Бедный твой хостинг
.
Как вырезать ненужное никак не пойму. Вот граблю сайт к примеру http://tegos.mobi/video/

Вот что сканер выдал

<html> <head><title>3 title></head> <body bgcolor= <center><h1>30 h1></center> <hr><center>ng center> </body> </html>

как теперь вырезать информацию в шапке страницы и в ногах вырезать топ. обьясните кто нибудь
.
$file = preg_replace("/<div
class=(.*?)>/si","",$file);
Вот таким способом пытаюсь вырезать див,но он не вырезается. Почему? В чем тут проблема?
Всего: 586