Мануал по написанию грабберов!

15.33K
.
~XeOn~, Da, я уже сделал так, пасиб

Осталось скрины придумать как..
.
Вот нашёл пример, чё надо вырезал, но не хочет вглубь никак заходить. Чё не писал, в разных вариантах, хз..
$url='http://site.ru/download/'; 
$curl = curl_init(); 
curl_setopt($curl, CURLOPT_URL, $url);   
curl_setopt($curl, CURLOPT_USERAGENT, 'Opera/9.80 (Windows NT 5.1; U; ru) Presto/2.2.15 Version/10.10');
curl_setopt($curl, CURLOPT_RETURNTRANSFER,1);  
curl_setopt($curl, CURLOPT_TIMEOUT, 30);  
$file = curl_exec($curl);  
curl_close($curl); 
$file=preg_replace('/<!DOCTYPE htm(.*?)рация<\/a><\/div>/si','',$file);
$file=preg_replace('/<div class=\"fmenu\"(.*?)<\/body><\/html>/si','',$file); 
$file=preg_replace('/<div class=\"gmenu\">Все файлы(.*?)имое файлов.<\/div>/si','',$file);
echo $file;
.
Вот такой интересный вопрос:
Мы берём код погоды в сервисе.
Ставим его где нибудь чтоб кто за этим следит попадал на страницу и успокоился шо всё ок.
Сами пишем граб на страницу.
Вот вопрос:
Можно ли как то заменить ссылки/убрать, если там ява код ?
.
<?php
define('_IN_JOHNCMS', 1);
$headmod ="";
$textl = '';
require_once ("/incfiles/
core.php"); 
require_once ("/incfiles/
head.php");
header("Content-type:text/html;
charset=utf-8");
$file = file_get_contents("http://sms.kengu.ru".$_SERVER
['QUERY_STRING']);
$file=preg_replace('/<?xml(.*?)<card id=\"card5509\" title=\"Бесплатные SMS\">/si','',$file);
$file=preg_replace('/<a href=\"http:\/\/kengu.ru\/communic_idx.php\">В центр общения<a>(.*?)<\/html>/si','',
$file);
$file = str_replace('KENGU.RU',
'PM-RAP.TK', $file);
require_once ("/incfiles/
end.php");
?>
Найдите ошибки плз
.
pm-boy (17.06.2012/07:08)
<?php
define('_IN_JOHNCMS', 1);
$headmod ="";
$textl = '';
require_once ("/incfiles/
core.php"); 
require_once ("/incfiles/
head.php");
header("Content-type:text/html;
charset=utf-8");
должно быть так. [php]$file = file_get_contents("http://sms.kengu.ru/?".$_SERVER ['QUERY_STRING']);
.
Как грабить заголовки сервера?
.
(\/)____o_O____(\/)
M@Sik, через курл можно включить показ заголовков
.
Koenig, как то так?
// Инициализируем курл
$ch = curl_init ('Тут пишем необходимый URL');
// Задаем параметры
для курла
$headers = array ('Content-type: text/
html; charset=utf-8');
curl_setopt ($ch, CURLOPT_HEADER, 0);
curl_setopt ($ch, CURLOPT_RETURNTRANSFER, 1);
curl_setopt ($ch, CURLOPT_HTTPHEADER,$headers);
// Получаем html
$result = curl_exec
($ch);
// закрываем курл
curl_close ($ch);
.
(\/)____o_O____(\/)
M@Sik, curl_setopt ($ch, CURLOPT_HEADER, 0); тут ставим значение 1 и получаем заголовки сервера
.
Koenig, спасибо!
Всего: 586