Парсер данных

621
.
Здравствуйте, как можно вытащить отсюда ссылку на .mp4 файл? (Ниже, под плеером есть ссылка, но её никак не могу запарсить.)
Спасибо
.
ncux,
$s = '<a href="/get/play/1lukv6kow12xv.0.4278037390.2185543202.1420321631.mp4"><span>1.59 GB</span></a>';
preg_match('~href="(/get/play/[\w\.]+)"~', $s, $matches);
var_dump($matches);


array(2) {
  [0] =>
  string(69) "href="/get/play/1lukv6kow12xv.0.4278037390.2185543202.1420321631.mp4""
  [1] =>
  string(62) "/get/play/1lukv6kow12xv.0.4278037390.2185543202.1420321631.mp4"
}
.
Спасибо
.
ncux
Пытаюсь спарсить размер файла вот так:
<?php
$text = 'http://fs.to/video/films/ix5hlyiznji8fWdyk0gFTa-sudya.html';
preg_match('/<span class="material-size">.+<\/span>/',$text,$size);
var_dump($size);
?>


В результате получаю:
<?php
array(0) { }
?>


В чём ошибка? Спасибо
.
ValekS
Ей 25
ncux, а подмаска где?
(.*?)
.
ValekS, Дело не в этом.
Если сделать по другому:
<?php
$text = '<span class="material-size">4.44 GB</span>';
preg_match('/<span class="material-size">.+<\/span>/',$text,$size);
var_dump($size);
?>

Или
<?php
$text = '<span class="material-size">4.44 GB</span>';
preg_match('/<span class="material-size">(.*?)<\/span>/',$text,$size);
var_dump($size);
?>

То результат один:
<?php
array(2) { [0]=> string(42) "4.44 GB" [1]=> string(7) "4.44 GB" }
?>


Но вот таким-же образом спарсить не получается. По разному пробовал.
.
ты урл страницы указываешь, а не строку
.
ncux
Да, когда редактировал - не заметил.
Вот полный код:
<?php
$text = file_get_contents('http://fs.to/video/films/ix5hlyiznji8fWdyk0gFTa-sudya.html'); // Берем одной строкой HTML-шаблон сайта;
preg_match('/<span class="material-size">.+<\/span>/',$text,$size); //Регулярное выражение, для поиска <span class="material-size">4.44 GB</span>;
var_dump($size); //Результат в массиве;
?>


Возвращает такой результат:
<?php
array(0) { }
?>
.
ValekS
Ей 25
ncux, я понял в чём прикол. Там на странице нет списка файлов. Они потом как то подгружаются при нажатии на кнопку. Потому и не находит.
Вот что потом подгружает аджакс: ТыК
.
ncux
ValekS, Но они же есть в исходном коде HTML. (Если смотреть исходник - то там есть отдельная разметка)
Хорошо, а как можно сделать по другому? Я видел приложение для Android с парсингом того же сайта, и там как-то вытащили ссылку.
Всего: 30