Парсер данных

649
.
ValekS
Ей 25
ncux, я тебе кинул ссылку, на подгружаемую страничку. Её можно уменьшить до вот такой: fs.to/video/films/ix5hlyiznji8fWdyk0gFTa-sudya.html?ajax&folder=0
Короч что бы узнать размер, тебе нужно то что по ссылке выше. В каждой папки есть ИД, если его подставлять в параметр folder, то тебе будет выдавать список файлов\папок в этой папке: fs.to/video/films/ix5hlyiznji8fWdyk0gFTa-sudya.html?ajax&folder=366265 Это содержимое папки Дополнительные материалы.
Ну а дальше думай что с этим делать будешь.
.
Ей 25
# ncux (04.01.2015 / 19:14)
ValekS, Но они же есть в исходном коде HTML. (Если смотреть исходник - то там есть отдельная разметка)
Хорошо, а как можно сделать по другому? Я видел приложение для Android с парсингом того же сайт
Они там появляются после нажатия кнопки "Файлы и папки". Но когда ты с помощью пхп берешь код страницы, нажатия на кнопку нет, следовательно и списка файлов нет. По этому тебе либо надо имитировать нажатие кнопки, либо вариант выше.
.
ValekS, Это всё, в чём была трудность
Как можно сменить кодировку страницы?
И, ещё, как я понял - это список файлов в разрешении .txt
.
ValekS
Ей 25
ncux, а что там с кодировкой не то? Вот как то так: http://www.php.su/iconv
Файл .тхт список файлов тебе не нужен. Так как это тупо его сохранять, потом читать... Да там кроме ссылки на файл и нет ничего больше. А ссылку на файл проще получить через просмотр папки(ай-ди папки подставляем в параметр folder).
.
ValekS, Вот так у меня выглядит: *клац*
.
Ей 25
ncux, ты для чего пишешь парсер? Не для Джона? А то я вот на Джоне пробую и у меня всё норм.
.
ValekS, Длинный такой выходит путь
Нужно выбрать id списка файлов в .txt и подставить, как id папки. После чего получим .mkv версию.
Спасибо за помощь
.
ValekS, Можешь кинуть исходник своей работы, хотелось бы посмотреть на живой пример парсера
.
Ей 25
ncux, ид можно взять не только в ссылке Список файлов. А и в той где Оригинал, Дубляж и т.д.
.
ValekS, Так где дубляж, оригинал и т.д. - это Ajax ответ, который не спарсить.
Всего: 30