Tagged: simple-html-dom

17
Май
2021

Прервать foreach, добавить строку и продолжить цикл

Столкнулся с интересной задачей. При парсинге пагинации с другого сайта, парсятся только ссылки, из-за чего в пагинации пропадает страница, на которой находишься, так как это не ссылка, а блочный элемент.
Нагуглил, что foreach можно прерва…

25
Мар
2021

Как получить весь текст новости [дубликат]

Заранее html разметка страницы сайта нам не известна (сайты всегда разные). Мне нужно получить весь текст новости, имея только одно предложение из этой новости (которое точно совпадает с частью текста новости).
Делаю на примере этой новост…

24
Мар
2021

Как найти родительский блок?

На странице есть текст, который обернут в заранее не известный div блок.
И у меня есть строка(часть текста) которая соответствует началу текста который на странице.
Вопрос, как определить название класса родительского элемента в который об…

03
Ноя
2020

simple_html_dom – выводит не все строки

Пытаюсь тянуть информацию с сайта с помощью simple_html_dom.
Вссе получается, но выводит только 463 строки из 8208. не могу разобравться в чем проблема.

<html>
<head>
<title>Result</title>
<style type=”text/c…

25
Окт
2020

Не работает Simple HTML DOM

Имеется код
$html = file_get_html(‘https://www.sravni.ru/bank/sberbank-rossii/novosti’);
foreach ($html->find(‘div.article-preview-text-container a’) as $e) {
$json = file_get_contents(‘https://www.sravni.ru’ . $e-&g…

10
Окт
2020

Как парсить динамические страницы PHP

Задание: Спарсить динамически подгружаемый блок на YouTube (блок лицензии под описанием с id #collapsible).
Начальный DOM страницы состоит из закодированных скриптов, поэтому PHP не видит желаемого элемента.
Лишь после полной отработки JS …

09
Окт
2020

UPD: Парсить данные с Ютуба YouTube

Задание:
Спарсить блок лицензии конкретно заданного видео на YouTube.

Для этого подключил библиотеку «Simple Html Dom Php»

<?php
require ‘simple_html_dom.php’; //подключаем библиотеку
$link = ‘https://www.youtube.com/watch?…

17
Фев
2020

как спарсить содержимое, или весь JS скрипт целиком?

у меня есть парсер через curl_get и библиотеку simple_html_dom
мне надо получить содержимое JS скрипта или весь скрипт, но когда я его получаю, такое чувство что он читает и записывает в одну строчку, в скрипте есть Коментарии и на выходе …

14
Фев
2020

Парсинг next_page на PHP

Не переходит на следующую страницу для последующего парсинга (перебрасывает на на ту же)

<?php

ini_set(‘error_reporting’, E_ALL);
ini_set(‘display_errors’, 1);
ini_set(‘display_startup_errors’, 1);

include_once(‘curl_query.php’);
inc…

12
Фев
2018

Как ускорить работу парсера?

Делаю парсер, которые должен слить более 10к товаров. При каждом выполнение скрипта проходит по 20 следующим товаром.

Для парсинга использую cURL (получаю HTML код), и Simple HTML Dom Parser (выборка нужных блоков).

Парсер построен так:…