07
Май
2021

Python: Необходимость парсить 500 последних гос.контрактов по условиям с сайта zakupki.gov.ru

Нужно парсить 500 последних гос.контрактов по условиям с сайта zakupki.gov.ru. Например: Если условия (необходимый текст в htlm разметке страницы) подходят, то выдается список некоторых этих условий в эксель по столбцам. Итого: нажимаю shift+f10 (pycharm), мне выдаются новые (последние 500) контрактов, соответствующие моим условиям в виде таблицы. Ноооолик в пайтон, но посмотрел пару уроков, и "кое-что" понял. Проблема при заборе информации с сайта бьютифулсоупом. Дело в том, что на гос.услугах, к примеру, один из нужных мне параметров (Место нахождения) находится в одинаковом классе с другими блоками на сайте. И как именно проверить его на соответствие условиям я не могу додуматься... Также не могу понять как прописать перебор последних 500 контрактов, которые бы и проверялись на нужные мне условия. Подскажите, пожалуйста. Снизу пример html кода с сайта. В нём видно, что классы (к которым, по идее, можно привязаться и забрать из них информацию) называются одинаково, что и затрудняет процесс парсинга.

<section class="blockInfo__section section">
    <span class="section__title">Организация, осуществляющая размещение</span>  <!-- -->
    <span class="section__info">
        ГОСУДАРСТВЕННОЕ КАЗЕННОЕ УЧРЕЖДЕНИЕ ГОРОДА МОСКВЫ &#034;ДИРЕКЦИЯ ЗАКАЗЧИКА ЖИЛИЩНО-КОММУНАЛЬНОГО ХОЗЯЙСТВА И БЛАГОУСТРОЙСТВА ЦЕНТРАЛЬНОГО АДМИНИСТРАТИВНОГО ОКРУГА&#034;
    </span>
</section>
<section class="blockInfo__section section">
    <span class="section__title">Почтовый адрес</span>
    <span class="section__info">Российская Федерация, 105066, Москва, УЛИЦА БАСМАННАЯ НОВ., ДОМ 37/СТРОЕНИЕ 1</span>
</section>
<section class="blockInfo__section section">
    <span class="section__title">Место нахождения</span>
    <span class="section__info">
        Российская Федерация, 105066, Москва, УЛИЦА БАСМАННАЯ НОВ., ДОМ 37/СТРОЕНИЕ 1
    </span>
</section>


<section class="blockInfo__section section">
    <span class="section__title">Ответственное должностное лицо</span>
    <span class="section__info">
        Герасимов А. С.<br/>
    </span>
</section>
<section class="blockInfo__section section">
    <span class="section__title">Адрес электронной почты</span>
    <span class="section__info">
        [email protected]
    </span>

Источник: https://ru.stackoverflow.com/questions/1279425/python-%D0%9D%D0%B5%D0%BE%D0%B1%D1%85%D0%BE%D0%B4%D0%B8%D0%BC%D0%BE%D1%81%D1%82%D1%8C-%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D1%82%D1%8C-500-%D0%BF%D0%BE%D1%81%D0%BB%D0%B5%D0%B4%D0%BD%D0%B8%D1%85-%D0%B3%D0%BE%D1%81-%D0%BA%D0%BE%D0%BD%D1%82%D1%80%D0%B0%D0%BA%D1%82%D0%BE%D0%B2-%D0%BF%D0%BE-%D1%83%D1%81%D0%BB%D0%BE%D0%B2%D0%B8%D1%8F%D0%BC-%D1%81-%D1%81%D0%B0%D0%B9%D1%82%D0%B0-z

Тебе может это понравится...

Добавить комментарий