04
Июл
2016

Как получить все ссылки со страницы регулярным выражением?

Я хочу получить все ссылки со страницы. Для этого я использую такое регулярное выражение:

pattern = r"<a href=\"(.+)\">"

Но проблема в том, что мне нужно получить только значение первой группы, а не всего значения. При попытке вытащить значение таким образом:

all_href = re.findall(pattern, res.text)

Я получаю всю строку с ненужными мне <a href....

Как получить только \1 из текста?

Источник: https://ru.stackoverflow.com/questions/541300/%D0%9A%D0%B0%D0%BA-%D0%BF%D0%BE%D0%BB%D1%83%D1%87%D0%B8%D1%82%D1%8C-%D0%B2%D1%81%D0%B5-%D1%81%D1%81%D1%8B%D0%BB%D0%BA%D0%B8-%D1%81%D0%BE-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D1%8B-%D1%80%D0%B5%D0%B3%D1%83%D0%BB%D1%8F%D1%80%D0%BD%D1%8B%D0%BC-%D0%B2%D1%8B%D1%80%D0%B0%D0%B6%D0%B5%D0%BD%D0%B8%D0%B5%D0%BC

Тебе может это понравится...

Добавить комментарий