26
Апр
2013

Проблема при парсинге страницы с кириллицей

Пытаюсь сделать разбор html-страницы русскоязычного сайта. Так вот BeautifulSoup отказывается поддерживать кириллицу. Я написал это, но не помогло. Версия BeautifulSoup 3.

c=urllib2.urlopen(page)
soup=BeautifulSoup(c.read(), fromEncoding="utf-8")

Источник: https://ru.stackoverflow.com/questions/215448/%D0%9F%D1%80%D0%BE%D0%B1%D0%BB%D0%B5%D0%BC%D0%B0-%D0%BF%D1%80%D0%B8-%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3%D0%B5-%D1%81%D1%82%D1%80%D0%B0%D0%BD%D0%B8%D1%86%D1%8B-%D1%81-%D0%BA%D0%B8%D1%80%D0%B8%D0%BB%D0%BB%D0%B8%D1%86%D0%B5%D0%B9

Share

Тебе может это понравится...