31
Авг
2015

Парсить каждый блок по отдельности

Есть сайт с разметкой вида

<div class="info"><img src="forest.png" alt="" /> Тут статья о природе</div>
<div class="info"><img src="animals.png" alt="" /> О животных - статья</div>
<div class="info"><img src="other.png" alt="" /> Еще одна статья</div>

таких блоков примерно 15штук. Мне нужно спарсить каждый блок отдельно. Начиная с первого и заканчмвая последним(15-тым). Вот код с помощью которого я пытаюсь это сделать:

//Парсим
    new Thread(new Runnable() {
        public void run() {
            Document doc = null;
            try {
                doc = Jsoup.connect("http://site.ru").get();

            } catch (IOException e) {
                // TODO Auto-generated catch block
                e.printStackTrace();
            }
            name = doc.title();
            Elements my_a = doc.select("div.info");
            for (Element temp : my_a)
            my_number = temp.text();
            System.out.println("Статья: " + my_number);
        }
    }).start();

С помощью этого кода удается только парсить и вывести один блок, последний.

Источник: https://ru.stackoverflow.com/questions/446295/%D0%9F%D0%B0%D1%80%D1%81%D0%B8%D1%82%D1%8C-%D0%BA%D0%B0%D0%B6%D0%B4%D1%8B%D0%B9-%D0%B1%D0%BB%D0%BE%D0%BA-%D0%BF%D0%BE-%D0%BE%D1%82%D0%B4%D0%B5%D0%BB%D1%8C%D0%BD%D0%BE%D1%81%D1%82%D0%B8

Тебе может это понравится...

Добавить комментарий