30
Авг
2014

Непонятая кодировка при парсинге с VBulletin

Здравствуйте.

Столкнулся с проблемой, нужно спарсить ники с одного форума на VBulletin, там разрешены всякие хитрые символы в нике. Записать всё это нужно в файл.

Пробовал так:

String secondString = new String(buf.getBytes("Cp1251"),"UTF-8");

Но остаётся такая вот белиберда в файле:

 лиан,ЙОР�?Рљ,ГђreamlпїЅ?l,пїЅ?лиан,ЙОР�?Рљ,ГђreamlпїЅ?l,пїЅ?лиан,ЙОР�?Рљ,ГђreamlпїЅ?l,пїЅ?лиан,ЙОР�?Рљ,ГђreamlпїЅ?l,пїЅ?лиан,ЙОР�?Рљ,ГђreamlпїЅ?l,пїЅ?лиан,ЙОР�?Рљ,ГђreamlпїЅ?l,пїЅ?лиан,ЙОР�?Рљ,ГђreamlпїЅ?l,пїЅ?лиан,ЙОР

При смене кодировки через Notepad++ становится лучше, но всё равно остаются квадраты такие:

Кот,ЙОР�?К,Ðreaml�?l

Как решить проблему?

Источник: https://ru.stackoverflow.com/questions/357259/%D0%9D%D0%B5%D0%BF%D0%BE%D0%BD%D1%8F%D1%82%D0%B0%D1%8F-%D0%BA%D0%BE%D0%B4%D0%B8%D1%80%D0%BE%D0%B2%D0%BA%D0%B0-%D0%BF%D1%80%D0%B8-%D0%BF%D0%B0%D1%80%D1%81%D0%B8%D0%BD%D0%B3%D0%B5-%D1%81-vbulletin

Тебе может это понравится...

Добавить комментарий