Category: Unicode

08
Июн
2020

Java. После парсинга ссылки с помощью JSOUP на выводе получаю html с Unicode. Как исправить?

Java. После парсинга ссылки с помощью JSOUP на выводе получаю html с Unicode. Как исправить? Нашел на стаке код для подобной операции, но он лишь частично переводит в нормальные символы. Как перевести (декодировать) символы, чтобы стало по…

03
Июн
2020

Тюркский алфавит в аргументе file_get_contents

Есть сайт на азербайджанском языке, есть на нём скрипт subcat.php который должен получить содержимое файла Güləş.txt.

$sbct = ‘Güləş.txt’;

В htaccess, в скрипте и в текстовом файле стоит UTF-8 без BOM. Вот такие способы ничего не дают:…

28
Апр
2020

Проблема с алфавитной сортировкой строк в Android и буквой Ё

Задача: есть список имён – нужно разбить на группы по первой букве: А, Б, В, Г, Д, Е, Ё, Ж, …

Я попробовал String.compareTo и java.text.Collator но не нашел работающего варианта (чтобы сортировал строго по порядку букв в русском алфавит…

21
Апр
2020

Алфавит языка программирования Java и Unicode

Мне кажется, что этот вопрос скорее из плоскости философии, но всё равно было бы неплохо разобраться. Итак, начну немного издалека, чтобы была понятна суть. Абсолютно любой язык программирования, в том числе и упомянутый в заголовке Java, …

18
Апр
2020

Кодировка по умолчанию для компилятора языка Java (Javac)

Столкнулся с одним интересным вопросом. Вводил одного своего товарища в азы программирования и столкнулся с определённой коллизией. Всегда был уверен в том, что стандартный компилятор языка Java (Javac), который поставляется в составе мног…

29
Мар
2020

Как получить русский текст из utf-8?

Скорее всего я пропускаю что-то очевидное, пробовал разные варианты декодирования. Суть в том, что есть php код, который выводит результат выполнения python скрипта, который возвращает русский текст в utf-8, вот код:

PHP:

Код питон скрип…

10
Мар
2020

Ошибка telebot.anihelper.ApiException

Есть бот для телеграмма, который парсит стену с группы ВК и отправляет её в телеграм канал.

При попытке запустить, стену он парсит успешно, но отправить в канал — не может.

⁠⁠Traceback (most recent call last):
File “main.py”, line 208, i…

22
Июн
2019

Исчерпывающее руководство по Юникоду и кодировке символов в Python

Как работает кодировка символов, что такое Юникод и UTF-8. Рассмотрим способы кодирования и декодирования в Python и как избежать связанных с этим ошибок.
— Читать дальше «Исчерпывающее руководство по Юникоду и кодировке символов в Python»

23
Авг
2017

Как с помощью PHP отредактировать файл у которого кодировка в Unicode?

Есть xml файлик с кодировкой Unicode, который был загружен методом POST. Как в нем можно что-то поменять и сохранить для дальнейшего пользование?
simplexml_load_file() говорит, что Unicode не поддерживается. Пришлось раскодировать самому.

15
Мар
2016

Вывод кириллицы в xlwt Python 3.x

Я просто хотел подсветить колонки с id… простите за качество кода

st = xlwt.easyxf(‘pattern: pattern solid;’)
st.pattern.pattern_fore_colour = 3

with xlrd.open_workbook(filename) as book:

wBook = xlwt.Workbook(encoding=”utf-8″) # …

15
Мар
2016

Вывод кириллицы в xlwt Python 3.x

Я просто хотел подсветить колонки с id… простите за качество кода

st = xlwt.easyxf(‘pattern: pattern solid;’)
st.pattern.pattern_fore_colour = 3

with xlrd.open_workbook(filename) as book:

wBook = xlwt.Workbook(encoding=”utf-8″) # …