Вот таблица кодировки utf8
http://www.sci.kz/~sairan/kazcode/Table15.htm .
В моём случае
каким-то образом при экспорте базы данных MySQL
получилась кодировка, отличающаяся от ожидаемой utf8
для большинства букв (за исключением нескольких).
Например,
слово "сигнатуры" оказалось закодировано кодами :
D1 5F D0 B8 D0 5F D0 5F D0 B0 D1 27 D1 5F D1 5F D1 3C
.
Отсюда следует, что, в противоречии с кодировкой utf8,
"г" и "н" (строчные) получили одинаковый код Hex D0 5F ,
"р" и "с" и "у" (строчные) получили одинаковый код Hex D1 5F ,
буква "т" (строчная) получила код Hex D1 27 .
Правильный код сохранили
буква "а" (строчная) - Hex D0 B0 ,
буква "и" (строчная) - Hex D0 B8 ,
а также
буква "к" (строчная) - Hex D0 BА ,
буква "Т" (заглавная) - Hex D0 A2 .
На кодах, где встречается байт 27 ,
импорт затыкается с ошибкой #1064.
Что могло произойти в качестве причины путаницы ?
Можно ли предпринять что-то
для восстановления кодировки в правильную ?