Steck
написал 10 мая 2006 года в 18:32 (584 просмотра)
Ведет себя
как мужчина; открыл 125 тем в форуме, оставил 549 комментариев на сайте.
Последние комментарии
-
fhunter, 25 апреля в 1:07 → Перекличка 11
-
Иванн, 9 апреля в 8:31 → Ассоциация РАСПО провела первое учредительное собрание 1
-
Oksana_Gusak, 13 октября в 7:31 → Как «замокать» файл для юниттеста в Python? 2
-
Kiri11.ADV1, 7 марта 2021 года в 12:01 → Логи catalina.out в TomCat 9 в формате JSON 1
-
fhunter, 26 февраля 2021 года в 20:45 → A, MX, PTR — Настройка и проверка извне. Как ? 2

Экология и вегетарианство на благо всем живым существам Планеты.
UTF-8 двубайтная кодировка…
хотя странно, что 102 а не 110…
чего куримши?
UTF-8 — многобайтная кодировка. с USC-2, (Что-то вроде UTF-16) не спутал? :)
иди читай про UTF-8.
вкратце: цифры и английские буквы кодируются одним символом.
русские — двумя символами.
японские иероглифы — тремя.
что-то может и 4мя…
жаль, нельзя продемонстрировать — форум в cp1251 и потеряет другие символы
utf не двух байтная. разные символы кодируются разным числом байт. вся кириллица, например, по два байта, а ascii символы — они по одному.
попробуй сказать так:
в koi8-r терминале.
Кодируется по кол-ву старших единичных бит в 1-ом байте. Если 0xxxxxxx, то 1 байт 0..127, 10xxxxxx xxxxxxxx — 128 до 128+16384, и так далее…
/me посмотрел на это все и ушел курить man’ы