[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Fw: sort & locale



Hi!

>С удивлением обнаружил, что sort из стандартного GNU textutils 1.22
>написан без учета locale, и похоже, что никто и не думает это исправлять.


Дело в том, что если пользоваться стандартными функциями
сортировки libc (которые используют locale), то получается разница
в скорости примерно в 6 (!!!) раз. Тот же sort из BSD сделан
"по-хакерски" и пользуется внутренностями структур runtime
libc для категории COLLATE.

Опять же, есть некая неопределенность POSIX : sort потребляет
stdin, который есть просто поток байтов. Каких байтов ? В какой
кодировке ? ISO ? KOI ? А если это UNICODE в UTF-8 или вообще
в UCS-2 ? Можно, конечно, пользоваться LANG= .

>И еще. Ниужели никого не смущает следующая locale, которая кочует из
>дистрибутива в дистрибутив?
>Кому "жаловаться"? Разработчикам glibc 2? Откуда вообще взялась
>эта "грамотная" локаль?


Жаловаться надо To: Ulrich Drepper <drepper@cygnus.com>
автору glibc. А он в свою очередь берет ее из материалов WG15
ftp://dkuug.dk/i18n/WG15-collection/   Данную коллецию ведет
Keld Simonsen <keld@dkuug.dk> .

Ошибочная locale появилась в glibc из RedHat 5.x .


--
-=AV=-