[Date Prev][Date Next][Thread Prev][Thread Next][Date Index][Thread Index]

Re: NoCharset (Re: сравнение кодировок: таблица)



Eugene B. Byrganov <E.B.Byrganov@inp.nsk.su> wrote:



>>  Не, в HTML стандартах прописано, что если у
>> Content-Type: hext/html
>> нету Charset-а, то счтитается, что содержимое
>> в Latin-1 (ISO-8859-1).
>Это чистый бред (HTTP стандарт в этом вопросе). Обычный шовинизм:
>мы используем  Latin1 и наши сервера не умеют выставлять charset
>(тогда во всяком случаи), а вы как хотите, так и живите.


 Ну бред--не бред, а стандарт. Гораздно хуже, чем пытаться
_угадывать_ Charset, если он не проставлен. Charset может
оказаться самым странным : Shift-JIS, EBCDIC, ISO-2022-KR e.t.c.

>Более того, это явно противоречит другой части rfc:
>Если в заголовке не стоит charset, а теле есть
>'META HTTP-EQUIV="Content-Type"'
>с charset, то следует брать его из META, но если мы определим
>его еще на стадии разбора заголовка, то дело до META
>просто не дойдет.

 Это тонкий момент, но в стандартах все подробно разъяснено
про разбор META и приоритет заголовков HTTP и META (если
они разные). Хотя общепризнано, что META -- это паталогия,
вдобавок возможная только для text/html.

 Согласен, в Роcсии все привыкли работать раком : сначала не
проставлять Charset, а потом мужественно преодолевать трудности
и "угадывать" его. Почитайте Чернова.

http://www.w3.org/
RFC-2616
http://koi8.pp.ru/framed-koi8.html
http://koi8.pp.ru/htmlps.html

--
-=AV=-