На страницу 1, 2 След. |
|
![]() IseeDeadPeople Объединенная Электрическая |
Зарегистрирован: 06.12.2005
Сообщений: 21969
|
Обратиться по нику
|
IseeDeadPeople |
Ответить с цитатой | | |
|
насколько обязательно ставить в мета-теге... указывать кодировку..
Код: |
<meta http-equiv="Content-Type" content="text/html; ТУТ_КОДИРОВКА">
|
я лично все свои доки просто эту строку пишу как
Код: |
<meta http-equiv="Content-Type" content="text/html">
|
т.е. никакой кодировке я неуказываю!
если советуете ставить , то какую именно для англо-игогокающий лошадок... и для понников из европы/британии
ИСО/ВИНДОВС... ?
спасибо! |
|
|
|
|
|
sex |
![]() brantozawr Опытный |
Зарегистрирован: 10.11.2008
Сообщений: 126
|
Обратиться по нику
|
|
|
|
![]() blam Опытный |
Зарегистрирован: 13.03.2008
Сообщений: 240
|
Обратиться по нику
|
blam |
Ответить с цитатой | | |
|
Желательно ставить, я всегда utf-8 ставлю.
brantozawr- объясни почему iso-8859-1 ? |
|
|
|
|
|
Бложок |
![]() brantozawr Опытный |
Зарегистрирован: 10.11.2008
Сообщений: 126
|
Обратиться по нику
|
brantozawr |
Ответить с цитатой | | |
|
blam, iso-8859-1 - стандартная западно европейская кодировка. utf 8 - расширенная кодировка.
таблица сиволов кодировки iso-8859-1 приведена здесь http://book.itep.ru/10/iec8859.htm
Как видно, данная кодировка включает в себя кучу языков. Если в тексте сайта используются символы, не входящие в эту таблицу (к примеру на русском хочется что-то еще написать), то как правило, используют кодировку UTF-8.
Кодировка iso-8859-1 является подмножеством кодировки UTF-8. и если текст сайта написан просто с использованием латинских символов, то ничего страшного не будет, если указать UTF-8, а не iso-8859-1. Отобразится все правильно. |
|
|
|
|
|
|
![]() IseeDeadPeople Объединенная Электрическая |
Зарегистрирован: 06.12.2005
Сообщений: 21969
|
Обратиться по нику
|
IseeDeadPeople |
Ответить с цитатой | | |
|
blam писал(а): |
Желательно ставить, я всегда utf-8 ставлю.
brantozawr- объясни почему iso-8859-1 ?
|
спасибо, но.. обьясни почему "Желательно ставить"..
ведь мне не предположение нужно (и за него спасибо!), а точная техническая информация..
т.е. реальные случаи того что если непроставить то может тама у кого то что то неотобразиться как надо..... ? если да, то почему ?
аудитория - англицкая пони.
для них КМК ее даже нужно неставить..
а для СЕ ботов вообще - ориентируються к какому региону стр. принадлежит по контенту (т.е. по набору символов на страничке) ?
и если выводить в УТФ8 как ее правильно составить/обработать на выходе ?
если пхп скриптом вводит то весть хтмл сорц пропустить через utf8_encode() ?
а если я делаю напр сам какую то стат. хтмл страничку
то как можно быть уверенным что я ставлю в хидере что это УТФ8 а на самом деле она и не УТФ8 может быть... ? |
|
|
|
|
|
sex |
![]() brantozawr Опытный |
Зарегистрирован: 10.11.2008
Сообщений: 126
|
Обратиться по нику
|
brantozawr |
Ответить с цитатой | | |
|
IseeDeadPeople, если у тебя в текстах используются исключительно символы английского алфавита, то в абсолютном большинстве (а может и во всех.... это заявление только из собственного опыта) кодировок они имеют одни и те же коды и перекодировать ничего не надо. Буква W в обоих кодировках (iso-8859-1 и utf-8 ) имеет один и тот же код и т.д.....
Если есть символы неанглийских алфавитов (русские, специфичные символы европейских государств, азиатские и т. п.), то нужно либо указывать родную кодировку, либо сперва перекодировать в utf-8 и указывать ее.
Обязательно ли указывать кодировку для твоих страниц? Достоверно не знаю.... только на опыте... Сделай следующее: открой страницу в браузере и меняй в браузере кодировки ототбражения. перебери все кодировки. У меня во всех текст открылся нормально. Это значит, что во всех перебранных кодировках коды латинских букв имеют одинаковое значение.
Но я не исключаю, что где нибудь в далекой Зимбабве есть житель, браузер которого по умолчанию открывает страницы в неведанной нам кодировке. И он не сможет прочесть текст страницы....
IseeDeadPeople, открой секрет, к чему все это? или ты оптимизируешь размер страницы?  |
|
Последний раз редактировалось: brantozawr (Вт Dec 16, 2008 8:31 pm), всего редактировалось 1 раз |
|
|
|
|
|
![]() cupiey Свой |
Зарегистрирован: 29.08.2008
Сообщений: 95
|
Обратиться по нику
|
|
|
All ages, all races, all sexes. |
![]() IseeDeadPeople Объединенная Электрическая |
Зарегистрирован: 06.12.2005
Сообщений: 21969
|
Обратиться по нику
|
IseeDeadPeople |
Ответить с цитатой | | |
|
еще хочеться узнать..
наверно на около 80% сайтов (хтмл стр.)
в сорсе, первая строка.. до тега начало хтмл потока как <html>
стоят типа такие строчки
Код: |
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"
"http://www.w3.org/TR/html4/loose.dtd">
|
.. или такая ..
Код: |
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
|
эти строчки на что влияют ? что сообщают и кому ? в какислучаях их надо использовать, а в каких - нестоит.. ?
также для гугля если ХТМЛ док. с такими строчками ... и без них - как то другое отношение его к этим хтмл-стр. будет ?
_________
также на некоторых стр. вижу вместо обычного <html> (на первой строке) вот такую пони <html xmlns="http://www.w3.org/1999/xhtml">
что она значит ?
_________
а по теме..
Код: |
<meta http-equiv="Content-Type" content="text/html; charset=XXXXX">
|
если выдавать мета тег где XXXXX как "utf-8" или "iso-8859-1" то значит надо как нить обработать в пхп и сам вывод док ?
например если пишу как "text/html; charset=utf-8"
то весь вывод надо пропустить через php func.: utf8_encode(); Так ?
а при выводе (указания) как "text/html; charset=iso-8859-1" какой функцией пони выпремлять ?
Спасибо! |
|
|
|
|
|
sex |
![]() IseeDeadPeople Объединенная Электрическая |
Зарегистрирован: 06.12.2005
Сообщений: 21969
|
Обратиться по нику
|
IseeDeadPeople |
Ответить с цитатой | | |
|
brantozawr, спасибо.. оценил тебя отдельно..
буду рад слышать от тебя подобные разьяснения! |
|
|
|
|
|
sex |
![]() brantozawr Опытный |
Зарегистрирован: 10.11.2008
Сообщений: 126
|
Обратиться по нику
|
brantozawr |
Ответить с цитатой | | |
|
IseeDeadPeople, благодарю за оценку.
1. По DOCTYPE - честно говоря не дружу с этим и даже не хочу дружить... Это указание браузеру стандарта, по которому надо ототбражать страницу. Я верстаю страницы по старинке, с использованием стандартных html тегов и css... вобщем, чтобы без всяких указаний DOCTYPE страницыы открывалась одинаково во всех браузерах.... почитай тут http://www.i2r.ru/static/479/out_23105.shtml
2.
Цитата: |
если выдавать мета тег где XXXXX как "utf-8" или "iso-8859-1" то значит надо как нить обработать в пхп и сам вывод док ?
например если пишу как "text/html; charset=utf-8"
то весь вывод надо пропустить через php func.: utf8_encode(); Так ?
|
Да, надо... НО! еще раз замечу: если текст с использованием только латинских букв, цифр, знаков препинания, то не надо конвертить. Какие конкретно символы не надо конвертить? Еще раз даю ссылку http://book.itep.ru/10/iec8859.htm Гляди на таблицу "Таблица кодов символов ISO/IEC 8859-1". Если текст из символов до знака ~ (включительно) (это первые 127 символов), то конвертить бесполезно. Доказываю:
Код: |
<?
$test = "TEST message. 123456 & . , ?";
echo "ISO-8859-1: ".$test."\n";
echo "UTF-8: ".utf8_encode($test)."\n";
echo "UTF-8: ".iconv("ISO-8859-1", "UTF-8", $test)."\n";
?>
|
Результат:
Код: |
Content-type: text/html
X-Powered-By: PHP/4.4.0
ISO-8859-1: TEST message. 123456 & . , ?
UTF-8: TEST message. 123456 & . , ?
UTF-8: TEST message. 123456 & . , ?
|
Как видишь, результат в обеих кодировках одинаков. Т.е. первые 127 символов кодировки ISO 8859-1 один в один ковертятся в UTF-8. Поэтому незачем грузить сервак ненужными вычислениями, если заранее знаешь, что результат будет одинаков.
3.
Цитата: |
а при выводе (указания) как "text/html; charset=iso-8859-1" какой функцией пони выпремлять ?
|
utf8_decode — Converts a string with ISO-8859-1 characters encoded with UTF-8 to single-byte ISO-8859-1
P.S. русский текст функцией utf8_encode в utf-8 не сконвертишь. Только ISO-8859-1 -> UTF-8 |
|
|
|
|
|
|
![]() IseeDeadPeople Объединенная Электрическая |
Зарегистрирован: 06.12.2005
Сообщений: 21969
|
Обратиться по нику
|
IseeDeadPeople |
Ответить с цитатой | | |
|
так если невникая мне в подробности, просто скажите в двух словах
в каких случаях юзать "utf-8" а в каких "iso-8859-1", и почему ?
странички хоть и вывод через ПХП, но всяких странных символов там нет, т.е. считай на выходе обычные ХТМЛ сорцы/старнички.
спасибо!
____
потом более подробно изучу тему. |
|
|
|
|
|
sex |
![]() DrKronos SEO-доктор |
Зарегистрирован: 11.03.2008
Сообщений: 13021
|
Обратиться по нику
|
DrKronos |
Ответить с цитатой | | |
|
В Юникоде первые 256 кодовых позиций совпадают с ISO-8859-1.
Если на сайте только символы с этих позиций, то используй ISO-8859-1.
Если расширенный набор символов, то UTF-8 |
|
|
|
|
|
Здесь могла быть ваша реклама |
![]() brantozawr Опытный |
Зарегистрирован: 10.11.2008
Сообщений: 126
|
Обратиться по нику
|
brantozawr |
Ответить с цитатой | | |
|
DrKronos, не 256, а с 0 по 127. со 128 символа в UTF уже выделяется 2 байта на символ. с 2048-го - 3 байта на символ, с 2097152 - 4 байта. |
|
|
|
|
|
|
![]() DrKronos SEO-доктор |
Зарегистрирован: 11.03.2008
Сообщений: 13021
|
Обратиться по нику
|
|
|
Здесь могла быть ваша реклама |
![]() brantozawr Опытный |
Зарегистрирован: 10.11.2008
Сообщений: 126
|
Обратиться по нику
|
brantozawr |
Ответить с цитатой | | |
|
Там имеется в виду, что они совпадают по внешнему виду. Т.е. 256 символов ISO-8859-1 и UTF-8 выглядят одинаково, но закодированы по разному. А по кодам совпадают только первые 128 символов.
Собственно, вот Вика про 128 символов и пишет http://ru.wikipedia.org/wiki/UTF-8 |
|
|
|
|
|
|
|