Проблемы UTF-8

programmingИх конечно немного, но о них нужно знать. Если вы решили писать сайт или сервис полностью в кодировке -8, то вам нужно знать о ряде подводных камней, который «всплывут»после перехода на utf-8 с windows-1251:

1. Объем данных вырастет в 1,5-2 раза, в том числе в базе данных (1 символ на русском языке требует 2 байта данных в utf-8).

2. Скорость, вероятно из-за п. 1, обработки строк регулярными выражениями значительно снизится.

3. до последнего времени «съедал» букву «Р» в результатах поиска, если сайт в кодировке utf-8. К счастью, похоже что это исправили. Что не означает того, что в других веб-сервисах с этим всегда всё ок.

4. Для работы с строками в UTF-8 из PHP удобней

Запись навигация

Top