Наглядно о проблеме кодировок многострадального русского языка

Аватар пользователя И-23

Обсуждение теоретического анализа проблемы (http://aftershock.news/?q=node/340931) ожидаемо продемонстрировало лишь упадок культуры абстрактного мышления.
Поэтому я решил наглядно показать игнорируемые в силу привычности иллюстрации проблемы.
Чтобы далеко не ходить — на примере AS.

Кириллические URL
«Использование кириллицы запрещено в файлах robots.txt и http-заголовках сервера.»
https://yandex.ru/support/webmaster/yandex-indexing/cyrillic-urls.xml
От себя добавлю: далеко не только в них, но задачи исчерпывающего описания здесь не ставится.

http://absurdopedia.net/wiki/%D0%90%D0%B1%D1%81%D1%83%D1%80%D0%B4%D0%BE%...

http://absurdopedia.net/wiki/Абсурдопедия:Про_список_Минюста

Обратите внимание на читаемость и определение активной части ссылки.

Или для кириллического домена:

http://николай-стариков.рф/

Наглядная иллюстрация последнего (да извинит меня кислая, просто первый попавшийся на глаза пример): http://aftershock.news/?q=node/358910 Смотрим строку ссылки на первоисточник. Утверждающие решённость проблемы читают вслух и с выражением строку «xn--b1ae2adf4f.xn--p1ai» (самое смешное, что текущий FF в буфер памяти копирует вполне читаемое «провэд.рф»).

Вишенкой на торте: фрагмент снимка экрана AS, наглядно показывающий виртуальность проблемы (снимок добыт с предыдущей реинкарнации ресурса, из зоны SU):

Товарищи конечно не затруднятся прочитать рядок вопросительных знаков. ☺

Организационное: Согласно заверениям целого ряда несомненно квалифицированных товарищей проблемы не существует (и как бы вообще не существовало).
Поэтому не стоит тратить сугубо ограниченные ресурсы на исправление перечисленных огрехов в рамках АШ полагаю нерациональным.
Куда правильнее будет просто спросить с товарищей, утверждающих отсутствие проблемы, за приведение наблюдаемой действительности в соответствие с постулируемой догмой.

ЗЫ: Ещё из наглядного — ёмкость SMS в символах как нагляднейшая иллюстрация равноправия языков.

ЗЗЫ: Update: читаю объявление в электричке (экспресс).

На улице -10ёС

Проблемы не существует, она давным-давно решена.

Комментарии

Аватар пользователя Не_волшебник

Тяжело с Вами - Вы смотрите глубоко.

По поводу сбора имени г-на мигалкова тут проблема в Системе западнизма.

К сожалению, но это объективно. "География это приговор" - понимаете мне в суд попасть это (условно) проехать 1500 км., а "москвичу" - на соседнюю улицу перейти. И Михалковы Москвичи всегда будут молиться на Запад - там всегда яйца Фаберже будут толще - мягкий климат, высокая плотность населения умноженная на несколько урожаев в году. Москва по факту сейчас - отдельное государство.

С точки зрения государства Вы сильно ошибаетесь. Посчитайте Ивана Грозного. Т.е. как минимум три. ☺
Причём во всех трёх случаях по крайней мере одна _необходимая_ (!) задача не была решена. ☹

Построить систему независимую от личности (самовоспроизводящуюся) они бы при всём желании не смогли бы. На примере медицины - что толку для меня, что есть хороший онколог в соседней области, если наша область как две Германии и Франция вместе взятые. Поэтому и много свободы на местах - а значит всё зависит от личности. Добросовестный специалист, честный (как глупо сегодня звучат такие слова) - сделает хорошо, а нет... всё - дело труба.

 Про «побить» решается тоже достаточно просто. Идентификацией исполнителей, фиксацией и оказанием в качестве разминки помощи в публичном чтении тематического сборника статей Ивана Аксакова.

- Порутчик Ржевский просит у Наташи Ростовой разрешения отлучиться не на долго на улицу. Возвращается - всё лицо мокрое. Наташа спрашивает - порутчик на улице дождь?

- Нет, ветер - отвечает Ржевский.

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Только вот приговор не в географии, а в Системе (уверен, г-ну Михалкову очень понравится вызов в районный суд города Магадана, чтобы далеко не ходить), главным свойством которой является убыточность справедливости. И ещё, оперируя теориями тов. Паршева Вы явно не знакомы с его критиками. Вопрос насколько это распространено на АШ и не стоит ли мне принести хотя бы одну из известных (мне)?

Построение системы, независимой от личности — идеал. Достаточно обеспечения простой преемственности с следующей фазой.

ЗЫ: Проблему демона власти всё равно решать придётся.

Аватар пользователя Не_волшебник

Только вот приговор не в географии, а в Системе

Возможно ли, в принципе, построение такой системы - ведь для этого необходимы не только технические возможности, но люди в голове у которых есть необходимые социальные инстинкты. А вот это уже - может быть и приговор.

Паршева Вы явно не знакомы с его критиками. Вопрос насколько это распространено на АШ и не стоит ли мне принести хотя бы одну из известных (мне)?


И Паршева и критиков его читал. Правда давно. Для себя поставил точку в том месте, что Паршев прав, в той части о которой говорит. Критика же сводилась к тому, что он не учитывает другие факторы. Что тоже справедливо ибо жизнь богаче.

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Если не ставить задачи — априори невозможно.

У меня другой вывод: Паршев прав только при выполнении условия намеренной вульгаризации модели (причины не затрагиваю, одна постановка вопроса об эволюции сообществ хорошо если влезет в первое приближение; возможно упуская что-то принципиально важное).
Каковое условие не вполне выполняется даже не на перспективном, а уже на наблюдаемом технологическом уровне.

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Для читаемости отмечу подразумевавшуюся ссылку.

Аватар пользователя Не_волшебник
Не_волшебник(11 лет 4 месяца)

"Я водитель. Я не хочу ни в чем разбираться. Я хочу - педалька и фыр-фыр-фыр"

Таких романтиков белых списком надо бить по голове на взлете, превентивно.

Это что? Ваша мысль не ясна.

Аватар пользователя vleo
vleo(11 лет 4 месяца)

Товарищ водитель имел в виду Белый Тезис, вероятно.

Аватар пользователя Smogg
Smogg(11 лет 1 месяц)

Знаете, чем отличается черный список сайтов от белого?

ЗЫ:

Таких романтиков белых списком надо бить по голове на взлете, превентивно.

всего одна буква опечатки, а как все поменялось)) списков, конечно же

Комментарий администрации:  
*** Отключен (лидер бан-рейтинга, высказывания типа "РИ была таким же ублюдком, как СССР и как РФ. Это генетическое, неизлечимое)" ***
Аватар пользователя vleo
vleo(11 лет 4 месяца)

Ну знаете... такой ход мысли... слишком извивистый

хорошо, что все-таки современные технологии слишком сложны для наших (и не наших тоже) любителей держать и не пущать

а против быдла работает - ну и ладно, даже правильно выходит на самом деле

p.s. сама по себе доменная система - это и есть своего рода белый список по сути

p.p.s. Ну и бить любителей белых списков по голове Белым Тезисом - тоже совершенно логично :-)

Аватар пользователя Egao
Egao(10 лет 11 месяцев)

Да не в системе самой дело. Хотя и в ней есть проблемы, а в работе комитета, который символы распределяет.

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Интересная гипотеза.
Относительно сходимости пространства решений задачи комитета аргументированным мнением пока не располагаю.

Речь о том, что благодаря главному конкурентному преимуществу UTF8 (отсутствию проблем у англоязычных товарищей, которые нам совсем не товарищи) полноценное внедрение технологии уже затянулось (и ещё затянется) на годы. Скорее даже на десятилетия.

Аватар пользователя vleo
vleo(11 лет 4 месяца)

Ну и надо внедрять активнее. На Линуксе давным давно уже только UTF8 - и в именах файлов тоже. Python3, например, дружит с UTF8 везде - в том числе в именах переменных и функций. Без никаких дополнительных танцев с бубном.

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Угу.
Осталось только вспомнить, что зависимости от dev-lang/python:2 прибиты гвоздями много где. В том числе на системном уровне.
И в ближайшее время (в нереально-оптимистичной перспетиве — до EOL EL7) ждать радикальных изменений не стоит.

Также не забываем о том, что счастье не сводится к питончику. Кое-кто отстаёт от него на годы.
И я не впишусь за отсутствие таких, кто ещё не приступался к задаче.

Аватар пользователя Egao
Egao(10 лет 11 месяцев)

Наши товарищи не понимают, наверное, что UTF8 это кодировка, в частности используется для запихивания Unicode кодов в восмибитный поток. Эта кодировка слабо говоря неоптимальна для русского и тем более для китайского. А вот сам юникод коряв, шрифты по нему неполны. Классическая китайская, корейская и японская литература в пролёте. 

Аватар пользователя И-23
И-23(10 лет 3 месяца)

???
Насколько мне известно для транспорта бинарных данных по реальным каналам (где часто встречается не восьми-, а семи-битная передача) используют base64.

Вопрос шрифтов — отдельная песня. На что справедливо указывали товарищи ещё в первом приближении.

И прошу не ограничиваться абстрактными указаниями на корявость той или иной реинкарнации «юникода», но приводить примеры.
Иначе это знание перейдёт в категорию сокровенного предания и если выплывает, то уже в форме пришествия полярного лиса.

Аватар пользователя Egao
Egao(10 лет 11 месяцев)

Base64 это немного не про то. Про проблемы CJK - хотя еще в 2008 году они говорили, что все уже есть, но например в июне 2015 был добавлен 5771 идеограф - http://blog.unicode.org/2015/06/announcing-unicode-standard-version-80.html

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Ещё один пример.
Из свеженького.
EL, gitweb-1.8.3.1. UTF-8, типо «решившая» проблему.
В проекте внезапно обнаруживается каталог, поименованный кириллицей.
Угадайте, что показывает с web-интерфейс при попытке посмотреть содержимое каталога?

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Свежий пример: в некоторых *современных* движках проверки регулярных выражений буква 'ё' внезапно НЕ входит в диапазон кипиллицы [а-я].

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Точнее: включается. Но *только* при использовании локали ru_RU.UTF8.

Аватар пользователя И-23
И-23(10 лет 3 месяца)

Следующий пример.
PocketBook 614.
Роман Фридриха Шпилгагена « Въ двѣнадцатомъ часу»/
Угадайте, что отображается на месте буквы ять в библиотеке (списке книг)?
Правильно, белый квадрат.
Нагляднейшей иллюстрацией давней и совершенной решённости проблемы.

Страницы