кодировка

Started by megadrive, September 28, 2016, 10:51:22 AM

Previous topic - Next topic

megadrive

Привет. Неверно определяется кодировка в файлах. После первого выбора в конкретном файле Auto-select... в верхней строке в списке кодировок в открытом файле, начинает в нём определять нормально.
[attachurl=1][attach=2]

alex

Привет,

да, такое может быть, если текст маленький или смешанный.
Для определения кодировки используется статический анализ и если данных недостаточно он может сбоить.
HippoEDIT team
[url="http://www.hippoedit.com/"]http://www.hippoedit.com/[/url]

megadrive

Ну определение то правильное происходит после нажатия Auto-select... Может как то при открытии файла его (Auto-select) применять автоматически? Ну или опционально хотя б сделать возможность. Или делать акцент опциональный на определение в какой то группе кодировок (cyrillic и т.п). Неудобно много редакторов иметь на машине и/или кучу кнопок нажимать что отобразилось. Хотелось бы один и чтоб не объяснять ребенку/жене, что чтоб крокозябрики пропали надо то то там то нажать... И уж тем более про кодировки разговаривать с ними :)

alex

понятно, что хочется чтобы все автоматически и правильно :) Я за.
Проблема только как такую ситуацию задетектить.
В твоем случае, редактор то определил кодировку (определила библиотека от IE), но определил неправильно. Как понять когда правильно а когда нет?
Auto-Select в меню тоже не от меня :) (мопед не мой) Auto-Select, это такая кодировка, по которой drawing engine Windows понимает что надо подбирать символы из какой то языковой группы. Как - не знаю.

В общем, сначала надо понять что задетектилось неправильно.. как пока не ясно.
Пошли файл.
HippoEDIT team
[url="http://www.hippoedit.com/"]http://www.hippoedit.com/[/url]

megadrive

alex, дык файл приаттачен в первом сообщении ;)

alex

посмотрел, мало данных - определяет кодировку 932, с уверенностью 86 единиц:
  • = {nLangID=4294967295 nCodePage=932 nDocPercent=60, nConfidence=86}
    Как : https://msdn.microsoft.com/en-us/library/aa740986(v=vs.85).aspx

    в принципе результат нормальный, хоть и не правильный :)

    Могу только добавить настройку по Min Confidence (как XML флаг).
    Ну или уже сейчас можеш отключить расширенное определение, тогда если не определиться, будет системная по умолчанию. Детали на вики: http://wiki.hippoedit.com/files/encoding
HippoEDIT team
[url="http://www.hippoedit.com/"]http://www.hippoedit.com/[/url]