HippoEDIT forum

Русская Поддержка - Russian Support => Общие вопросы => Topic started by: megadrive on September 28, 2016, 10:51:22 AM

Title: кодировка
Post by: megadrive on September 28, 2016, 10:51:22 AM
Привет. Неверно определяется кодировка в файлах. После первого выбора в конкретном файле Auto-select... в верхней строке в списке кодировок в открытом файле, начинает в нём определять нормально.
[attachurl=1][attach=2]
Title: Re: кодировка
Post by: alex on September 28, 2016, 10:36:10 PM
Привет,

да, такое может быть, если текст маленький или смешанный.
Для определения кодировки используется статический анализ и если данных недостаточно он может сбоить.
Title: Re: кодировка
Post by: megadrive on September 29, 2016, 09:14:06 AM
Ну определение то правильное происходит после нажатия Auto-select... Может как то при открытии файла его (Auto-select) применять автоматически? Ну или опционально хотя б сделать возможность. Или делать акцент опциональный на определение в какой то группе кодировок (cyrillic и т.п). Неудобно много редакторов иметь на машине и/или кучу кнопок нажимать что отобразилось. Хотелось бы один и чтоб не объяснять ребенку/жене, что чтоб крокозябрики пропали надо то то там то нажать... И уж тем более про кодировки разговаривать с ними :)
Title: Re: кодировка
Post by: alex on September 30, 2016, 12:46:36 AM
понятно, что хочется чтобы все автоматически и правильно :) Я за.
Проблема только как такую ситуацию задетектить.
В твоем случае, редактор то определил кодировку (определила библиотека от IE), но определил неправильно. Как понять когда правильно а когда нет?
Auto-Select в меню тоже не от меня :) (мопед не мой) Auto-Select, это такая кодировка, по которой drawing engine Windows понимает что надо подбирать символы из какой то языковой группы. Как - не знаю.

В общем, сначала надо понять что задетектилось неправильно.. как пока не ясно.
Пошли файл.
Title: Re: кодировка
Post by: megadrive on September 30, 2016, 10:27:50 AM
alex, дык файл приаттачен в первом сообщении ;)
Title: Re: кодировка
Post by: alex on October 02, 2016, 01:01:28 AM
посмотрел, мало данных - определяет кодировку 932, с уверенностью 86 единиц:

Как : https://msdn.microsoft.com/en-us/library/aa740986(v=vs.85).aspx

в принципе результат нормальный, хоть и не правильный :)

Могу только добавить настройку по Min Confidence (как XML флаг).
Ну или уже сейчас можеш отключить расширенное определение, тогда если не определиться, будет системная по умолчанию. Детали на вики: http://wiki.hippoedit.com/files/encoding