Author Topic: кодировка  (Read 987 times)

Offline megadrive

  • Newbie
  • *
  • Posts: 26
  • Karma: +0/-0
    • View Profile
кодировка
« on: September 28, 2016, 09:51:22 am »
Привет. Неверно определяется кодировка в файлах. После первого выбора в конкретном файле Auto-select... в верхней строке в списке кодировок в открытом файле, начинает в нём определять нормально.
* FS_DevDBSrv.log (0.11 kB - downloaded 109 times.)ila_rendered
« Last Edit: September 28, 2016, 10:01:06 am by megadrive »

Offline alex

  • Developer
  • Global Moderator
  • Hero Member
  • *****
  • Posts: 2181
  • Karma: +37/-3
    • View Profile
    • HippoEDIT
Re: кодировка
« Reply #1 on: September 28, 2016, 09:36:10 pm »
Привет,

да, такое может быть, если текст маленький или смешанный.
Для определения кодировки используется статический анализ и если данных недостаточно он может сбоить.

Offline megadrive

  • Newbie
  • *
  • Posts: 26
  • Karma: +0/-0
    • View Profile
Re: кодировка
« Reply #2 on: September 29, 2016, 08:14:06 am »
Ну определение то правильное происходит после нажатия Auto-select... Может как то при открытии файла его (Auto-select) применять автоматически? Ну или опционально хотя б сделать возможность. Или делать акцент опциональный на определение в какой то группе кодировок (cyrillic и т.п). Неудобно много редакторов иметь на машине и/или кучу кнопок нажимать что отобразилось. Хотелось бы один и чтоб не объяснять ребенку/жене, что чтоб крокозябрики пропали надо то то там то нажать... И уж тем более про кодировки разговаривать с ними :)

Offline alex

  • Developer
  • Global Moderator
  • Hero Member
  • *****
  • Posts: 2181
  • Karma: +37/-3
    • View Profile
    • HippoEDIT
Re: кодировка
« Reply #3 on: September 29, 2016, 11:46:36 pm »
понятно, что хочется чтобы все автоматически и правильно :) Я за.
Проблема только как такую ситуацию задетектить.
В твоем случае, редактор то определил кодировку (определила библиотека от IE), но определил неправильно. Как понять когда правильно а когда нет?
Auto-Select в меню тоже не от меня :) (мопед не мой) Auto-Select, это такая кодировка, по которой drawing engine Windows понимает что надо подбирать символы из какой то языковой группы. Как - не знаю.

В общем, сначала надо понять что задетектилось неправильно.. как пока не ясно.
Пошли файл.

Offline megadrive

  • Newbie
  • *
  • Posts: 26
  • Karma: +0/-0
    • View Profile
Re: кодировка
« Reply #4 on: September 30, 2016, 09:27:50 am »
alex, дык файл приаттачен в первом сообщении ;)

Offline alex

  • Developer
  • Global Moderator
  • Hero Member
  • *****
  • Posts: 2181
  • Karma: +37/-3
    • View Profile
    • HippoEDIT
Re: кодировка
« Reply #5 on: October 02, 2016, 12:01:28 am »
посмотрел, мало данных - определяет кодировку 932, с уверенностью 86 единиц:
  • = {nLangID=4294967295 nCodePage=932 nDocPercent=60, nConfidence=86}

Как : https://msdn.microsoft.com/en-us/library/aa740986(v=vs.85).aspx

в принципе результат нормальный, хоть и не правильный :)

Могу только добавить настройку по Min Confidence (как XML флаг).
Ну или уже сейчас можеш отключить расширенное определение, тогда если не определиться, будет системная по умолчанию. Детали на вики: http://wiki.hippoedit.com/files/encoding