List Info

Thread: =?utf-8?Q? Re: =D0=A3=D0=B7=D0=BD=D0=B0=D0=B2=D0=B0=D0=BD=D0=B8=D0=B5 =D0=BA=D




=?utf-8?Q? Re: =D0=A3=D0=B7=D0=BD=D0=B0=D0=B2=D0=B0=D0= BD=D0=B8=D0=B5 =D0=BA=D
user name
2006-01-10 15:07:56
- - - - - - - - - - - - - - - - - - - - - - - - - - - -
Name: Dmitry
Subject: Re: Узнавание кодировки

Нет, он вообще путается не на
шутку. Я файлы *.lm подключал и
через Inclide langmap.conf и просто, чтоб
самого себя не запутать прямо в
основном конфиге пишу только 4
русские кодировки. Так он мне
файлик в 422 байта, который koi8-r
пишет, что кодировка - MacCyrillic. А те
файлы, которые раньше определял
ISO 8859-1, посколку я оставил только
русские кодировки, пишет KOI8-R. И
при поиске отдаёт именно в этой
кодировке! Я использую cached без
dostore и глобально utf8. Но ни то, ни
другое, ни третье роли не играет.
Я менял и кодировку, и cached на multi...

Почему и спрашиваю - может, как-то
можно переопределить этот Guesser
прямо на компиляции? А то он
пишет, как заговорённый только :

[5416] Status: 200 OK
[5416] Store by default
[5416] Guesser: Lang: ru, Charset: MacCyrillic

..и всё. И в базу кладёт результат
индексирования именно в этой
кодировке (я вручную
проверял-лазил - файл
действительно проиндексровался,
но слова лежат в неравильно
определённой кодировке. Если это
было определено в koi8r, то он так
слова и держит)

PS Максим, спасибо Вам
супер-большое за супер-программу
- - - - - - - - - - - - - - - - - - - - - - - - - - - -

Read the full topic here:
http://www.dataparksearch.org/cg
i-bin/simpleforum.cgi?fid=06;topic_id=1136861335

[1]

about | contact  Other archives ( Real Estate discussion Medical topics )