От Novik
К Николай Поникаров
Дата 03.04.2001 10:46:51
Рубрики Администрации;

Re: Нельзя.

Приветствую.

>День добрый.

>>Минимальный размер слова - три символа. Тире - разделитель. Т-34 искать не будет.
>
>... как поиск строки, заданной строго?
>Скажем, набираешь $Т-34$, и Искалка ищет строку "Т-34", а не " "Т" или "34" ".

Данного слова нет в индексе. И решение "будет искать/не будет искать" принимается на этапе индексации, а не поиска. Если Вы можете предложить разумный алгоритм, как отличить тире в "Т-34" от переноса и дефиса, буду благодарен.

От Чобиток Василий
К Novik (03.04.2001 10:46:51)
Дата 03.04.2001 11:22:34

Простой алгоритм

Привет!

>Если Вы можете предложить разумный алгоритм, как отличить тире в "Т-34" от переноса и дефиса, буду благодарен.

Предлагаю: если перед и(или) после тире нет пробелов, то все, что слева и справа от тире вместе сним считать одним словом.

Обоснование: как правило знак "минус" используется в качестве дефиса без пробелов и с пробелами в качестве тире. Если какой-то юзер (Вадиму Жилину - прости за "юзера" :)) этого не понимает и не умеет верно оформлять текст, то это проблемы самого юзера (я одному такому ЧАС втолковывал, что перед запятой и точкой пробел не надо ставить, иначе они могут по строкам в одиночку прыгать. В конечном счете сказал так "Тебя не должно е.. зачем это нужно, но перед запятой ставить пробел запрещаю!" :)))).

С уважением, В.Чобиток
http://armor.kiev.ua/

От Novik
К Чобиток Василий (03.04.2001 11:22:34)
Дата 03.04.2001 11:34:12

Re: Простой алгоритм

Приветствую.

>Привет!

>>Если Вы можете предложить разумный алгоритм, как отличить тире в "Т-34" от переноса и дефиса, буду благодарен.
>
>Предлагаю: если перед и(или) после тире нет пробелов, то все, что слева и справа от тире вместе сним считать одним словом.

Угу. Контрпримеры:
"сложно-сочиненный" "военно-патриотический" и т.п. Неговоря уже о copy/paste досовского текста с переносами.

>В конечном счете сказал так "Тебя не должно е.. зачем это нужно, но перед запятой ставить пробел запрещаю!" :)))).

У нас тут немного другие отношения. Всем не прикажешь.

От Чобиток Василий
К Novik (03.04.2001 11:34:12)
Дата 03.04.2001 12:47:09

Уточнение

Привет!

>Угу. Контрпримеры:
>"сложно-сочиненный" "военно-патриотический" и т.п. Неговоря уже о copy/paste досовского текста с переносами.

Хорошо, а при тех же условиях если ввести ограничение перед дефисом двумя символами? Это перекроет 80% сокращенных названий техники, а названия типа "ИСУ-152" и так будут искаться по "ИСУ".

Согласен?

С уважением, В.Чобиток
http://armor.kiev.ua/

От Николай Поникаров
К Чобиток Василий (03.04.2001 11:22:34)
Дата 03.04.2001 11:33:32

Т.е. вообще не считать тире разделителем. Может, есть смысл. (+)

День добрый.

Но я хотел большего: чтобы можно было искать всякие Pzkw.III-AufE,8 (танкисты, не бейте ногами, последовательность букв - от балды). Ну нельзя, так нельзя.

Если по алгоритму Василия, то придется считать точку за разделитель только если после нее стоит пробел.

По поводу проблем юзера: пишет-то один человек (он юзер), а ищет-то другой (а он-то пользователь :)) )

С уважением, Николай.

От Novik
К Николай Поникаров (03.04.2001 11:33:32)
Дата 03.04.2001 11:38:04

Re: Нет в этом смысла.

Приветствую.

Уже проходили, уже делал. Поимел кучу слов типа "1941-45гг" и подобных.

>Но я хотел большего: чтобы можно было искать всякие Pzkw.III-AufE,8 (танкисты, не бейте ногами, последовательность букв - от балды). Ну нельзя, так нельзя.

Я бы тоже хотел. Но пока не вижу как.

От Китоврас
К Novik (03.04.2001 11:38:04)
Дата 03.04.2001 11:40:15

Я, конечно, ламер, но...

Доброго всем здравия!
Может ввести часть слов с дефисами (штук 100) в память, т.е. кодировать их? Ну такие как Т-34, КВ-2, Ис-3...

С уважением, Китоврас