|
От
|
apple16
|
|
К
|
Chestnut
|
|
Дата
|
22.08.2006 15:57:21
|
|
Рубрики
|
Спецслужбы; Память;
|
|
Вы не поняли
Файлы распознаются и ложатся в базу отдельно
- где, какое слово в каких координтатах было найдено.
При поиске по ключевым словам вам подсвечивают в JPEG
(а лучше ч/б TIFF) документе нужное место.
Так сделан Таймс за 1700-лохматый год с тогдашним качеством печати
Так сделан DDRS (где тоже не все документы отличного качества
- он кстати в принципе похож)
Конечно ошибок достаточно,
но тогда это уже инструмент поиска информации а не свалка файлов.
Пока на сайте сделали минимальный объем работ
- просто сканирование и примитивная верстка. Для 2006 года плохо.
Будем делать PDF?