От apple16
К All
Дата 29.05.2002 14:07:48
Рубрики Прочее;

Систематизация военно-исторической информации

Обсуждать авторские права дело дохлое -
принципиально ничего нельзя доказать оппоненту ибо
пиратить/непиратить просто выгодно а прибить
совсем технически не выйдет.

Однако есть интересный аспект нашего пиратства
в электронном виде -
книжку можно распарсить и использовать для автоматического поиска данных.

Т.е. как сейчас народ действует
1. Держит очень много всего в голове
что не есть хорошо - голова чтобы пишу принимать и думать а факты в ней держать это гуманитарщина какая-то. :)
2. Держит дома кучу бумажных книжек, справочников
которые собирают пыль и канцерогены от старости
выделяют.

Т.е. на какой-нибудь простенький вопрос типа
"что было в Атлантике "дата" в таком-то районе
"центр,радиус" человек сначала вспоминает что точно
U-такая-то кого-то утопила, потом лезет в справочник
или книжку по этим самым U и говорит что еще вот Uтакая-то и такая-то. При этом возможно там еще что-то было
но просто сразу сообразить где смотреть не выходит.
Занимает массу времени и не гарантирует результата.
И кустарный спавочник типа базейки уважаемого FVL~01
тоже не прокатит так как запросы самые разные бывают
и одной таблицей не исчерпываются.

Т.е. фактов уже очень много а систематизации никакой.
(полнотекстовый поиск тоже не панадол по нему например
не выяснить что расстояние между двумя населенными пунктами такое-то и что между ними река без мостов
шириной такой-то)
Нормальный пример (не U которые особо никому не нужны)
это сатик rkka - очень много боевых документов, тысячи
людей и населенных пунктов и т.п.

Просто перегнав все документы в разумный xml
с выделенными тагами под формирования, должностных лиц,
населенных пункты и прочую географию можно только
создать предпосылки для создания базы.
Как ее делать тоже пока не очень ясно ибо неясно какие запросы к базе нужны.
Понятно что любой документ привязывается по месту и времени, понятно что люди легко ищутся как и формирования, понятно что можно расчетки применить
типа соотношение сил сторон там-то и там-то.
Также достаточно легко выделить противоречия в документах.
Короче хорошее и явно нужное дело.

Хотелось бы услышать какие запросы к такой штуке
в принципе могут быть сделаны.
Может кто чем-то подобным занимался уже?

________
Apple

От Начальник Генштаба
К apple16 (29.05.2002 14:07:48)
Дата 29.05.2002 20:11:11

Re: Систематизация военно-исторической...

Приветствую непременно!

я сейчас делаю такой проект - должен быть готов в первом приближении к концу декабря

Делается несколько стандартных шаблонов, при совпадении значения полей устаналивется связь между такими объектами.

Идея сделать БД по всем конфликтам, с одинаковой степенью подробности. Со временем углубляться в тех темах, где наличие информации это позволяет.

Илья Кудряшов ==
http://genstab.ru

От apple16
К Начальник Генштаба (29.05.2002 20:11:11)
Дата 30.05.2002 10:45:25

Если будете географию вязать - свистите

у меня как раз по этому вопросу специализация :)

От Venik
К apple16 (29.05.2002 14:07:48)
Дата 29.05.2002 15:53:34

а чем тебя не устраивают поисковые системы вроде Google? (-)


От apple16
К Venik (29.05.2002 15:53:34)
Дата 29.05.2002 15:56:06

нельзя делать сложных запросов и сопостовлять данные

в частности привязывать на местности

От Venik
К apple16 (29.05.2002 15:56:06)
Дата 29.05.2002 15:58:27

если предположить...

Мое почтение!

...что искомая информация находится в определенном документе на конкретной странице (страницах), то какая еще привязка к местности нужна?

С уважением, Venik

От apple16
К Venik (29.05.2002 15:58:27)
Дата 29.05.2002 16:05:06

Re: если предположить...

Я же говорю мне нужна тулза отвечающая на вопрос
время + район

От Александр Киян
К apple16 (29.05.2002 14:07:48)
Дата 29.05.2002 14:20:53

Re: Систематизация военно-исторической...

Приветствую !

>Просто перегнав все документы в разумный xml
>с выделенными тагами под формирования, должностных лиц,
>населенных пункты и прочую географию можно только
>создать предпосылки для создания базы.
>Как ее делать тоже пока не очень ясно ибо неясно какие запросы к базе нужны.
>Понятно что любой документ привязывается по месту и времени, понятно что люди легко ищутся как и формирования, понятно что можно расчетки применить
>типа соотношение сил сторон там-то и там-то.
>Также достаточно легко выделить противоречия в документах.
>Короче хорошее и явно нужное дело.

>Хотелось бы услышать какие запросы к такой штуке
>в принципе могут быть сделаны.

Не очень понятно, какой предлагается механизм.
Препарировать документы, навставляв тегов, и неким парсером сгенерить БД ?

Или сперва создать базу на основе неких сущностей "Человек" - "Событие" - "Место" и т.д. а потом привязывать эту БД (заполненную) к существующим документам ?

C уважением
http://rkka.ru

От apple16
К Александр Киян (29.05.2002 14:20:53)
Дата 29.05.2002 14:45:18

Re: Систематизация военно-исторической...

Вроде так.

Есть документ в xml где все мало-мальски интересное
выделено в отдельные таги
(формирования, населенные пункты и фамилии)
Возьмем что-нибудь конкретное:
ДИРЕКТИВА СТАВКИ ВГК №005826
http://www.rkka.ru/docs/d-st-5826.htm
Потом это автоматически
(скорее всего полуавтоматически)
этот докумет запихивается в традиционную реляционку.
Структуру ее надо придумывать
в зависимости от требуемых запросов.
В принципе есть подозрение что ваш метод дает тоже
самое - сидим и вручную заносим все факты в базейку
- что из документа можно вытащить то и заносим.

А вытащить можно:
1. Географическую привязку документа и даже нанести
по ней кое-какую обстановку
2. Описать состав формирований задействованых
в операции
3. Ответить на запросы кое-какие
типа где была какая армия к моменту начала операции

Весь вопрос в запросах :) что собственно реально нужно.

Например нарисовать движующуюся линию фронта на всю войну
можно по такой штуке, но надо ее под это дело затачивать
и кроме как мультика особого толка от этого нет.
А вот ответить что было в такой-то местности тогда-то
очень было бы интересно.



От Александр Киян
К apple16 (29.05.2002 14:45:18)
Дата 29.05.2002 15:08:49

Re: Систематизация военно-исторической...

Приветствую !

>Весь вопрос в запросах :) что собственно реально нужно.

Самая простая модель:
"Персона"
"Часть" - объединения, соединения, части, etc
"Событие" - операция, освобождение нас. пункта, etc

Между этими сущностями отношения принадлежности:
"Персона" служит в "Части"
"Персона" принимает участие в "Событии"
"Часть" принимает участие в "Событии"

Плюс
"Часть" принадлежала "Части"
"Событие" имело место в рамках "События"

C уважением
http://rkka.ru

От apple16
К Александр Киян (29.05.2002 15:08:49)
Дата 29.05.2002 15:18:12

Хорошо

Я представляю себе
что такое Персона (очень просто)
и Часть (сложнее но в принципе понятно)
А вот Событие надо разваливать на составляющие подробно

В событие входит географическая и временная привязка
+ тип события -
реальное или планировавшееся - так?

те получаем поля
когда, где (ссылка на географический район), тип,
собственно семантика события
(напрмер код одно поле и еще десять полей на параметры
в зависимости от кода семантики)

Ну и еще одна сущность собственно документ
- ссылка на событие (события) но содержащее исходную
форму и авторские реквезиты.

От SlowHead
К apple16 (29.05.2002 15:18:12)
Дата 29.05.2002 15:33:23

именно так

Доброго времени суток!

>те получаем поля
>когда, где (ссылка на географический район), тип,
>собственно семантика события
>(напрмер код одно поле и еще десять полей на параметры
>в зависимости от кода семантики)

именно так. вопрос в количестве атрибутов, навешиваемых документу.
а как и где эти атрибуты искать это уже другой вопрос.
можно типа в БД по простому/сложному запросу.
можно документ из БД выгрузить в xml, его проиндексировать, а затем искать нужные атрибуты в проиндексированых xml'ьках

---------------------С уважением, SlowHead

От Резяпкин Андрей
К Александр Киян (29.05.2002 14:20:53)
Дата 29.05.2002 14:29:34

Re: Систематизация военно-исторической...

Добрый день!

Систематизация документов:
- документы в текстовых файлах в папках по темам, поиск по содержанию документов.

Систематизация картинок:
- картинки с текстовыми комментариями на странице html, поиск по текстовым комментариям.

С уважением, А.
http://crossroad.tradevisa.net/ Терминология бывшего противника

От Александр Киян
К Резяпкин Андрей (29.05.2002 14:29:34)
Дата 29.05.2002 14:38:28

Re: Систематизация военно-исторической...

Приветствую !

>Систематизация документов:
>- документы в текстовых файлах в папках по темам, поиск по содержанию документов.

Не годится. Местонахождение документов в принципе не играет никакой роли. Необходим "файл-спутник" или идентификатор документа в БД. Далее проводится необходимая классификация, ибо каждый документ может относится к различным классам даже при одном критерии классификации.

C уважением
http://rkka.ru

От Резяпкин Андрей
К Александр Киян (29.05.2002 14:38:28)
Дата 29.05.2002 21:04:49

Re: Систематизация военно-исторической...

Добрый день!

>Не годится. Местонахождение документов в принципе не играет никакой роли. Необходим "файл-спутник" или идентификатор документа в БД.

***согласен, есть и такой вариант: динамичная "учетная запись", составленная с помощью нескольких классификаций. На нее "навешивается" связанный документ. Учетная запись хоть на китайском языке.

С уважением, А.
http://crossroad.tradevisa.net/ Терминология бывшего противника

От apple16
К Александр Киян (29.05.2002 14:38:28)
Дата 29.05.2002 14:47:28

Вот это как-раз фигня - какой-нибудь яндекс проиндексировав

сайт rkka уже это сделал - можно искать и по названиям
деревень и по номерам дивизий.

А вот расчетку какую-нибудь или же запрос типа
дата+место фигушки

От apple16
К apple16 (29.05.2002 14:47:28)
Дата 29.05.2002 14:48:09

Ошибся ответ для Резяпкин Андрея :( (-)


От SlowHead
К Резяпкин Андрей (29.05.2002 14:29:34)
Дата 29.05.2002 14:31:44

MS Index Server 2.0 + Alesta Search решит Ваши проблемы (-)


От Anton
К SlowHead (29.05.2002 14:31:44)
Дата 29.05.2002 14:53:14

На самом деле

имхо все это выльется в создание почти искусственного интеллекта, ибо формализовать информацию любого документа на русском языке - задача именно такой сложности.

От apple16
К Anton (29.05.2002 14:53:14)
Дата 29.05.2002 14:56:02

документ НЕ на русском языке

а на русском военном
есть правила составления боевых документов.

Это из серии насколько больше снарядов в "уничтожить" чем в "подавить"? :)