От AMX
К apple16
Дата 01.06.2018 10:51:48
Рубрики WWII; Армия; 1941; Память;

Re: Потому что...

>Это не может дать никакой оценки потерь, поскольку работы по борьбе за качество данных проведено не было.
А как их провести? Опечатки и ошибки на вводе еще можно было проконтролировать.
А как вы сведете к общему знаменателю путаницу в исходных данных.
Я вот неверного ввода еще ни разу не встречал, а второе почти на каждом шагу.

Или кто должен решить, что Иван Иванович Иванов в послевоенной переписи, где другой год рождения или место рождения или дата гибели/пропажи без вести, это один и тот же человек по другим данным?
Лучше пускай так как сейчас, чем разных людей объединят.

Или кто должен решить, что Малорецкий р-он, это на самом деле Малоритский? Причем это так получилось, потому что боец не знал как его район пишется.


От Slick
К AMX (01.06.2018 10:51:48)
Дата 03.06.2018 15:46:46

Re: Потому что...


>Или кто должен решить, что Иван Иванович Иванов в послевоенной переписи, где другой год рождения или место рождения или дата гибели/пропажи без вести, это один и тот же человек по другим данным?
>Лучше пускай так как сейчас, чем разных людей объединят.

>Или кто должен решить, что Малорецкий р-он, это на самом деле Малоритский? Причем это так получилось, потому что боец не знал как его район пишется.

Поэтому нужны слои данных с доступом ко всем : скан-копии (источник) - распознанный текст - структурированный текст - агрегаты (слои связей) и т.д. ...

совсем не тривиальная задача...

От apple16
К AMX (01.06.2018 10:51:48)
Дата 01.06.2018 11:31:24

Это тоже процесс

В простом случае совпадение основных атрибутов
В сложном - садятся живые люди и думают

Где однозначно сказать нельзя там и не объединяют