>>На 15 марта 1995 года в ЦБД было введено около 19 миллионов персональных
>
>Вот, кстати, интересный момент. Допустим, сидит 10 операторов и непрерывно заносят записи в базу. Допустим, на запись уходит минута. В рабочем дне 8 часов. Итого в день оператор, работая без устали, заносит 480 записей. Пусть 500. 10 операторов - 5000. В месяце 22 рабочих дня. Итого 110.000 в месяц. 1.320.000 в год.
>С 1990г - 5 лет: 6.600.000. Откуда 19.000.000?
>Допустим, двадцать операторов - все равно 13.200.000.
>Неужто там больше двадцати операторов в штате?
Опытный оператор за минуту три-четыре записи сделает. А если есть примитивная автоматизация (сканер), и ему нужно только вычитать - то и больше.
Сам сейчас занимаюсь подобным делом, поэтому уверенно говорю.
Я думаю, данные этого банка как минимум не хуже данных Кривошеева, а истина посередине.
>Опытный оператор за минуту три-четыре записи сделает.
Смотря какая запись и сколько там полей, и какие проверки надо делать при вводе. Есть "записи", которые часами делают.
Смотрите, как это бывает: http://ef.newmail.ru/russian/s002_losses_01.htm
===нач
При вводе информации в ПБД из архивных документов была предусмотрена определенная система контроля качества ввода. Осуществлялся логический контроль программными средствами; работа оператора проверялась бригадирами, практиковалось дублирование ввода информации.
Для обеспечения правильности заполнения оператором экранного формата карточки были разработаны ретроспективные справочники административных и областных центров, республик, воинских званий, а также адресов рассылки по современному административно-территориальному делению.
Введенные в информационный массив записи сортировались по месту призыва военнослужащих или по месту их рождения и распечатки этих сведений рассылались в областные военкоматы, где они сверялись с данными, которые имеются в военкоматах и собранными группами по подготовке местных Книг Памяти, дополнялись и уточнялись, а затем возвращались в компьютерный центр ВНИИ ДА Д, который корректировал информацию, вносил изменения в этом информационном массиве.
===кон
Таким образом, "ввод записи" - это не просто набивка пары полей. Помимо всего прочего, они вводятся дважды, а затем еще и перевводятся. Кстати, вот такой формат у записи:
===нач
В вводимых в БД записях содержатся сведения о фамилии, имени и отчестве военнослужащего, дате и месте рождения, дате и месте призыва в армию, воинском звании и должности, дате, месте и причине смерти, месте захоронения, архивные шифры первоисточников.
===кон
Как раз как минимум минуту вводить, с учетом описанной технологии.
>А если есть примитивная автоматизация (сканер), и ему нужно только вычитать - то и больше.
Вопрос - насколько страница поддается OCR, ведь источником служило:
===нач
Документы представляют собой донесения и списки погибших, пропавших без вести и попавших в плен из действующих войсковых частей, журналы регистрации смертей от ран в госпиталях, картотеки умерших военнопленных в фашистскнх лагерях, копни извещений о гибели и другие виды документов, в которых фиксировалнсь сведения о безвозвратных потерях.
===кон
Оператор получит слабораспознанную и не очень структурированную страницу, ему придется делать многочисленные cut & paste, короче, может будет быстрее руками ввести.
>Я думаю, данные этого банка как минимум не хуже данных Кривошеева, а истина посередине.
Вот опубликуют - посмотрим. Чего сейчас-то обсуждать? Тем более, что только что привели пример присутствия в списке памяти человека, умершего после войны.