От apple16
К Жуков Андрей
Дата 23.05.2017 18:12:36
Рубрики Прочее; Современность;

По поводу бесплатного

У нас на дворе капитализм, поэтому логично, что собственник имущества пытается его монетаризировать. Как умеет так и пытается.

Но важно установить:

1. Является ли пациент собственником - в случае госархивов в РФ - ответ нет
Архив хранит, но обязан подчинятся органам госуправления.
2. Нет ли какой целевой программы в приказном порядке в целях пропаганды
обязующих раздать все и абсолютно бесплатно

Те если совпало - вам должны отдать бесплатно
Если не совпало - то согласно госрасценкам
Поскольку органов управления много и подчиненность разная правила будут любые.
От разумных - если дал почитать то значит дал скопировать (но без порчи имущества) до карандашика и листика.

____________________

Теперь если посмотреть идеальный случай - как должно быть все устроено


Лучший способ управления архивом это его оцифровать - чтобы разные не лезли немытыми руками в бумаги эти бумаги должны быть оцифрованы в цвете с конским избыточным DPI. Удобно проиндексированы и сложены кучкой. После этого архив занимается менеджментом кондиционеров и швабр (сосредотачивается на хранении артефактов) и его больше никто не трогает - запросы исследователей идут в электронную версию. Важно обеспечить перенос всех материалов в электронную версию и процедуру верификации электронного документа vs оригинал если вдруг возникили вопросы.

После этого электронную версию можно продавать по подписке ведущим университетам или индивидуальным гражданам и организациям. Можно также организовать сервис поиска, где опытный человек ищет для вас документы. Можно много чего придумать.

Если государство хочет в целях пропаганды что-то расшарить бесплатно, то можно обеспечить доступ к части имущества бесплатно.

В США есть вагон закрытых баз по подписке (туда ходят университеты)
- всякие Gale Group
Есть и казенные места с доступными документами - Библиотека Конгресса или тот же Колледж Парк (catalog.archives.gov) живой пример.

Важно, чтобы информация не цеплялась за исполнителей
Если оцифровывать то все до последней бумажки
Если предоставлять доступ то точно так как оно лежит в архиве, а не придумывать свою модель данных, которая неудобна пользователю.
Оцифровка идет в целях успещно торговать информацией - пользователь тут король и все должно быть удобно.

___________________


Теперь отдельно по ЦАМО и прочим документам ВОВ
Ясно сказано, что данные должны быть опубликованы и розданы бесплатно
Это автоматически означает отчуждение их у архива со всеми потрохами (обложками дел, листиками регистрации читателей и всего прочего)

Но в РФ технический уровень низкий это раз - оцифровкой занимаются люди неопытные (русский язык в коде это маркер)
Понимания полного отчуждения имущества нет это два - какие-то руководители считают себя собственниками (хотя их функция только хранить)
Третий фактор - есть перспектива на архивных материалах создать реально навороченный сервис, который будет лучше чем архив - поднять формирования, карты людей из дел и дать общую картину.

Сейчас вот и идет процесс построения такого сервиса. Поскольку прогноз негативный (если нет обратной связи у разработки, то это маркер) то потихоньку приходится откачивать имущество пока это сравнительно несложно.

Как всегда, на тех же данных энтузиасты могут сделать лучше - классика поиска по ОБД - один человек в свободное время на эластике запилил лучше чем Элар. Потому что он знает, что ему нужно. Таких знаний - хотелок пользователей вагон. Но они игнорируются, равно как и огрехи оцифровки. 1941 и 1944 перепутаны в сотнях документов - всем пофиг.


От AMVAS
К apple16 (23.05.2017 18:12:36)
Дата 11.06.2017 15:42:23

Re: По поводу...

Приветствую

>Теперь отдельно по ЦАМО и прочим документам ВОВ
>Ясно сказано, что данные должны быть опубликованы и розданы бесплатно
>Это автоматически означает отчуждение их у архива со всеми потрохами (обложками дел, листиками регистрации читателей и всего прочего)

>Но в РФ технический уровень низкий это раз - оцифровкой занимаются люди неопытные (русский язык в коде это маркер)
>Понимания полного отчуждения имущества нет это два - какие-то руководители считают себя собственниками (хотя их функция только хранить)

У меня давно уже цензурных комментариев по этому поводу нет.

>Третий фактор - есть перспектива на архивных материалах создать реально навороченный сервис, который будет лучше чем архив - поднять формирования, карты людей из дел и дать общую картину.

В ЭЛАРЕ по этому поводу мне отвечали - будет финансирование, будет работа. В этом плане, конечно, они в своём праве.
А вот в плане отрыва их работ от реальных исследователей "страшно далеки они от народа" (с)
Кто им даёт техзадание и пр., это хрен знает.
какое-нибудь управление по увековечиванию памяти... или что-то вроде него. Короче, организация далёкая от исследований боевых действий.

>Сейчас вот и идет процесс построения такого сервиса. Поскольку прогноз негативный (если нет обратной связи у разработки, то это маркер) то потихоньку приходится откачивать имущество пока это сравнительно несложно.

Да по моим оценкам там порядка 60Тб оперативных записей.
Даже если по 5Тб харды иметь, то уже прилично получается на хранение.
А с обратной связью, я уже даже плюнул. Им пишешь конкретные поля буквально в которых опечатки, ноль эмоций.

>Как всегда, на тех же данных энтузиасты могут сделать лучше - классика поиска по ОБД - один человек в свободное время на эластике запилил лучше чем Элар. Потому что он знает, что ему нужно.

Кстати, в начале июня они изменили поиск по-моему.
Если раньше поиск по полю "название документа вёлся", например, то теперь они из поля ввода раскидывают запрос аж по нескольким полям запроса.
В результате лезут в ответ документы, которые имеют ключевое слово не в заголовке, а где-то в других атрибутах. И изменить это штатный движок не позволяет.


> Таких знаний - хотелок пользователей вагон. Но они игнорируются, равно как и огрехи оцифровки. 1941 и 1944 перепутаны в сотнях документов - всем пофиг.

А как отлавливаете 1941/44? Я тоже сталкивался, но иногда. Целенаправленно не отлавливал.

Алексей
http://rkkaww2.armchairgeneral.com/

От Жуков Андрей
К AMVAS (11.06.2017 15:42:23)
Дата 11.06.2017 17:31:08

Re: По поводу...

>Да по моим оценкам там порядка 60Тб оперативных записей.
60 ТБ - это целиком все? Т.е. включая Мемориал, Подвиг и Память Народа?
Да и еще момент.
Для скачет есть 3 вида - image (превьюшки), imageload (нормальные файлы, качество иногда у карт может не устраивать) и imagefull (полноразмерные большие файлы).
60 ТБ - это наверное объём imagefull.
А для домашнего назначения imageload в принципе хватает.
Размер между imageload и imagefull для обычных файлов как правило разница в 2 раза. Для карт больше.
Мне попадались версии что полный объем ОБД-Памяти и Подвига Народа вместе с Мемориалом где-то 100 ТБ (в каком формате не уточняется).
А как на самом деле?
>Даже если по 5Тб харды иметь, то уже прилично получается на хранение.
В принципе есть и 10 ТБ винты по 20 000. Т.е. ежели надо объять 60 ТБ - то 120 000 нужно. В принципе...

От AMVAS
К Жуков Андрей (11.06.2017 17:31:08)
Дата 11.06.2017 17:44:46

Re: По поводу...

Приветствую
>>Да по моим оценкам там порядка 60Тб оперативных записей.
>60 ТБ - это целиком все? Т.е. включая Мемориал, Подвиг и Память Народа?

Нет, это только документы частей. Без ОБД, Подвиганарода и пр.

>Да и еще момент.
>Для скачет есть 3 вида - image (превьюшки), imageload (нормальные файлы, качество иногда у карт может не устраивать) и imagefull (полноразмерные большие файлы).
>60 ТБ - это наверное объём imagefull.

Да, я сейчас imagefull использую

>А для домашнего назначения imageload в принципе хватает.
>Размер между imageload и imagefull для обычных файлов как правило разница в 2 раза. Для карт больше.

Для карт критичнее. кроме того рукописный текст всё же качество имеет значение.

>Мне попадались версии что полный объем ОБД-Памяти и Подвига Народа вместе с Мемориалом где-то 100 ТБ (в каком формате не уточняется).
>А как на самом деле?

Подвигнарода оперативные документы порядка 330Гб
Персональные документы вполне могут на 40Тб и тянут. Там же нет карт, поэтому они поменьше

>>Даже если по 5Тб харды иметь, то уже прилично получается на хранение.
>В принципе есть и 10 ТБ винты по 20 000. Т.е. ежели надо объять 60 ТБ - то 120 000 нужно. В принципе...

Не забывайте, что их где-то и хранить надо. Коробка ещё тысяч 13-20 стоит на 4 диска.
Хотя, если просто на дисках + док-станция, то сойдёт и так. правда пользоваться неудобно.
10Тб винты это хорошо. но по надёжности ещё не ясно с ними.
Алексей
http://rkkaww2.armchairgeneral.com/