От iggalp
К apple16
Дата 13.02.2018 01:41:20
Рубрики Прочее; WWII; 1941;

Re: По верхам...

>Карт с ноября 2016 года больше не стало, но существующие стали гораздо хуже качеством - рукожопы пережали JPEG - при зуме лезут артефакты

Насколько понимаю там сейчас доступно два варианта картинок. Один вариант отображается по умолчанию, другой при выборе опции "Оригинал". В варианте Оригинал карты огромного веса получаются порой (до 400Мb), больше чем реально надо.

От apple16
К iggalp (13.02.2018 01:41:20)
Дата 13.02.2018 09:44:13

Спасибо, но можно пример со ссылкой?

Да реально есть карты в JPEG и 400 и 500 и 600 мегабайт
(а сколько должна весить склейка из 50-70-80 листов 1:100000 в качестве 9-10 из 12?)

Это реально надо, просто потому что их периодически печатают в натуральный размер и смотрят на них через увеличительное стекло. Артефактов быть не должно

Примитивное знание - если информацию из-каких-нибудь соображений потерять, то потом ее уже не восстановить. Отсюда TIFF конских размеров в LoC.
ЭЛАР сделал сканы неплохо и первой версией я был вполне удовлетворен.
Байтов нам не жалко (и терабайтов тоже) - лучше тут перегнуть палку, чем потом оказаться дураками. Диск на 2 терабайта стоит меньше месячной зарплаты кого угодно. Экономить место это идиотизм.

А вот дальше началась игра с намеренной порчей информации (водяные знаки)
А чо такого - нам на пользователей насрать - мы не ощущаем себя сервисом.

Но поскольку в РФ в таких конторах традиционно платят мало исполнители оказались низкого качества - размер испорченных файлов был в разы больше чем оригинальных.
Качество картинки осталось норм - без артефактов. Но представители меньшинств не унимались - как результат в 2017 году испорченные карты стали с артефактами.
Размер в байтах да, поменьше. Но печатать это уже нельзя.


От iggalp
К apple16 (13.02.2018 09:44:13)
Дата 13.02.2018 14:33:30

Re: Спасибо, но...

>Да реально есть карты в JPEG и 400 и 500 и 600 мегабайт
>(а сколько должна весить склейка из 50-70-80 листов 1:100000 в качестве 9-10 из 12?)

Пример:
202-0000005-0693
Размер - 473Mb (в пакетной выкачке imagefull)
Склейка 6x9 листов
Электронное качество приемлемое
На мой взгляд размер завышен минимум вдвое

От apple16
К iggalp (13.02.2018 14:33:30)
Дата 14.02.2018 00:46:01

Спасибо, карту взял

качество хорошее - на сильном зуме видно квадратики

Да - эти файды чуть больше чем оригинальные без водяных знаков.
Но меня это устраивает ))

От iggalp
К apple16 (13.02.2018 09:44:13)
Дата 13.02.2018 14:25:22

Re: Спасибо, но...

>Это реально надо, просто потому что их периодически печатают в натуральный размер и смотрят на них через увеличительное стекло. Артефактов быть не должно

Это в некотором смысле для староверов. Можно конечно быть перфектционистом, но если наличие артефактов не драматично искажает доносимую информацию, то это вполне себе нормально. Это во-первых. Во-вторых, электронный файл в сети не предназначен для вывода на печать в натуральный размер с полиграфическим качеством.

>Примитивное знание - если информацию из-каких-нибудь соображений потерять, то потом ее уже не восстановить. Отсюда TIFF конских размеров в LoC.

Это понятно. Но вот если у вас есть обычная страница текста, то jpg в 300 dpi в сером цвете (не цветном) более чем достаточно. Даже с запасом. А можно конечно и 1200дпи без сжатия готовить конских размеров. Только для чего? Чтобы в увеличении в 800% завиток на тегеле не искажался?

>ЭЛАР сделал сканы неплохо и первой версией я был вполне удовлетворен.
>Байтов нам не жалко (и терабайтов тоже) - лучше тут перегнуть палку, чем потом оказаться дураками. Диск на 2 терабайта стоит меньше месячной зарплаты кого угодно. Экономить место это идиотизм.

Не жалко для локального хранения в целях замены подлинника по-максимуму непосредственно в архиве. Для целей выкладки в сети это пока еще сильный перебор.

>А вот дальше началась игра с намеренной порчей информации (водяные знаки)
>А чо такого - нам на пользователей насрать - мы не ощущаем себя сервисом.

>Но поскольку в РФ в таких конторах традиционно платят мало исполнители оказались низкого качества - размер испорченных файлов был в разы больше чем оригинальных.
>Качество картинки осталось норм - без артефактов. Но представители меньшинств не унимались - как результат в 2017 году испорченные карты стали с артефактами.
>Размер в байтах да, поменьше. Но печатать это уже нельзя.

А это как раз возможно следствие пренебрежения к затрачиваемым объемам хранителей. Не жалко. Поэтому и культура работы с электронными картинками во многом испарилась. В прежние времена люди гораздо трепетнее относились к соотношению качество\размер. Вникали в нюансы форматов и тп. А сейчас пофиг. Лепят уродливые книги-дежавю, практически безнадежно уничтожая исходный материал. А в свое время дежавю был большим прорывом, но по месту и по цели.


От apple16
К iggalp (13.02.2018 14:25:22)
Дата 14.02.2018 01:17:58

Дежавю - зло. Хочешь сэкономить место - распознай текст ))

Цель именно такая - пыльный архив не нужен - у него только функция хранения.

Функция распространения полностью уехала в интернет.
Все доступно в максимальном качестве и доступно всем
Именно так сделана Библиотека Конгресса много лет назад - хочешь превьюшку, хочешь максимальный размер чтобы сразу на билборд зашарить.
Совсем не сложно сделать UI который всех устроит.

Это азы работы с информацией - нельзя принимать решения о безвозвратной ее утрате. Нет людей для этого компетентных. Никто не знает, какое будет использование - может пятна грязи на обложке будут важным элементом данных.

Нужно тупо строить эдектронное ЦАМО, где можно скачать PDF дела целиком в читаемом качестве со слоем распознанного текста, где можно. А можно качнуть PDF под печать. И полнотекстовый поиск. Это вообще сделать можно было вчера. Есть куча проектов 10-15 летней давности с этим. (тот же архив Таймс например)
И главное никаких дурацких посредников ))


Дальше поднимать из дел людей, географию и части/соединения. Чтобы по человеку все его упоминания, по локации все карты и тп. Это тоже не сложно, просто трудоемко.
+ Обратная связь нормальная - сервис деск дабы оперативно чинить проблемы.
(я знаю вагон битых карт навроде 213-0002002-1018 и всем пофиг, 1941 с 1944 в индексах попутано в сотне мест)
+ Контроль подлинности оригинала - с базой печатей, штампов и подписей можно валять очень правдоподобные фальшивки

Посканить бумажки это первый этап. А вот дальще что-то пошло не так - занялись непоятной деятельностью.