Если это так и Вам не сложно - распознайте его до .doc.
Трудозатрат тут минимум - засунуть пакет в FineReader, запустить автораспознавание и сохранить результат. Вычищать не нужно.
Если получится - буду очень благодарен.
С уважением
Объем обрабатываемого материала можно слегка уменьшить, если не заниматься таблицами, в которых отражено субъективное мнение авторов с оценкой по системе плюсов-минусов.
Да и прочие таблицы, содержащие казалось бы объективную информацию, не безупречны. Я поупражнялся с таблицей распределения авиаполков (до остального пока руки не доходят), так там элементарно не сходятся суммы в рядах и колонках.