От Artem Drabkin
К All
Дата 24.10.2011 09:06:33
Рубрики Память;

требуется помощь по сайту "Я помню"

Добрый день,

Как вы знаете все воспоминания сейчас распределены по родам войск. Очень часто нужно найти вопоминание относящееся к тому или иному периоду или битве и сражению. Это можно сделать с помощью облака тегов. То есть в каждой статье нужно прописать в каких битвах участвовал ветеран. Всего на сайте 1100+ статей и я чисто физически не могу их все перечитать и расставить теги. Поэтому я обращаюсь к вам - помогите, давайте сделаем сайт более удобным для чтения вместе.

Форма работы предполагается следующая. Все ключевые слова определены. В гугльдоксе сделан файл со списком интервью, который я расшарю для желающих помочь. Нужно просто на против каждой фамилии вписать те сражения, в которых ветеран участвовал. Потом я это перенесу на сайт.

Добровольцы пишите drabkin@yandex.ru

Артем

Админам просьба прикрепить

Под шумящие колеса песня девки горяча

От TEXOCMOTP
К Artem Drabkin (24.10.2011 09:06:33)
Дата 25.10.2011 23:22:57

Re: требуется помощь...

По-моему идея хорошая и полезная, на первый взгляд не так уж и трудно сделать будет.

Может только надо будет вам составить список битв, чтобы у всех были одинаковые тэги?

Куда писать бобровольцам? :)

От karai2
К Artem Drabkin (24.10.2011 09:06:33)
Дата 24.10.2011 19:15:33

Re: требуется помощь...

>Как вы знаете все воспоминания сейчас распределены по родам войск.

А по родам войск также будет использоваться теги? Ведь переход человека из одного рода войск в другой встречается очень часто.

От SadStar3
К karai2 (24.10.2011 19:15:33)
Дата 25.10.2011 01:14:02

У это человека будет два-три рода войск (-)


От karai2
К SadStar3 (25.10.2011 01:14:02)
Дата 25.10.2011 05:33:01

Еще бы указание частей/соединений в которых воевал ветеран...

...неплохо бы таким образом проиндексировать. Сам столкнулся, когда возникла необходимость найти воспоминания ветеранов одной дивизии. Можно, конечно через поисковик, но это не очень удобно.

Просто, если уж делать такую работу, то чтобы два раза не проходить по всем статьям.

Для полного счастья и по местам боев (названия населенных пунктов, рек и т. п.), но это, как я понимаю, уже перебор...

От Artem Drabkin
К karai2 (25.10.2011 05:33:01)
Дата 25.10.2011 12:50:25

нет. всего будет приблизительно 25 тегов (-)


От SadStar3
К Artem Drabkin (24.10.2011 09:06:33)
Дата 24.10.2011 09:35:55

В тексте страниц есть название бивы в явном виде?

Или нужно вчитываться и по смыслу определять?


Если есть - то процесс можно просто автоматизировать.

От Artem Drabkin
К SadStar3 (24.10.2011 09:35:55)
Дата 24.10.2011 12:02:22

Re: В тексте...

Добрый день,

не всегда в явном виде. Редко кто говорит "Я участвовал в Московской битве" )

Под шумящие колеса песня девки горяча

От agoldin
К Artem Drabkin (24.10.2011 12:02:22)
Дата 25.10.2011 00:35:16

Re: В тексте...

>Добрый день,

>не всегда в явном виде. Редко кто говорит "Я участвовал в Московской битве" )

>Под шумящие колеса песня девки горяча

Я прошелся через несколько и там задача непростая для машинной классификации. Да, для ИИ типа айбиэмовского Ватсона посильная, но проще ручками.

Если будет много добровольцев, было бы полезно выложить некоторые фамилии повторно чтобы оценить качество работы --- поставят ли повторно те же тэги, сколько пропустят, т.д.

От Artem Drabkin
К agoldin (25.10.2011 00:35:16)
Дата 25.10.2011 12:53:56

Re: В тексте...

Добрый день,
>Если будет много добровольцев, было бы полезно выложить некоторые фамилии повторно чтобы оценить качество работы --- поставят ли повторно те же тэги, сколько пропустят, т.д.

Я не думаю что проверка стоит того - ошибки будут неизбежно, но их процент будет невелик. Добровольцев пока меньше 10 ))

Под шумящие колеса песня девки горяча

От agoldin
К Artem Drabkin (25.10.2011 12:53:56)
Дата 25.10.2011 19:07:00

Re: В тексте...

Не беда. По 4-5 воспоминаний в день за месяц другой -- сделаем.

>Я не думаю что проверка стоит того - ошибки будут неизбежно, но их процент будет невелик. Добровольцев пока меньше 10 ))

>Под шумящие колеса песня девки горяча

От Чобиток Василий
К Artem Drabkin (24.10.2011 12:02:22)
Дата 24.10.2011 19:15:21

Re: В тексте...

Привет!
>Добрый день,

>не всегда в явном виде. Редко кто говорит "Я участвовал в Московской битве" )

Все равно можно формализовать и автоматизировать. У меня так из объявлений в газетах про дела о банкротстве (никакой формализации, вольный стиль) заполнялись поля в записях БД.


Предложения, заявления, жалобы есть?
http://armor.kiev.ua/

От Artem Drabkin
К Чобиток Василий (24.10.2011 19:15:21)
Дата 25.10.2011 12:52:38

не уверен

Добрый день,

и главное не понятно кто это будет писать )

>Привет!
>>Добрый день,
>
>>не всегда в явном виде. Редко кто говорит "Я участвовал в Московской битве" )
>
>Все равно можно формализовать и автоматизировать. У меня так из объявлений в газетах про дела о банкротстве (никакой формализации, вольный стиль) заполнялись поля в записях БД.


>Предложения, заявления, жалобы есть?
http://armor.kiev.ua/
Под шумящие колеса песня девки горяча

От Чобиток Василий
К Artem Drabkin (25.10.2011 12:52:38)
Дата 26.10.2011 02:18:55

Re: не уверен

Привет!
>Добрый день,

>и главное не понятно кто это будет писать )

20-30 статей, в которых человек, занимавшийся классификацией, выделяет ключевое место (не надо слово, можно предложение-абзац) цветом (зеленым, например) и в комментарии вписывает присвоенный тег.

Дальнейшее - дело техники (могу адаптировать свой банкротский скрипт).

Предложения, заявления, жалобы есть?
http://armor.kiev.ua/

От Чобиток Василий
К Чобиток Василий (26.10.2011 02:18:55)
Дата 26.10.2011 02:21:56

Re: не уверен

Привет!

>20-30 статей, в которых человек, занимавшийся классификацией, выделяет ключевое место (не надо слово, можно предложение-абзац) цветом (зеленым, например) и в комментарии вписывает присвоенный тег.

Или, если всего 25 тегов, для каждого тега несколько (чем больше, тем лучше) фраз из текста, по которым был опознан тег. Фразы лучше длиннее, чем короче (законченные предложения).

Предложения, заявления, жалобы есть?
http://armor.kiev.ua/