ПРЕДСКАЗАНИЕ ВОЙН ПО КРУПНЕЙШЕЙ БАЗЕ СОБЫТИЙ
Когда закончится военный конфликт в Сирии? Начнется ли война на Корейском полуострове?
Даже лучшие умы не могут ответить на эти вопросы, но создаются компьютерные алгоритмы, которые способны помочь военным аналитикам в обработке больших
массивов информации.
И самое главное — создается база данных, которая вмещает в себя все факты, могущие иметь отношение к развитию конфликтов.
Журнал New Scientist пишет о создании
базы данных GDELT (Global Data on Events, Location and Tone), которая уже содержит почти 250 миллионов событий, начиная с 1979 года, и ежедневно пополняется на 100 000 новых.
Программа сканирует ленты информационных агентств Associated Press, Agence France Presse (Франция), Xinhua (главное информационное агентство
Китая) и многие другие.
Вместе они покрывают новости всех стран.
Программное обеспечение способно автоматически анализировать текст каждой информационной заметки и извлекать из него фактуру, распознавая значимые объекты.
Например, если в тексте содержится фраза «Суданские студенты и полиция вступили в противостояние в египетской столице», то сообщение кодируется как
“SUDEDU fought COP”.
Затем система ищет упоминание города или местности в тексте (Каир) и добавляет в базу данных его координаты.
За счет такого кодирования система устраняет дублирование информации, когда одна и та же новость проходит через множество информационных агентств.
События в Сирии, отфильтрованные по наличию насилия, наглядно показывают, как разгорался конфликт в 2011-2012 гг
Создатели базы данных Калев Литару из Иллинойского университета в Урбане-Шампейне и Пол Шродт из Государственного университета Пенсильвании говорят, что впервые в истории создали базу данных подобного масштаба.
Теперь они собираются расширить выборку вплоть до 1800 года. Источник:
Xakep.ru - https://www.xakep.ru/post/60602/
Опубликовано:
17.05.2013
|