Ученые создали программу, которая, основываясь на материалах СМИ, сможет предупреждать о грядущих вспышках эпидемии или насилия. Анализируя уже произошедшие события, система пытается выявить общие закономерности между ними и предсказать, что произойдет в недалеком будущем. Прототип ПО создали исследователь Эрик Хоровиц из Microsoft Research и Кира Радински, сотрудница Техниона (Израильского технологического института).
По словам Хоровица, их система построена на архиве газеты The New York Times за 22 года (с 1986 по 2007), а также множестве онлайн-источников, включая DBpedia, которая структурирует информацию из "Википедии", WordNet, помогающая программным алгоритмам понять значение слов, и открытую "базу знаний" OpenCyc. Всего ПО задействует свыше 90 источников, пишет Technology Review.
Систему успешно опробовали на реальных событиях. В некоторых тестах точность предсказания составила от 70 до 90%. К примеру, анализируя новости о наводнении в Анголе в 2006 году, ПО верно предупредило о подступающей эпидемии холеры. Еще одно предупреждение о распространении болезни в Анголе последовало после анализа новостей о крупном шторме в Африке в начале 2007 года.
Благодаря массе разных источников система "видит" контекст, недоступный при чтении одной только прессы. Например, она смогла выявить связь между событиями в Руандой и Анголой, зная, что оба государства находятся в Африке, имеют схожий ВВП, плотность заселения, долю земли, покрытую водой, была ли засуха в прошлом году и другие факторы.
Проект создается при поддержке Microsoft, но компания пока не планирует делать из него коммерческий продукт. Чтобы система предугадала тему завтрашних новостей еще точнее, Хоровиц и Радински планируют включить в нее больше источников, включая архивы других газет и оцифрованные книги.