Группа итальянских и американских ученых разработала математическую модель, которая описывает универсальные законы, регулирующие вероятность появления инноваций. Работа сообщает о новом подходе к изучению взаимодействия потенциальных возможностей с существующей реальностью, благодаря чему и совершаются новые открытия. Препринт статьи выложен в архиве Корнуэльского университета.
Процесс появления открытий и инноваций — малоизученная область, хотя выявление факторов, способствующих ему, помогло бы оптимизировать условия научно-технического прогресса в будущем. Попытки многих исследователей, от экономистов и инженеров до биологов и антропологов, изучающих вероятность появления инноваций, не достигли большого успеха. Частота возникновения инноваций тщательно измерена — она следует хорошо изученным шаблонам, которые наблюдаются во многих не связанных между собой областях; тем не менее, до сих пор никто не смог объяснить их природу.
Представление о том, что инновации возникают при взаимодействии существующей и возможной реальностей, было впервые формализовано Стюартом Кауффманом. В книге, вышедшей в 2002 году, Кауффман ввел понятие «смежной возможности» в контексте биологической эволюции и теории эволюционного усложнения. Смежные возможности — идеи, слова, песни, молекулы, технологии и так далее — находятся в одном шаге от уже известных существующих аналогов и могут быть получены постепенным изменением или рекомбинацией имеющихся сущностей. Они соединяют фактическую реализацию конкретного феномена с множеством альтернативных неисследованных возможностей. При каждом новом открытии пространство смежных возможностей только расширяется.
Однако модель смежных возможностей довольно сложно формализовать, поскольку альтернативные возможности включают как ожидаемые и «представимые», так и полностью неожиданные. Если первые можно смоделировать, то формализовать вторые практически нереально. Более того, каждая инновация влечет за собой изменения в поле будущих возможностей, то есть пространство неисследованных смежных возможностей тоже постоянно меняется.
Тем не менее, при всей своей сложности процесс возникновения инноваций следует предсказуемым и легко измеримым эмпирическим закономерностям, наблюдаемым во многих областях знания. Например, одна из них встречается в лингвистике: закон Хипса говорит о том, что число различных слов в тексте с ростом длины анализируемого текста растет примерно как квадратный корень от числа слов в тексте. Параметры роста зависят от конкретного случая; например, для англоязычного корпуса показано, что рост идет со степенью из промежутка 0,4–0,6.
Другая хорошо известная эмпирическая закономерность — закон Ципфа — описывает распределение частоты встречаемости в речи слов естественного языка (то есть говорит о взаимосвязи частоты появления нового слова и его популярности): в произвольном тексте самое частотное слово встречается примерно в два раза чаще второго по частотности слова, и так далее. Так, в английском языке самое частотное слово — артикль «the» — составляет примерно 7 процентов всех слов в тексте, следующий по частоте предлог «of» — примерно 3,5 процента, и так далее. Закон Ципфа работает в различных областях, например, аналогичное распределение частот наблюдается при появлении новых статей и правок в «Википедии» или при прослушивании музыки онлайн.
Упомянутые примеры — это эмпирические закономерности, полученные в результате измерений. Целью новой работы стало построение математической модели, способной воспроизвести распределение, полученное эмпирическим путем.
В качестве основы ученые взяли математическую модель, известную под названием урны Пойа: урна заполнена разноцветными шарами, из нее последовательно достают по одному шару и возвращают его в урну вместе с некоторым количеством шаров такого же цвета, увеличивая вероятность вытягивания шара этого цвета в будущем.
Математики подсчитали распределение шаров разного цвета в урне с течением времени — оказалось, что оно соответствует законам Хипса и Ципфа, то есть модель действительно воспроизводит эмпирические наблюдения, которые встречаются в реальном мире. Модель аккуратно предсказывает частоту правок «Википедии», возникновение ссылок в социальных сетях, частоту появления новых слов в текстах и прослушивания новых музыкальных треков в музыкальных онлайн-каталогах.
Интересно, что модель объединяет две разные формы открытий: с одной стороны, это могут быть уже известные явления, новые лишь для конкретного человека (например, песня в онлайн-каталоге), с другой — ранее не существовавшие, такие как новые правки в «Википедии». Математики назвали первые новинками (novelties), а вторые — инновациями (innovations), и оказалось, что модель корректно учитывает оба феномена: похоже, что процесс обнаружения новинок аналогичен процессу возникновения инноваций из поля смежных возможностей.
Ученые отмечают, что их модель обеспечивает совершенно новый подход к изучению инноваций и событий, способных вызвать появление чего-то нового. Полученные результаты могут стать отправной точкой для более глубокого понимания смежных возможностей и природы событий, влекущих за собой инновации в биологии, лингвистике, культуре и технологиях.
Надежда Бессонова