История современного мира пишется в соцсетях миллиардами голосов — комментирующими и репостящими, жалующимися, обвиняющими и пишущими о войне, котиках, политике, музыке, еде, смертельных заболеваниях, спорте, религии и сексе. Storywrangler позволяет понять — на основе точных данных, что думают и о чем говорят люди, а не то, что отобрали репортеры или авторы, сообщает Science Daily. То есть он не только беспристрастно определяет тренды, но и точно предсказывает их развитие.
Разработчики из Университета Вермонта сравнивают свое изобретение с телескопом, в который можно рассмотреть в реальном времени все то, что люди выкладывают в соцсети. Инструмент разбивает твиты на отдельные кусочки, высчитывая повторяемость среди триллиона слов, хештегов, символов и эмодзи, таких как «суперкубок», «гравитационные волны», «#metoo», «коронавирус» или «кето-диета».
«Это первый инструмент визуализации, который позволяет взглянуть на слова и фразы из 150 языков с момента появления Твиттера и до нашего времени», — сказала Джейн Адамс, соавтор исследования.
Storywrangler, работающий на суперкомпьютере университета, делает, по мнению разработчиков, важный срез дискурса современного общества. Хотя пользователи Твиттера не представляют все человечество, они являются достаточно крупной и разнообразной группой людей, чтобы программа давала релевантный результат. При этом инструмент озвучивает мнение обычных людей, не знаменитостей или политиков.
В одном из испытаний Storywrangler разработчики доказали, что его можно применять для прогнозирования политических волнений или финансовых неурядиц. Для этого авторы изучили изменение в частоте употребления слов «восстание» и «подавление» в различных регионах мира. И обнаружили, что рост или спад количества этих терминов коррелирует с изменением индекса геополитического риска именно в этих областях.
«Это часть эволюции в науке, — сказал Питер Додс, эксперт по комплексным системам из Вермонтского университета. — Этот инструмент делает возможным новые подходы в журналистике, действенные пути использования технологии обработки естественного языка и разработку вычислительной истории».