Математики прогнозируют итоги медального зачета Олимпиады в Сочи на основании экономики и географии. Россию ставят на четвертое место
На чем основываются спортивные эксперты, чиновники и журналисты, предсказывая количество олимпийских медалей, которые российская сборная получит на открывающейся сегодня домашней олимпиаде? Некоторые – на реальной оценке готовности спортсменов, их результатах в последних крупных соревнованиях и положении в мировом рейтинге. Для кого-то предсказать количество наград – акт патриотизма, кто-то боится сглазить, а кто-то лишиться должности в случае неудачи. А вот основателям американской дата-майнинговой компании Discovery Corp, братьям Дэну и Тиму Грэттингерам бояться нечего, они спрогнозировали медальный рейтинг Олимпиады в Сочи исходя исключительно из математической модели, использующей макроскопические показатели стран – участниц Игр.
Аналитики, привычная деятельность которых заключается в прогнозировании экономического будущего компаний на основе данных об их настоящем и прошлом, решили применить тот же математический инструментарий к олимпийским достижениям. Грэттингеры подчеркивают, что, хотя подробный анализ спортивных результатов и функционального состояния отдельных атлетов мог бы сделать прогноз более точным, они намеренно решили взглянуть на более глобальную картину.
Изначально исследователи включили в модель около 50 макропоказателей, объединенных в несколько групп: экономика, население, человеческое развитие, география, религия, политика и права человека, а также национальные результаты на предыдущих (летних и зимних) Олимпийских играх. На первом этапе Грэттингеры поставили перед собой упрощенную задачу: выяснить, какие индикаторы в большей степени влияют на способность страны выиграть хотя бы одну олимпийскую медаль. Анализ результатов нескольких последних Игр показал, что точнее всего спрогнозировать вероятность того, что страна выиграет медаль на зимней Олимпиаде, можно по результатам предыдущих летних Олимпийских игр. В частности, каждая из стран, получивших медали зимних Олимпиад в Ванкувере-2010 и Турине-2006, была в числе призеров проходивших за два года до этого летних Игр (разумеется, здесь играет роль и то, что призеров летних Игр всегда намного больше, чем зимних). Среди других индикаторов, которые, как показала статистика, релевантны шансам на получение хотя бы одной медали, оказались уровень миграции, количество врачей на тысячу жителей, географическая широта расположения столицы, объем национального экспорта и некоторые показатели объема внутреннего валового продукта. Соответствующим образом модифицировав модель и ретроспективно применив ее к уже прошедшим олимпийским соревнованиям, исследователи смогли добиться 96,5-процентной достоверности прогноза на получение страной хотя бы одной олимпийской медали.
К Олимпийским играм в Сочи Грэттингеры решили усложнить задачу и попробовать оценить общее количество наград, которые сможет выиграть каждая из стран-участниц. Ключевыми показателями в математической модели линейной регрессии оказались площадь территории, ВВП на душу населения, объем экспорта и географическая широта расположения столицы. Кстати, изначально авторы предполагали, что существенным индикатором окажется не площадь территории, а население. “Вероятно, территория оказалась более существенной, потому что от ее площади зависит генетическое разнообразие населения, наличие в стране разнообразных климатических зон и гор”, – отмечает Дэн Грэттингер. Важность экономических показателей не вызывает вопросов – от них зависит способность страны развивать большое количество видов спорта и готовить спортсменов на высоком уровне. Широта расположения столицы тоже возникла в этом списке не случайно – ясно, что чем ближе страна к экватору, тем меньше развиты в ней зимние виды спорта. Кстати, за всю историю зимних Олимпийских игр атлеты из стран Африки, Южной Америки и Среднего Востока не смогли выиграть ни одной награды.
В итоговой таблице, полученной на основе этих индикаторов математическими методами, первое место занимают США, спортсмены этой страны получат по прогнозу ученых 29 медалей различных достоинств. На втором месте – Германия с 23 медалями, затем Китай (22 медали). Россия расположилась на четвертом месте с 19 наградами всех достоинств, а замыкает пятерку сборная Канады – 18 медалей. Всего на олимпийские награды в этом году могут претендовать спортсмены 27 стран, список замыкает Украина, которой американские аналитики отдают всего одну медаль.
Напомним, что в Ванкувере в 2010 году российская сборная получила всего 15 медалей – на 4 меньше прогноза этого года и на целых 6 медалей меньше, чем предсказывала ретроспективно примененная к 2010 году модель Грэттингеров. А в 2006 году россияне выиграли 22 медали, превысив соответствующий прогноз на 5 наград. Вообще говоря, результаты предыдущих лет показывают, что модель американских исследователей далека от совершенства, впрочем, ее ошибки почти всегда объяснимы обстоятельствами, которые сложно учесть на уровне макропоказателей. Австрия, Норвегия и Канада всегда выступали заметно сильнее, чем предполагает модель Грэттингеров. Кстати, Норвегия и Австрия занимают первое и третье места соответственно по количеству наград зимних Олимпиад за все время проведения Игр. В последние годы регулярно обгоняет прогноз Южная Корея – в основном за счет большого количества наград в различных дисциплинах шорт-трека. А вот Великобритания традиционно отстает от предсказаний математики. Несмотря на достаточно большую площадь, удаленность Лондона от экватора и высокие экономические показатели страны, британские спортсмены выступают на зимних Олимпиадах слабо, вероятно, из-за особенностей климата на острове и отсутствия достаточно высоких гор.
Грэттингеры – не единственные исследователи, попытавшиеся на основе статистики и национальных макропоказателей спрогнозировать количество олимпийских медалей. Похожие модели использовал экономист Дэниэль Джонсон, которому удавалось предсказывать количество наград сборной США на пяти Олимпиадах, от Сиднея-2000 до Пекина-2008, с невероятной точностью 97 процентов. Другому исследователю, Эндрю Бернарду, приходилось предсказывать олимпийские медальные зачеты почти так же хорошо – с точностью 96 процентов. Работы обоих ученых подвергались критике, математически их методы не имели достаточной статистической значимости, а значит, точность прогнозов во многом была следствием простого везения.
Ни Джонсон, ни Бернард не стали предсказывать результаты Олимпиады в Сочи, но на их место пришли другие энтузиасты. Кроме братьев Грэттингеров это, например, французы Мадлен и Владимир Андрефф, включившие в свою модель множество дополнительных “тонких” параметров, таких как число горнолыжных курортов в стране. Вот их прогноз первой пятерки сочинского медального зачета: США – 36 медалей, Германия – 28, Канада – 27, Россия – 24, Норвегия – 24, Австрия – 15. Россия, как и в таблице Грэттингеров, на 4-м месте (хотя и с более высоким результатом, 24 награды вместо 19), а Китай, который американцы ставят на третье место, в число лидеров французского прогноза вовсе не попал.
Конечно, ориентироваться на статистические прогнозы так же недальновидно, как верить предсказаниям патриотически настроенных чиновников. Математика может оценить влияние на результат макроскопических трендов, географии и экономики, климата, количества горнолыжных курортов, но совершенно не способна учесть психологические факторы. А значит, российским болельщикам особенно не стоит обращать внимание на статистические прогнозы, психологическое состояние российских спортсменов, да еще на домашней Олимпиаде, наверняка окажется важнее, чем ВВП, территория и даже их собственные результаты на предыдущих соревнованиях.
Аналитики, привычная деятельность которых заключается в прогнозировании экономического будущего компаний на основе данных об их настоящем и прошлом, решили применить тот же математический инструментарий к олимпийским достижениям. Грэттингеры подчеркивают, что, хотя подробный анализ спортивных результатов и функционального состояния отдельных атлетов мог бы сделать прогноз более точным, они намеренно решили взглянуть на более глобальную картину.
Изначально исследователи включили в модель около 50 макропоказателей, объединенных в несколько групп: экономика, население, человеческое развитие, география, религия, политика и права человека, а также национальные результаты на предыдущих (летних и зимних) Олимпийских играх. На первом этапе Грэттингеры поставили перед собой упрощенную задачу: выяснить, какие индикаторы в большей степени влияют на способность страны выиграть хотя бы одну олимпийскую медаль. Анализ результатов нескольких последних Игр показал, что точнее всего спрогнозировать вероятность того, что страна выиграет медаль на зимней Олимпиаде, можно по результатам предыдущих летних Олимпийских игр. В частности, каждая из стран, получивших медали зимних Олимпиад в Ванкувере-2010 и Турине-2006, была в числе призеров проходивших за два года до этого летних Игр (разумеется, здесь играет роль и то, что призеров летних Игр всегда намного больше, чем зимних). Среди других индикаторов, которые, как показала статистика, релевантны шансам на получение хотя бы одной медали, оказались уровень миграции, количество врачей на тысячу жителей, географическая широта расположения столицы, объем национального экспорта и некоторые показатели объема внутреннего валового продукта. Соответствующим образом модифицировав модель и ретроспективно применив ее к уже прошедшим олимпийским соревнованиям, исследователи смогли добиться 96,5-процентной достоверности прогноза на получение страной хотя бы одной олимпийской медали.
К Олимпийским играм в Сочи Грэттингеры решили усложнить задачу и попробовать оценить общее количество наград, которые сможет выиграть каждая из стран-участниц. Ключевыми показателями в математической модели линейной регрессии оказались площадь территории, ВВП на душу населения, объем экспорта и географическая широта расположения столицы. Кстати, изначально авторы предполагали, что существенным индикатором окажется не площадь территории, а население. “Вероятно, территория оказалась более существенной, потому что от ее площади зависит генетическое разнообразие населения, наличие в стране разнообразных климатических зон и гор”, – отмечает Дэн Грэттингер. Важность экономических показателей не вызывает вопросов – от них зависит способность страны развивать большое количество видов спорта и готовить спортсменов на высоком уровне. Широта расположения столицы тоже возникла в этом списке не случайно – ясно, что чем ближе страна к экватору, тем меньше развиты в ней зимние виды спорта. Кстати, за всю историю зимних Олимпийских игр атлеты из стран Африки, Южной Америки и Среднего Востока не смогли выиграть ни одной награды.
В итоговой таблице, полученной на основе этих индикаторов математическими методами, первое место занимают США, спортсмены этой страны получат по прогнозу ученых 29 медалей различных достоинств. На втором месте – Германия с 23 медалями, затем Китай (22 медали). Россия расположилась на четвертом месте с 19 наградами всех достоинств, а замыкает пятерку сборная Канады – 18 медалей. Всего на олимпийские награды в этом году могут претендовать спортсмены 27 стран, список замыкает Украина, которой американские аналитики отдают всего одну медаль.
Напомним, что в Ванкувере в 2010 году российская сборная получила всего 15 медалей – на 4 меньше прогноза этого года и на целых 6 медалей меньше, чем предсказывала ретроспективно примененная к 2010 году модель Грэттингеров. А в 2006 году россияне выиграли 22 медали, превысив соответствующий прогноз на 5 наград. Вообще говоря, результаты предыдущих лет показывают, что модель американских исследователей далека от совершенства, впрочем, ее ошибки почти всегда объяснимы обстоятельствами, которые сложно учесть на уровне макропоказателей. Австрия, Норвегия и Канада всегда выступали заметно сильнее, чем предполагает модель Грэттингеров. Кстати, Норвегия и Австрия занимают первое и третье места соответственно по количеству наград зимних Олимпиад за все время проведения Игр. В последние годы регулярно обгоняет прогноз Южная Корея – в основном за счет большого количества наград в различных дисциплинах шорт-трека. А вот Великобритания традиционно отстает от предсказаний математики. Несмотря на достаточно большую площадь, удаленность Лондона от экватора и высокие экономические показатели страны, британские спортсмены выступают на зимних Олимпиадах слабо, вероятно, из-за особенностей климата на острове и отсутствия достаточно высоких гор.
Грэттингеры – не единственные исследователи, попытавшиеся на основе статистики и национальных макропоказателей спрогнозировать количество олимпийских медалей. Похожие модели использовал экономист Дэниэль Джонсон, которому удавалось предсказывать количество наград сборной США на пяти Олимпиадах, от Сиднея-2000 до Пекина-2008, с невероятной точностью 97 процентов. Другому исследователю, Эндрю Бернарду, приходилось предсказывать олимпийские медальные зачеты почти так же хорошо – с точностью 96 процентов. Работы обоих ученых подвергались критике, математически их методы не имели достаточной статистической значимости, а значит, точность прогнозов во многом была следствием простого везения.
Ни Джонсон, ни Бернард не стали предсказывать результаты Олимпиады в Сочи, но на их место пришли другие энтузиасты. Кроме братьев Грэттингеров это, например, французы Мадлен и Владимир Андрефф, включившие в свою модель множество дополнительных “тонких” параметров, таких как число горнолыжных курортов в стране. Вот их прогноз первой пятерки сочинского медального зачета: США – 36 медалей, Германия – 28, Канада – 27, Россия – 24, Норвегия – 24, Австрия – 15. Россия, как и в таблице Грэттингеров, на 4-м месте (хотя и с более высоким результатом, 24 награды вместо 19), а Китай, который американцы ставят на третье место, в число лидеров французского прогноза вовсе не попал.
Конечно, ориентироваться на статистические прогнозы так же недальновидно, как верить предсказаниям патриотически настроенных чиновников. Математика может оценить влияние на результат макроскопических трендов, географии и экономики, климата, количества горнолыжных курортов, но совершенно не способна учесть психологические факторы. А значит, российским болельщикам особенно не стоит обращать внимание на статистические прогнозы, психологическое состояние российских спортсменов, да еще на домашней Олимпиаде, наверняка окажется важнее, чем ВВП, территория и даже их собственные результаты на предыдущих соревнованиях.