В сфере гуманитарных исследований стремительно формируется новое научное направление – культуромика. Ее рождение стало возможно благодаря появлению в машиночитаемой форме огромного числа культурно значимых текстов.
1.
На обложке свежего номера журнала Science помещена фотография огромной ротонды, целиком сложенной из книг. Это инсталляция под названием "Идиома", созданная скульптором Матеем Креном в Пражской муниципальной библиотеке. Журнал Science выбрал ее для иллюстрации нового научного направления — культуромики, которое стремительно формируется в сфере гуманитарных исследований. Рождение культуромики стало возможно благодаря появлению в машиночитаемой форме огромного числа культурно значимых текстов.
Интернет-сервис "Гугл.Книги" содержит более 5 миллионов книг – это 4% от всего, что было когда-либо издано. В этих книгах насчитывается почти 500 миллиардов слов. (В силу ограничений авторского права многие из этих книг доступны только для поисковых запросов и ограниченного просмотра найденных фрагментов, однако исследователи могут работать с полными текстами книг.) Другой огромный массив текстов – Википедия, содержащая только на английском языке 3,5 миллиона статей. Компьютерный анализ этих текстов позволяет объективными математическими методами исследовать вопросы, которые ранее были доступны только для гуманитарных подходов.
2.
Одна из первых работ в сфере культуромики выполнена весьма разносторонней командой, включающей биологов, психологов, физиков, специалистов по теории эволюции и искусственному интеллекту, сотрудников энциклопедии "Британика" и проекта "Гугл.Книги". Результаты исследований, опубликованные в журнале Science, показывают, например, как меняется во времени лексикон английского языка. В 1900 году он насчитывал 540 тысяч слов, в середине века – 600 тысяч, а к 2000 году перевалил за миллион слов, используемых в литературной речи. Для сравнения, крупнейший словарь Вебстера насчитывает сейчас лишь 350 тысяч английских слов. То есть, большинство слов живого литературного языка ускользают от лингвистов.
Среди других результатов исследования: прослеживание эволюции грамматики, выявление подъемов и спадов внимания к различным объектами и понятиям, но, пожалуй, самое интересное – это возможность обнаружения деятельности цензуры. Авторы приводят пример художника Марка Шагала. В немецких текстах упоминание его имени быстро нарастает до конца второго десятилетия прошлого века, а начинает затем падает. Минимум достигается в период с 1936 по 1944 год, когда немецкая цензура была особенно жесткой. Для сравнения в англоязычных книгах его упоминание все это время почти равномерно растет. Аналогичные процессы легко прослеживаются и в других языках. Например, показателен график упоминания имен Троцкого, Зиновьева и Каменева в русскоязычных книгах: резкий спад, начиная с 1940 года и подъем почти до прежнего уровня в конце 1980-х. В китайской литературе хорошо заметен провал в упоминания площади Тянаньмынь. Эти хорошо известные примеры цензуры легко обнаруживаются на графиках, что открывает возможность поиска новых, еще невыявленных исторических случаев цензуры в разных странах и культурах.
3.
Еще одно интереснейшее исследование области культуромики публикуется на сайте журнала Science. Авторы работы построили шкалу научной славы, определив имена ученых, которые чаще всего упоминаются в литературе. Оказалось, что за последние полтора века в 2% англоязычных книг упоминается имя Чарлза Дарвина, причем его популярность в последнее время растет. В 2000 году Дарвин упоминался в каждой 25-й книге на английском языке. Авторы исследования вводят для научной славы единицу измерения – 1 дарвин. Они отмечают, что даже тысячная ее доля – 1 миллидарвин – весьма значительная величина. Интересно, что Альберт Эйнштейн, который считается наиболее популярным в массовой культуре образом ученого, уступает Дарвину. Слава Эйнштейна составляет 878 миллидарвинов.
4.
На основе своего анализа исследователи сформулировали четыре рекомендации ученым, желающим прославиться в веках:
– занимайтесь социальными науками, а не математикой – они больше интересуют публику;
– делайте важные исследования, а не гоняйтесь за индексом цитирования – слава Эдварда Виттена, самого цитируемого физика нашего времени составляет всего 8 миллидарвинов;
– пишите научно-популярные книги – такие популяризаторы как Айзек Азимов, Карл Саган и Ричард Докинз уверенно набирают 100-200 миллидарвинов;
– выступайте с неоднозначными, спорными идеями – в пользу этого совета говорит пример самого Дарвина.
Впрочем, эти рекомендации сами довольно неоднозначны. Из всех ученых только один превзошел по славе Дарвина. И это был математик Бертран Рассел. Его упоминают в полтора раза чаще. Однако авторы исследования справедливо отмечают, что слава досталась Расселу все же не как математику, а как философу-рационалисту.
1.
На обложке свежего номера журнала Science помещена фотография огромной ротонды, целиком сложенной из книг. Это инсталляция под названием "Идиома", созданная скульптором Матеем Креном в Пражской муниципальной библиотеке. Журнал Science выбрал ее для иллюстрации нового научного направления — культуромики, которое стремительно формируется в сфере гуманитарных исследований. Рождение культуромики стало возможно благодаря появлению в машиночитаемой форме огромного числа культурно значимых текстов.
Интернет-сервис "Гугл.Книги" содержит более 5 миллионов книг – это 4% от всего, что было когда-либо издано. В этих книгах насчитывается почти 500 миллиардов слов. (В силу ограничений авторского права многие из этих книг доступны только для поисковых запросов и ограниченного просмотра найденных фрагментов, однако исследователи могут работать с полными текстами книг.) Другой огромный массив текстов – Википедия, содержащая только на английском языке 3,5 миллиона статей. Компьютерный анализ этих текстов позволяет объективными математическими методами исследовать вопросы, которые ранее были доступны только для гуманитарных подходов.
2.
Одна из первых работ в сфере культуромики выполнена весьма разносторонней командой, включающей биологов, психологов, физиков, специалистов по теории эволюции и искусственному интеллекту, сотрудников энциклопедии "Британика" и проекта "Гугл.Книги". Результаты исследований, опубликованные в журнале Science, показывают, например, как меняется во времени лексикон английского языка. В 1900 году он насчитывал 540 тысяч слов, в середине века – 600 тысяч, а к 2000 году перевалил за миллион слов, используемых в литературной речи. Для сравнения, крупнейший словарь Вебстера насчитывает сейчас лишь 350 тысяч английских слов. То есть, большинство слов живого литературного языка ускользают от лингвистов.
Примеры цензуры легко обнаруживаются на графиках, что открывает возможность поиска новых, еще невыявленных исторических случаев цензуры в разных странах и культурах
Среди других результатов исследования: прослеживание эволюции грамматики, выявление подъемов и спадов внимания к различным объектами и понятиям, но, пожалуй, самое интересное – это возможность обнаружения деятельности цензуры. Авторы приводят пример художника Марка Шагала. В немецких текстах упоминание его имени быстро нарастает до конца второго десятилетия прошлого века, а начинает затем падает. Минимум достигается в период с 1936 по 1944 год, когда немецкая цензура была особенно жесткой. Для сравнения в англоязычных книгах его упоминание все это время почти равномерно растет. Аналогичные процессы легко прослеживаются и в других языках. Например, показателен график упоминания имен Троцкого, Зиновьева и Каменева в русскоязычных книгах: резкий спад, начиная с 1940 года и подъем почти до прежнего уровня в конце 1980-х. В китайской литературе хорошо заметен провал в упоминания площади Тянаньмынь. Эти хорошо известные примеры цензуры легко обнаруживаются на графиках, что открывает возможность поиска новых, еще невыявленных исторических случаев цензуры в разных странах и культурах.
3.
Еще одно интереснейшее исследование области культуромики публикуется на сайте журнала Science. Авторы работы построили шкалу научной славы, определив имена ученых, которые чаще всего упоминаются в литературе. Оказалось, что за последние полтора века в 2% англоязычных книг упоминается имя Чарлза Дарвина, причем его популярность в последнее время растет. В 2000 году Дарвин упоминался в каждой 25-й книге на английском языке. Авторы исследования вводят для научной славы единицу измерения – 1 дарвин. Они отмечают, что даже тысячная ее доля – 1 миллидарвин – весьма значительная величина. Интересно, что Альберт Эйнштейн, который считается наиболее популярным в массовой культуре образом ученого, уступает Дарвину. Слава Эйнштейна составляет 878 миллидарвинов.
4.
На основе своего анализа исследователи сформулировали четыре рекомендации ученым, желающим прославиться в веках:
– занимайтесь социальными науками, а не математикой – они больше интересуют публику;
– делайте важные исследования, а не гоняйтесь за индексом цитирования – слава Эдварда Виттена, самого цитируемого физика нашего времени составляет всего 8 миллидарвинов;
– пишите научно-популярные книги – такие популяризаторы как Айзек Азимов, Карл Саган и Ричард Докинз уверенно набирают 100-200 миллидарвинов;
– выступайте с неоднозначными, спорными идеями – в пользу этого совета говорит пример самого Дарвина.
Впрочем, эти рекомендации сами довольно неоднозначны. Из всех ученых только один превзошел по славе Дарвина. И это был математик Бертран Рассел. Его упоминают в полтора раза чаще. Однако авторы исследования справедливо отмечают, что слава досталась Расселу все же не как математику, а как философу-рационалисту.