Руководитель Института высоких технологи, доктор физ-мат наук, профессор БФУ им. И. Канта Артем Юров представляет авторскую колонку о галактическом киберпространстве.
Аннотация
Глядя на звездное небо, мы ощущаем свою ничтожность в масштабах Вселенной. Кажется, что эти расстояния никогда не покорятся человеку и всегда будут высится над нами недостижимой громадой... Но так ли это? Посмотрев фильм «Трон: Наследие» (уже старый — 2010 года, но забавный) я задал себе вопрос: допустим мы оказались бы, подобно Сэму и Кевину Флиннам, внутри киберпространства (или инфосферы — другое название той же сущности), но не того, которое создано на компьютерах по сюжету, а в реально существующем, «нашем» киберпространстве 2025 года. Насколько велико оно будет для нас, если воспользоваться некоторыми реалистичными приближениями? Ответ меня буквально потряс: наше реальное киберпространство, для гипотетических внутренних наблюдателей имеет характерный размер ГАЛАКТИКИ! Более того, в ближайшие 20 лет, киберпространтсво разрастется до размеров наблюдаемой вселенной! Взрыв мозга и это не шутка: в сфере информационных технологий мы уже давно «творим на звездных и галактических масштабах»! Чтобы поделиться с вами своим изумлением и восторгом я и написал это эссе.
Предисловие
В книге¹ я встретил поразительный абзац:
«Если бы вы записали вручную всю информацию, содержащуюся в одном мегабайте, то ваша строка из 1 и 0 превысила бы по высоте гору Эверест. Последовательность 1 и 0, составляющая 1 гигабайт, записанная вручную, соответствует длине земного экватора. А длина записанной последовательности цифр, составляющих один терабайт, равна расстоянию от Земли до Сатурна, пройденному туда и обратно 25 раз. Длина последовательности в один петабайт, записанной вручную, равна расстоянию туда и обратно до космического аппарата «Вояджер-1» (самого удаленного от Земли аппарата, созданного человечеством). Длина последовательности в один экзабайт равна расстоянию до альфы Центавра. Длина последовательности в 5 зеттабайт, создаваемых людьми каждый год, равна расстоянию до галактического центра Млечного Пути. Если бы вместо отправки электронных писем и трансляции видео эти пять зеттабайт использовались для той же цели, что и у древних пастухов — то есть для подсчета овец, — то их стадо полностью заполнило бы всю Вселенную, не оставив свободного пространства». |
Воистину Big Data — это БОЛЬШИЕ ДАННЫЕ. Ниже я представляю простые расчеты, которые я сделал, с одной стороны, чтобы проверить поразившее меня утверждение Эйдена-Мишеля, а с другой чтобы поискать другие красивые примеры. Ниже представлен отчет. Несмотря на бухгалтерскую сухость, этот текст представляется мне одним из самых поразительных текстов, какой я когда-либо писал. Как вы увидите, в киберпространстве (или инфосфере) мы давно стали галактической цивилизацией, регулярно запускающей межзвездные экспедиции! Воистину, никто не осознает масштаба времени в котором живет!
Поговорим о числах
Поскольку речь пойдет о больших числах, неплохо как-то их визуализировать, а для этого стоит использовать наглядные для всех примеры.
Начнем с самой огромной горы нашей планеты. Высота Эвереста 8 848 метра, т.е. 0.89 мегасантиметров (Мсм). Среднее расстояние от Земли до Солнца составляет 150 млн км, т.е. 15 Tсм (17 миллионов Эверестов), расстояние от Земли до Сатурна 1.28 млрд км, т.е. 8.58 ае (ае — астрономическая единица, т.е. расстояние от Земли до Солнца. Свет пролетает его за примерно 5 минут, т.е. глядя на Солнце мы видим его таким каким оно было 8 минут назад), т.е. 128 Tcм или 0.13 Псм. До Плутона 5.7 миллиардов км, т.е. в 4.45 дальше, чем до Сатурна. Расстояние от Солнца (т.е. Земли) до центра Галактики составляет 8500 пс, 27700 световых лет, т.е. 2.62×1017 км, т.е. 2.62×1022 см, или 26 Зсм.
Наконец, от нас до Деситтеровского горизонта (граница нашей наблюдаемой ускоряющейся Вселенной, которую не может преодолеть даже свет) в миллион раз дальше, т.е.1028 = 104 Исм или 10 килоиоттосантиметров. Т.е. масштабы такие — до Солнца 17 млн «Эверестов», до ядра Галактики примерно 1.7 миллиардов расстояний до Солнца (т.е. в 20 миллионов раз дальше чем до Сатурна), а до края Вселенной — в миллион раз дальше, чем до центра галактики.
Теперь поговорим об информации. Годовой объем данных на душу населения составляет порядка терабайта, т.е. 8 триллионов вопросов типа «да-нет». Сыграем в игру: вообразим себе, что мы участники — герои фильма «Трон: Наследие». Вообразим себе, что мы живем в этом информационном море и непосредственно воспринимаем биты обрабатываемой информации самым обычным для людей способом — видим их написанными на бумаге. Цитирую Эйдена-Мишеля (это же они придумали!): «Мы исходим из предположения, что для записи типичного бита требуется примерно шесть миллиметров. В определенной степени это зависит от соотношения единиц и нулей, поскольку «1» очень узкая.
Типичный размер букв в рукописном тексте рассматривается в работе². Если 6 миллиметров, то два символа примерно 1 см. Так и считаем в дальнейшем. Начнем с мегабайта: 8 миллионов символов, т.е. примерно 4 миллиона см, а точнее 4.8 млн см, т.е. 4.8 Мсм т.е. 5.39 Эверестов! Это мегабайт. Один гигабайт в тысячу раз больше, значит 47730 километров, примерно разок вокруг Земли по экватору. Терабайт в тысячу раз больше, т.е. это в километрах составит 47.73 миллиона километров (треть пути до Солнца). Уместно помнить, что ближайшее расстояние до Венеры составляет 38 млн км. 1 Пбайт дает последовательность длиной 47.73 миллиарда км, в 37 раз дальше Сатурна (или 18.65 раз слетать до Сатурна и назад, для «точности»). Тут даже удобнее к Плутону апеллировать: 5.7 миллиардов км в среднем от Земли до Плутона, значит длина Пбайта больше в 8.4 раза чем расстояние до Плутона. В ае это расстояние 318.2 и это за пределами ударной волны Солнечного ветра в межзвездной среде (80-200 ае). 1 Ебайт в тысячу раз больше, т.е. 47.73 триллиона км, т.е. 5 световых лет! Это Альфа Центавра (на самом деле больше, т.к. Альфа отстоит от нас на 4 световых года)! Таким образом делаем первый фундаментальный
Вывод 1. Суперкомпьютеры-зкзафлопсники являются буквально первыми межзвездными кораблями, построенными людьми в киберпространстве!
Первый в мире экзафлопсный суперкомпьютер Frontier, или OLCF- 5 был запущен в 2022 году в Ок-Риджской национальной лаборатории (США), а в 2024 появился второй экзафлопсный гигант: Aurora из Аргоннской национальной лаборатории. Тем не менее, пока самым мощным остается Frontier, который сменил суперкомпьютер Summit (OLCF-4). Заметим, что Summit это 122.3 Пфлопс, т.е. уже по сути межзвезник, это 5.84 триллиона км, т.е. немного больше половины светового года, точнее 0.62 светового года. Другими словами, Summit за секунду использует последовательность длиной 0.62 светового года. Значит, чтобы добраться до ядра Галактики ему нужно работать 12.41 часа, т.е. 0.56 суток. Полсуток непрерывной работы Summit с полной загрузкой эквивалент, но путешествию к ядру Галактики в киберпространстве! Этакий «Кибер-Интерстеллар».
Хорошо, а как со Вселенной? Примерно в миллион раз больше, т.е. полторы тысячи лет, но на самом деле в три раза меньше если точно считать, а не делать оценки. Другими словами, повторим подвиги Summit: за секунду — половина светового года (0.62); 6.5 секунд и мы у Альфы Центавра; до Сириуса 8.6 световых лет, т.е. 14 секунд работы Summit; Бетельгейзе подальше — 642.5 световых лет, значит 1036 секунд — 17.3 минуты; до ядра Галактики — 12 с половиной часов; до Туманности Андромеды 2.537 мега световых лет, значит 4 миллиона секунд, т.е. 47.36 суток (полтора месяца), ну а до горизонта Де Ситтеровского — около 540 лет. Десять работающих Summit достигают границы вселенной за 54 года, а сто за пять лет!
Вывод 2. Десять работающих Summit достигают границы Вселенной за 54 года, а сто за пять лет! За пять лет!!!
«ГРАНИЦЫ ВСЕЛЕННОЙ, КАРЛ!», — должна в этом месте патетично воскликнуть Якобина Мюнхаузен (Кто не в курсе, должен немедленно посмотреть бессмертный фильм «Тот самый Мюнхаузен». Барон бы точно оценил чудеса о которых я рассказываю!) Вы понимаете насколько мелкими являются масштабы показанные в «Трон: наследие», по сравнению с тем, что увидели бы герои загрузившись в реальное киберпространство, созданное человечеством к 2025 году?! Оно реально является КОСМОСОМ по масштабам!
Замечание. Конечно, можно сказать, что бессмысленно записывать двоичные последовательности «от руки», а потом по длине этих последовательностей что-то говорить. Почему не взять за размер высоту стопок записанных компакт-дисков, например? Были такие оценки: «В исследовании от 2011 года предлагалось визуализировать с помощью компакт-дисков3. Как утверждают авторы, в 2007 году 94% всей информации было представлено в цифровом виде — 277,3 оптимально сжатых эксабайта (термин, обозначающий сжатие данных с помощью наиболее эффективных алгоритмов, доступных в 2007 году). Если записать все это богатство на DVD (по 4,7 Гб), то получим 59 000 000 000 болванок (и смех и грех! Прошло десять лет, и никто уже не помнит про компакт-диски и DVD! Флешки — наше все!).
Если считать толщину одного диска равной 1,2 мм, то эта стопка будет высотой 70 800 км. Для сравнения, длина экватора равна 40 000 км, а общая протяженность государственной границы России — 61 000 км. Причем это объем данных по состоянию на 2007 год! Теперь попробуем таким же образом оценить общий объем трафика, который прогнозируется на этот год — 1,1 зеттабайта. Получим стопку DVD-дисков высотой 280 850 км. Тут уже впору переходить на космические сравнения: среднее расстояние до Луны составляет 385 000 км» ³. Но Луна, это не 5 световых лет, верно? Тем не менее, я утверждаю, что правильно делать именно так как было описано. Дело вот в чем: мы пытаемся визуализировать, сделать наглядным эти числа, понять насколько они велики, велики относительно НАС. Что считать большим, а что малым — чистый антропоцентризм. Если бы мы жили миллионы миллионов лет, то звезды считались бы «рядом с нами», потому что мы тратили бы ничтожную долю времени своей жизни на полеты от звезды до звезды (как сейчас от Калининграда до Зеленоградска) и я даже не говорю о релятивистских эффектах сокращения длин и времени. Эверест — громада, потому что мы ростом порядка метра. Поэтому я говорю, что если бы мы оказались в инфосфере, как в фильме «Трон: Наследие» и воспринимали бы биты, непосредственно, т.е. антропоморфно (даже если мы оцифрованы), как рукописные последовательности, то уже современная инфосфера имела бы для нас размер Галактики! Вот о чем говорят эти цифры!
Инфосфера
Как уже говорилось, годовой объем данных на душу населения составляет 1 терабайт (полтора расстояния до Венеры в момент наибольшего сближения), а в совокупности люди создают в год 5 зеттабайт данных, т.е. 4×1022 бит (это сорок секстиллионов вопросов с ответами типа «да-нет»; подсчеты содержатся в отчете IDC Digital Universe report⁴). Однако я могу легко получить порядок величины, просто умножив подушевой терабайт данных на 7 миллиардов человек, что дает 7 зеттабайт. Почему не 5, как при точных расчетах процитированных выше? Я думаю дело в том, что в реальности подушевой немножко меньше терабайта (это факт!) поэтому итог не 7, а поменьше. Длина такой последовательности составит (по 6 мм на цифру) 25 368 световых лет (лучше по-американски писать — 25,368 световых лет), т.е. фактически до ядра Галактики (напомню, 27,700). Т.е. Summit делает столько бит за 12 часов работы, но дело не в этом. Даже без удвоения инфопотоков, без закона Мура (утверждение о том, что скорость и объем инфопотоков в киберпространстве удваивается каждые полтора-два года) и экспоненциального роста инфосферы, годовая переработанная информация в инфосфере воспринималась бы нами, как цепочка от Земли до ядра галактики. Годовой объем информации в нашей картинке — это линия от Земли до ядра Галактики, но до Туманности Андромеда, грубо говоря, в сто раз (точнее в 91.59) дольше, значит, цепочка до соседней галактики эквивалентна столетней работе с той же эффективностью или, ситуации, когда инфосфера разрослась в 100 раз.
Если использовать закон Мура, то число удвоений дающее множитель 100 составляет 6.64 ∼ 7. Если удвоение идет за 2 года, то за 14 лет линия длиной до ядра Галактики, дотягивается до Туманности Андромеда (М31). Согласно Cisco, в 2015 году на одно только видео приходилось 27 500 петабайт в месяц, что в нашем пересчете дает 138.7 световых лет (lyr); совокупный трафик веб-сайтов, электронной почты и «данных» — 7 700 петабайт — 38.85 lyr. Немногим меньше пришлось на передачу файлов — 6 100 петабайт −30.8 lyr. Это за один месяц 2015. За год все увеличиться на порядок (даже больше — в 12 раз). Т.е. все прокрученное за 2015 год видео эквивалентно путешествию за 1664 световых лет, а за десять лет порядка 17 тысяч световых лет, т.е 0.6 расстояния до центра Галактики и практически 20% от Галактики по длине (от 85 тысяч световых лет). Страшно подумать сколько дают игры (по оценкам, в инфосфере не менее 25% дают игры и не менее 6% мобильная связь). Я сделал расчеты для 2015 года, потому что эти данные были под рукой. Разумеется надо пересчитать на 2024 год, а также учесть, что на смену брутальному ковбою Summit, пришла японская красавица Fugaku, а потом опять вперед вырвался Мир Дикого Запада в виде экзафлопников Frontier и Aurora о которых мы уже говорили.
Разумеется, можно по разному использовать аналогию — «переработка информации = космическое путешествие». Например, возьмем месячный трафик e-mails эквивалентный 38.85 световых годов. Представим, что мы освоили полет до Проксимы Центавра — туда и обратно, это 8 световых лет, значит, обмениваясь электронными письмами мы за месяц 2015 года запускали 4.86 экспедиций до Альфы — и обратно. Практически пять. С той поры прошло 10 лет. Рекомендую читателю в виде домашнего задания самому покопаться в сети и сравнить прогресс в развитии. Обещаю, Вы будете удивлены! Вывод: даже современная инфосфера эквивалентна галактической (но не межгалактической пока) цивилизации.
Однако лет 10 действия закона Мура и инфосфера в этой картинке дотянется до М31. Но на самом деле, закон Мура в инфосфере дает просто чудовищные эффекты! Расстояние до Деситтеровского горизонта 1028 см это 1.1 × 1010 lyr, т.е. 10 гигасветовых лет (Glyr). Это в 4166 дальше чем до М31. Соответственно логарифмируя это число по основанию два получаем 12 удвоений! В масштабе удвоение за один-два года получаем от 12 до 24 потребных лет, после чего годовой объем инфосферв будет до горизонта. Т.е. за пару десяков лет, галактическая инфосфера становится КОСМОЛОГИЧЕСКОЙ!
Вывод 3. За 20 лет, галактическая инфосфера станет КОСМОЛОГИЧЕСКОЙ ИНФОСФЕРОЙ!
Т.е. по масштабам при взгляде изнутри, киберпространтсво разрастется до размеров вселенной. Вот уж воистину, рядом рождается Вселенная, а большинство живущих на планете Земле воистину не в курсе дела и даже не осознает масштаба, созданного человеком Информационного Космоса!
[1] Erez Aiden and Jean-Baptiste Michel Uncharted: Big Data as a Lens on Human Culture, 2016.
[2] Vikram et al. Development of an automated handwriting analysis system
// ARPN Journal of Engineering and Applied Sciences 6, no. 9 (2011), http://goo.gl/4mlkTm
[3] https://habr.com/ru/company/asus/blog/368853/
[4] Gantz John, Reinsel David. The Digital Universe in 2020 // EMC Corporation (2012), http://idcdocserv.com/1414; Data, Data Everywhere
// Economist (2010), http://goo.gl/VsXh5P; Bohсветовыхn Roger E., Short James E. How Much Information? 2009 // Global Information Industry Center (2010), http://goo.gl/pt0R; Lyman Peter, Varian Hal R. How Much Information 2003? // University of California at Berkeley, http://goo.gl/vpo9N.
[5] John D. Barrow and Frank Tipler, “The Anthropic Cosmological Principle”, Oxford University Press, 372–374 (1986).
Ещё по теме
Личный кабинет для
Личный кабинет для cтудента
Даю согласие на обработку представленных персональных данных, с Политикой обработки персональных данных ознакомлен
Подтверждаю согласие