какое количество уникальной информации произвело человечество число
Ученые впервые произвели инвентаризацию всех типов информации, которую человечество может хранить, передавать на расстояние и обрабатывать, сообщается в статье, опубликованной в журнале Science.
Группа исследователей под руководством Мартина Гилберта (Martin Hilbert) из Университета Южной Калифорнии в США провела анализ развития 60 основных технологий хранения, обработки и передачи информации за 1986–2007 годы и пришла к выводу, что суммарные запасы данных всего человечества оцениваются в 295 эксабайт (21-значное число, 1 эксабайт – 10 в 18 степени байта). Однако по оценкам ученых это количество – лишь 1% от информации, содержащейся во всех молекулах ДНК одного человека.
По мнению ученых, общий объем информации, производимый людьми, будучи записанным на компакт-диски, может образовать стопку высотою больше орбиты Луны.
«Мы живем в мире, где экономика, политика и культурное развитие все больше начинают зависеть от технологических возможностей. Нам впервые удалось оценить способности всего человечества в работе с информацией», – приводит слова Гилберта пресс-служба университета.
Большая часть информации (более 94%), согласно проведенной оценке, на сегодняшний день находится в цифровой форме, тогда как до 2002 года доминировали аналоговые методы хранения и обработки данных.
К 2007 году системы теле- и радиовещания передали примерно 1,9 зеттабайт информации (число из 22-х цифр, 1 зеттабайт – 10 в 21 степени байта). Это эквивалентно прочтению примерно 174 газет каждым человеком на земле в день.
Персональное общение людей (например, по мобильному телефону) к 2007 году достигло 65 эксабайт, что соответствует пересказу содержания примерно шести газет каждым человеком каждый день.
При этом в 2007 году все персональные компьютеры мира совершали 6,4 квинтиллиона операций в секунду (число с 20 цифрами), что примерно соответствует количеству операций, выполняемых в секунду мозгом одного человека. Выполнение всех этих операций вручную потребовало бы времени в 2,2 тысячи раз превышающего время существования Вселенной.
При этом скорость обработки информации за изученный авторами период растет со скоростью примерно 58% в год, количество передаваемой информации – на 28%, а общие запасы информации – на 23% в год.
«Эти числа могут впечатлить, однако они весьма незначительны на фоне того, как с информацией умеет управляться природа. В то же самое время природа остается все время на одном и том же уровне, тогда как технологические средства обработки информации развиваются экспоненциально», – сказал Гилберт, слова которого приводит пресс-служба университета.
Ученые подсчитали количество информации, определяющей уникальность каждого человека
Ученые достаточно давно задумываются над вопросом, сколько информации содержится в организме каждого человека? Ответить на этот вопрос попытался инженер-физик Дерек Мюллер (Derek Muller), который использовал привычную двоичную систему исчисления для кодирования всего количества информации, содержащейся в геноме человека. Согласно расчетам Мюллера, в каждой клетке организма человека содержится около 1.5 гигабайт генетической информации. Это означает, что генетическая информация с легкостью может уместиться на стандартном DVD-диске, а ее объем эквивалентен объему 511 фотоснимков, сделанных цифровой камерой со средними параметрами, когда один снимок имеет средний размер в 3 мегабайта.
Продолжая свои вычисления, Мюллер посчитал, что с учетом того, что в организме человека насчитывается в среднем 40 триллионов клеток, общий объем информации в организме человека составляет около 60 зеттабайт, огромное число, состоящее из цифры 60, сопровождаемой 21 нолем. Для понимания величины этого числа стоит указать, что согласно прогнозам, к 2020 году общее количество всей цифровой информации, созданной человечеством, составит около 40 зеттабайт.
Но самым интересным является тот факт, что 99.9 процента всей генетической информации абсолютно одинаковы у всех людей на земном шаре. Это, в свою очередь, означает, что геном человека содержит только одну тысячную часть уникальной информации, которая отвечает за уникальность и неповторимость каждого человека. И эта уникальная информация уместится на одной древней 3.5-дюймовой дискете.
Сколько информации накопило человечество
Счет информации, которую мы храним и передаем, идет на триллионы и квадрильоны мегабайт.
Исследователи из Университета Южной Калифорнии (University of Southern California) подсчитали объем всей информации, накопленной человечеством к 2007 году. Результаты они опубликовали в Science. Вот, что получилось.
Объем информации, хранящейся в 2007 году на всех цифровых и аналоговых носителях, составил 295 экзабайт (это число с 20 нулями), или же 295 триллионов мегабайт. Чтобы понять порядок этой величины, Мартин Хилберт (Martin Hilbert ) и Присцилла Лопез (Priscila López) приводят такие сравнения. Если принять одну звезду за один бит информации, то на каждого жителя Земли приходится по галактике информации. Если записать эту информацию на CD, то башня из дисков уйдет за пределы Луны. Тем не менее, этот гигантский объем составляет менее одного процента информации, содержащейся во всех молекулах ДНК одного человека.
Специалисты рассмотрели 60 категорий аналоговых и цифровых технологий с 1986 по 2007 год. 2002 год считается началом цифровой эры, поскольку в этом году объем информации на цифровых носителях превысил ее объем на аналоговых. В то время как в 2000 году 75% информации содержались на аналоговых носителях, таких как видео- и аудиокассеты, к 2007 году почти 94% всей информации в мире записано «в цифре».
В 2007 году 1,9 зеттабайт (число с 21 нулем), или же 1,9 квадрильонов мегабайт информации было разослано посредством телевидения и GPS. Это равняется тому, как если бы каждый человек в мире ежедневно обменивался с другими информацией, содержащейся в 174 газетах. А посредством сотовых телефонов человечество в 2007 году послало 65 экзабайт информации.
Быстрее всего растет объем телекоммуникаций. Объем информации, передаваемой по интернету и сотовому телефону, увеличивается в среднем на 28% каждый год, а объем хранящейся в мире информации – на 23%. Возможности человечества распространять однонаправленную информацию по разным каналам (например, радио и телевидение) увеличивается на 6% ежегодно. А мощность компьютеров растет со скоростью 58% в год. В 2007 году все компьютеры мира рассчитывали 6,4 х 10 18 операций в секунду. Эта величина такого же порядка, как число нервных импульсов в мозге одного человека. Если такое количество операций производить вручную, это займет время, в 2200 раз больше, чем прошло с момента Большого взрыва.
Скорость информационного роста намного превышает все другие величины, например, рост человеческой популяции, валового внутреннего продукта и уровня образования. В отличие от них, отмечают исследователи, информационные процессы растут экспотенциально.
Человечество накопило 2 трлн гигабайт данных
Мировой объем данных, который собрало человечество, составляет 2 трлн гигабайт. Если перенести эти данные на стандартные компакт-диски и положить все диски друг на друга, то их высота будет в четыре раза превосходить расстояние от Земли до Луны. Об этом заявил в четверг, 14 февраля, директор автономной некоммерческой организации «Институт развития интернета» Сергей Петров, выступая на Cyber Security Forum 2019 в «России сегодня».
«Интеллект человека не способен оценить все изменения, которые произошли в цифровую эпоху. Прежде всего эта эпоха характеризуются большим объемом данных, которые собрало человечество. Общий объем этих данных, по оценкам на 2018 год, составляет 2 зеттабайт, или 2 трлн гигабайт. В результате сегодня 5 млрд людей ежедневно так или иначе взаимодействуют с данными», — рассказал Сергей Петров.
Он выразил мнение, что к 2025 году 20% данных, содержащихся в глобальной информационной системе, будут играть критически важную роль.
«10% данных к этому времени приобретут сверхкритическую важность: от них будет зависеть жизнь, безопасность людей, а также международная обстановка», — отметил эксперт.
По его словам, значительная часть мировых данных сегодня хранится на русском языке.
«Русский язык стал вторым по популярности в интернете после английского. 76% россиян пользуются интернетом — это положительный тренд, но проблемой является то, что не все россияне обладают навыками для оценки правдивости информации Сети. На фоне этого в 2018 году, по данным “Медиалогии”, на 32% выросло число специально созданных ложных новостей в Сети», — подчеркнул Сергей Петров.
В заключение Сергей Петров заметил, что новые цифровые технологии в будущем значительно изменят рынок труда.
«60% первоклассников, когда станут студентами, будут обучаться навыкам и специальностям, о которых люди пока даже не слышали», — констатировал эксперт.
Подписывайтесь на канал «Инвест-Форсайта» в «Яндекс.Дзене»
Попытки расчета количества информации на планете Земля
Как и физическая Вселенная, информационная Вселенная человечества разнообразна и постоянно расширяется – она обогащается ресурсами, когда кто-нибудь снимает красивые закаты или восходы на цифровую фотокамеру, когда данные собираются и анализируются от множества установленных на гигантской газовой Турбине датчиков, что делает процесс выработки электроэнергии дешевле и эффективнее; когда ученые получают и обрабатывают данные, передаваемые со скоростью 2,8 гигабайт в секунду с австралийского радиотелескопа ASKAP; когда человек делает групповое селфи на церемонии вручения Оскар и выкладывает его в сеть, где его просматривают в течение 12-часового периода 26 миллионов человек. Ниже показано данное фото с участием Брэдли Купера, Брэда Питта, Анжелины Джоли, Мерил Стрип, Джулии Робертс, Кевина Спейси, Чэннинга Татума и др.
Сегодня более чем 2 миллиарда людей и миллионы предприятий выполняют свою работу через интернет, миллиарды устройств связи отправляют и принимают данные, более одного миллиарда часов телевизионных шоу, сериалов и фильмов транслируется в интернете на основе потокового мультимедиа за один месяц только одной компанией Netflix. Вся информация, начиная от данных, собранных марсоходом Curiosity Rover на Марсе, до ваших фотографий с последнего отпуска, выложенных в Вконтакте или инстаграме с каждым днем пополняет и пополняет информационную Вселенную человечества.
В прошлой статье мы оценили масштабы таких единиц информации как Эксабайт, Зеттабайт, Йоттабайт и поэтому сейчас готовы к осознанию масштабов того количества информации, которое генерируется, хранится, передается и анализируется в современном мире. В данной статье собрано множество фактов с конкретными цифрами о нашей информационной Вселенной: как она развивалась последнее десятилетие, в каком состоянии она сейчас и что нас ждет в будущем. Начнем разбирательство с рассмотрения значимых компаний, которые вносят наиболее существенный вклад в информационную Вселенную.
Вопрос: Какая компания обрабатывает больше всего данных в мире?
Ответ: Неудивительно, что ответ на этот вопрос – компания Google. Возможно, более удивительно, какие именно цифры сегодня стоят за этой корпорацией. Например, знаете ли вы, что Google обрабатывает 5.3 миллиарда запросов в день? Или что Google хранит более 10 эксабайт данных? Конечно Facebook, Microsoft и Amazon составляют Google серьезную конкуренцию: только Facebook имеет 2.5 миллиарда единиц контента, 2.7 миллиарда «лайков» и 300 миллионов фотографий – все это составляет более 500 терабайт данных.
Вопрос: какая компания имеет наибольшее количество серверов?
Ответ: После того, как дан ответ на предыдущий вопрос, логично подумать опять про Google. Но на самом деле ответ – Amazon. В компании размещают 1 000 000 000 гигабайт данных на более чем 1 400 000 серверах. Предполагается, что Google и Microsoft имеют около 1 000 000 серверов каждый, но, ни одна из компаний не оглашает точные цифры.
Вопрос: Какой процент данных хранится в цифровом формате?
Ответ: представьте каждую книгу в каждой библиотеке, каждой школе, каждом доме во всем мире – это много книг. Тем не менее, все эти книги вместе взятые составляют максимум 6 процентов от общей суммы всех человеческих данных. В 2007 году было подсчитано, что только 6% всех данных поступают из книг и из других печатных материалов – остальные 94% данных представляются уже в цифровом формате.
Вопрос: Что ждет нас в будущем?
Ответ: заглядывая в будущее, эксперты прогнозируют, что к 2020 году будет существовать 44 зеттабайт данных. Три года назад, по некоторым оценкам, вся всемирная паутина содержала около 500 эксабайт – это 5 миллиардов гигабайт, и только половина одного зеттабайта!
В настоящее время объемы цифровых данных удваиваются каждые два года. Международная исследовательская и консалтинговая компания IDC, занимающаяся изучением мирового рынка информационных технологий и телекоммуникаций, сначала прогнозировала, что с 2009 г до 2020 г. объем мировых данных увеличится в 44 раза, потом, что в 50 раз, теперь уже значится цифра 55 раз. Каждый год IDC с учетом анализа новых данных перестраивает кривую роста вверх, как правило, на несколько зеттабайт, по последнему отчету с 2009 г объем данных за год с 0,8 зеттабайт вырастет до 44 зеттабайт в 2020 г.
Картинка отлично показывает, насколько велик 44-кратный рост. Однако она в действительности не передает, насколько много 44 Зеттабайта на самом деле, и в каком объеме данных мы будем плавать (или тонуть) в 2020 году.
Число байт в 44 зеттабайтах является слишком большим даже для записи его в Microsoft Excel (Число настолько велико, что при вычислениях Excel урежет последние семь цифр точности). Предполагая, что закон Мура позволит нам удвоить емкость смартфонов в три раза до 2020 года, потребуется 188 978,561,024 (188+ триллион) смартфонов для хранения 44 ZB. Это число соответствует 25 смартфонам на человека для всего населения планеты. Представьте себе задачу управления данными, распределенными по множеству смартфонов.
Facebook в настоящее время хранит 300 Петабайт (PB) данных (это число растет на 600 ТБ в день, а по некоторым другим данным даже больше). Довольно внушительная цифра. Однако это намного, намного меньше, чем даже один Зеттабайт, который вмещает в себя 3 тысячи 495 хранилищ данных Facebook.
Сегодня Facebook имеет 1.3 миллиарда активных пользователей в месяц (стоит отметить, что при этом Facebook содержит около 81 миллиона фейковых профилей). Если бы к 2020 г. в Facebook зарегистрировались все жители на Земле – 7.5 миллиарда человек и данные продолжали бы увеличиваться ежегодно в 10 раз, то хранилище данных Facebook все равно содержало бы только 1/60 часть от 1 ZB:
Незаурядные попытки расчета количества информации человечества
В 2003 году Марк Либерман рассчитал требования к хранилищу всей когда-либо произносимой человеческой речи. Его расчеты показали примерно 42 зеттабайта, если бы оцифровка звука осуществлялась с параметрами 16 кГц/16-бит (что, на мой взгляд, для речи жирно). Он сделал это, чтобы проверить следующий факт: «все слова, произнесенные когда-либо людьми, несут около 5 эксабайт данных».
Расчеты были банально простыми:
Допустим в 1800 году на планете жил 1 миллиард человек, в 1900 году –1,6 миллиарда человек, а в 2000 году – 6,1 миллиарда человек. Предположим, что 10 миллиардов человек прожили в среднем 50 лет, говоря в среднем по 2 часа в день на протяжении всей своей жизни. Это
10 * 10^9 * 50 * 365 * 2 * 60 * 60 = 1.314 * 10^18 секунд.
Если оцифровать одноканальный звук со скоростью 32 КБ в секунду, то получим
1.314 * 10^18 * 3.2 * 10^4 = 4.208 * 10^22 байт или 42 зеттабайта
После полученных результатов Либерман предположил, что возможно, авторы приведенной выше фразы имели в виду «все слова, написанные когда-либо людьми».
Для тех, кому все эти биты и байты кажутся немного абстрактными в 2015 году студенты Лестерского университета попытались посчитать размер Интернета в физических терминах.
Сначала они подсчитали, что в индексированной поисковой сети насчитывается примерно 47 миллиардов страниц. Между тем, чтобы узнать, сколько печатных страниц будет у каждой веб-страницы из этих 47 миллиардов, нужно было посетить репрезентативную выборку веб-сайтов и попытаться распечатать каждый. Чтобы получить справедливое среднее значение с 5-процентной погрешностью и 95-процентным доверительным интервалом пришлось бы протестировать 385 случайных сайтов с помощью программы Random Website Machine. Цитата студента-исследователя Лестерского университета: «Это забавная игра, вы можете играть в нее у себя дома, если вам больше абсолютно нечем заняться: нажмите кнопку «случайный сайт»; нажмите CTRL+A и CTRL+P; и запишите полученное число страниц в таблицу».
Студенты подсчитали, что потребуется 2 процента тропических лесов Амазонки, чтобы сделать бумагу, на которой можно будет распечатать все текстовые данные сети интернет. Исследователи оценили, что средняя веб-страница содержит данных на 6,5 печатных страниц. При таком предположении для печати всех текстовых данных интернета потребуется 305,5 миллиарда листов (это 212 миллионов копий произведения «Война и мир» Льва Толстого или 75 миллионов копий всей серии книг о Гарри Поттере).
Конечно, оценивать огромный объем данных, размещенный в сети Интернет в текстовом виде нерационально. Согласно исследованиям Cisco, в 2015 году IP-трафик по передаче видео составил 8000 петабайт в месяц, по сравнению с около 3000 петабайт по загрузке web страниц и электронной почты. В целом, по итогам года видео составляло большую часть интернет трафика – 34 000 петабайт, второе место занял общий доступ к файлам – 14 000 петабайт.
Тезисная подборка других интересных фактов:
Генерировать информацию это дело несложное, а вот обработать ее и проанализировать уже гораздо сложнее. В 2013 году только 22% информации в цифровой Вселенной потенциально можно было проанализировать, т. е. эта часть содержала хоть какие-то метаданные (чаще всего мы мало что знаем о данных, если только они каким-то образом не охарактеризованы или не помечены); менее 5% из этих данных были фактически проанализированы. Согласно некоторым оценкам к 2020 году этот полезный процент может вырасти до 35% за счет роста объема данных, получаемых от встраиваемых информационных систем. Если задуматься над приведенными цифрами, то в скором времени будет не только проблема большого количества мусора на нашей планете, но также появится проблема большого количества неперерабатываемого информационного мусора.
Напоследок, представляем вашему вниманию интересную картинку: «что происходит при помощи Интернета за 1 минуту?»