Древние люди хранили информацию в наскальных рисунках, самым старым из известных нам более 40 тысяч лет. По мере развития появление языков и изобретение письма обусловили хранение подробной информации в различных письменных формах, что привело к изобретению бумаги в Китае в I веке нашей эры. Самые старые печатные книги появились в Китае между 600 и 900 годами. Более тысячелетия книги оставались основным способом хранения информации. Люди добились большего технологического развития за последние 150 лет, чем за предыдущие две тысячи лет. Возможно, одним из самых важных достижений в истории человечества стало изобретение цифровой электроники. С момента открытия транзистора в 1947 году и встроенного микрочипа в 1956 году в нашем обществе произошел сдвиг. Всего за 50 лет человечество достигло беспрецедентных вычислительных мощностей, беспроводных технологий, интернета, искусственного интеллекта и достижений в технологиях отображения, мобильной связи, транспорте, генетике, медицине и освоении космоса. Что наиболее важно, внедрение цифровых хранилищ данных также изменило способ производства, обработки и хранения информации. Точкой перехода можно считать 1996 год, когда цифровое хранилище стало более рентабельным для хранения информации, чем бумажное. Технологии хранения цифровых данных очень разнообразны. Наиболее примечательными являются магнитные накопители (HDD, ленты), оптические диски (CD, DVD, Blu-Ray) и полупроводниковые запоминающие устройства (SSD, флэш-накопители). Каждый тип памяти полезен для определенных нужд. Полупроводниковые запоминающие устройства являются предпочтительным выбором для портативной электроники, оптические хранилища в основном используются для фильмов, программного обеспечения и игр, в то время как магнитные хранилища данных остаются доминирующей технологией для хранения информации большой емкости, включая персональные компьютеры и серверы данных. Все технологии хранения цифровых данных работают по одним и тем же принципам. Биты информации могут храниться в любом материале, содержащем два различных и переключаемых физических состояния. В двоичном коде цифровая информация хранится в виде единиц и нулей, также известных как биты. Восемь бит образуют байт. Каждому физическому состоянию присваивается ноль или единица. Чем меньше эти физические состояния, тем больше битов можно упаковать в запоминающее устройство. Ширина цифровых битов сегодня составляет от 10 до 30 нанометров (миллиардных долей метра). Эти устройства, способные хранить информацию в таком масштабе, очень сложны, потому что их разработка требует контроля материалов на атомарном уровне. Большие данные Цифровая информация настолько прочно вошла во все аспекты нашей жизни и общества, что недавний рост производства информации кажется неудержимым. Каждый день мы генерируем 500 миллионов сообщений в Twitter, 294 миллиарда электронных писем, 4 миллиона гигабайт данных в Facebook, 65 миллиардов сообщений в WhatsApp и 720 тысяч часов нового контента, ежедневно добавляемого на YouTube. В 2018 году общий объем данных, созданных, захваченных, скопированных и потребленных в мире, составил 33 зеттабайта (ЗБ), что эквивалентно 33 триллионам гигабайт. В 2020 году эта цифра выросла до 59 зеттабайт и по прогнозам специалистов к 2025 году достигнет ошеломляющих 175 зеттабайт. Один зеттабайт равен 8e+21 или 8000000000000000000000 бит. Чтобы наглядно представить этот объем, предположим, что каждый бит — это монета в 1 фунт стерлингов, которая имеет толщину около 3 миллиметров. Один зеттабайт, составленный из стопки монет, будет иметь длину 2550 световых лет. Можно 600 раз слетать к ближайшей звездной системе — Альфе Центавра. В настоящее время каждый год люди производят в 59 раз больше данных, а расчетный совокупный годовой темп роста составляет около 61%. Хранилище данных Большая часть цифровой информации хранится в трех типах местоположений. Во-первых, это глобальный набор так называемых конечных точек, которые включают все устройства интернета вещей, ПК, смартфоны и другие устройства хранения информации. Во-вторых, это вся инфраструктура, включающая в себя вышки сотовой связи, серверы и офисы учреждений, например, университеты, государственные учреждения, банки и фабрики. В-третьих, большая часть данных хранится в так называемом ядре — традиционных серверах данных и облачных центрах обработки данных. В мире существует около 600 гипермасштабируемых центров обработки данных, в которых имеется более 5000 серверов. Около 39% из них находятся в США, в то время как Китай, Япония, Великобритания, Германия и Австралия составляют около 30% от общего числа. Крупнейшими серверами данных в мире являются China Telecom Data Center в Хух-Хото, (Китай), который занимает 995 тысяч квадратных метров, и The Citadel в Рино (Невада, США), занимающий 669 тысяч квадратных метров и потребляющий 815 мегаватт электроэнергии. Чтобы удовлетворить постоянно растущий спрос на цифровые хранилища данных, каждые два года строится около 100 новых гипермасштабируемых центров обработки данных. Британский ученый Мелвин Вопсон с помощью своего исследования 2020 года выявил эти тенденции и пришел к выводу, что при ежегодном темпе роста в 50% примерно через 150 лет количество цифровых битов достигнет невозможного значения, превысив количество всех атомов на Земле. Примерно через 110 лет мощность, необходимая для поддержания этого цифрового производства, превысит общее энергопотребление планеты на сегодняшний день, что является проблемой, которую только предстоит решить. По материалам статьи «The world’s data explained: how much we’re producing and where it’s all stored» The Conversation