Петабайт
Обозначение: PBВесь мир
Что такое Петабайт (PB)?
Формальное определение
Петабайт (обозначение: ПБ, международное: PB) — единица измерения объёма цифровой информации, равная 10¹⁵ байтам, или 1 000 000 000 000 000 байтов (один квадриллион байтов). В Международной системе единиц (СИ) приставка «пета-» обозначает множитель 10¹⁵. Один петабайт равен 1000 терабайтам, 1 000 000 гигабайтам или 10⁹ мегабайтам.
Важно отличать петабайт от пебибайта (PiB) — его двоичного аналога, определённого Международной электротехнической комиссией (МЭК). Один пебибайт равен 2⁵⁰ байтам (1 125 899 906 842 624 байт), что примерно на 12,6% больше одного петабайта. Операционные системы, такие как Windows, исторически отображали объём хранилища в двоичных единицах, но обозначали их десятичными приставками СИ, что приводило к путанице.
Роль в хранении данных
Петабайт относится к верхнему ярусу часто используемых единиц хранения — между терабайтом и эксабайтом. По мере роста объёмов данных петабайт перешёл из абстрактной концепции в практическую единицу, повседневно используемую облачными провайдерами, научными учреждениями и крупными предприятиями.
Этимология
Происхождение приставки
Приставка «пета-» была принята Международной системой единиц в 1975 году на 15-й Генеральной конференции по мерам и весам. Она происходит от греческого слова «пенте» (πέντε — «пять»), поскольку петабайт представляет 1000⁵ байтов. Система наименований следует стандартной схеме СИ: кило (10³), мега (10⁶), гига (10⁹), тера (10¹²) и пета (10¹⁵).
Появление в компьютерной терминологии
Слово «байт» было придумано Вернером Бухгольцем в IBM в 1956 году. Восьмибитный байт стал стандартом к 1970-м годам. Термин «петабайт» вошёл в широкое техническое использование в 2000-х годах, когда корпоративные хранилища и научные наборы данных достигли этого масштаба.
Точное определение
Стандарт СИ
Согласно Международной системе единиц один петабайт определяется как ровно 10¹⁵ байтов, или 1000 терабайтов. Это определение используется производителями накопителей, телекоммуникационными компаниями и международными организациями по стандартизации (ISO, МЭК).
Двоичный аналог
Двоичным аналогом петабайта является пебибайт (PiB), определяемый как 2⁵⁰ байтов (1 125 899 906 842 624 байт). Разница существует из-за того, что компьютеры работают в двоичной системе, где адресация памяти кратна степеням 1024. МЭК ввела двоичные приставки в 1998 году (киби-, меби-, гиби-, теби-, пеби-, эксби-) для устранения неоднозначности.
Передача данных
В контексте передачи данных петабайты используются для измерения совокупного объёма трафика. Точки обмена интернет-трафиком, подводные кабели и сети доставки контента передают петабайты данных ежедневно.
История
Рост цифрового хранения
Первый коммерческий жёсткий диск IBM 350 (1956 год) вмещал около 3,75 мегабайт — примерно в 267 миллионов раз меньше одного петабайта. К середине 1990-х годов крупнейшие в мире хранилища данных — ЦЕРН, АНБ — достигли петабайтного масштаба. Большой адронный коллайдер (БАК) в ЦЕРНе генерирует около 1 петабайта необработанных данных в секунду во время столкновений.
Коммерциализация
Коммерциализация петабайтных хранилищ началась в 2005–2010 годах с ростом облачных вычислений. Amazon Web Services запустила S3 в 2006 году, а к 2012 году сервис хранил более 1 эксабайта данных. Google обрабатывает более 20 петабайтов данных в день.
Физические носители
Первыми системами хранения, способными вместить один петабайт, были ленточные библиотеки. Первые жёсткие диски ёмкостью 1 ТБ появились в 2007 году, и для сборки массива на 1 ПБ требовалось около 1000 дисков. К 2024 году ёмкость отдельных дисков достигла 30 ТБ, сокращая петабайт до 34 дисков.
Современное применение
Облачные вычисления и дата-центры
Петабайт — стандартная рабочая единица для корпоративных облачных хранилищ. Крупнейшие облачные провайдеры (AWS, Azure, Google Cloud) предлагают тарифы хранения, измеряемые в петабайтах. Один крупный корпоративный клиент может хранить от 10 до 100 ПБ в облаке.
Научные исследования
В науке петабайт необходим для физики высоких энергий, геномики, астрономии и климатологии. Архивы проекта «Геном человека» превышают 40 ПБ. Система данных наблюдения Земли NASA (EOSDIS) управляет более чем 60 ПБ.
Медиа и развлечения
Netflix хранит свою библиотеку контента примерно в 100–200 ПБ. YouTube получает более 500 часов видеозагрузок в минуту, генерируя петабайты нового контента еженедельно.
Государственные учреждения
Правительственные организации — одни из крупнейших потребителей петабайтных хранилищ. Национальные метеослужбы хранят петабайты данных наблюдений и моделей.
Применение в быту
Масштаб в перспективе
Один петабайт эквивалентен примерно 500 миллиардам страниц текста, или 13,3 годам непрерывного HD-видео (1080p). Потребовалось бы около 745 миллионов дискет (1,44 МБ каждая) для хранения одного петабайта.
Генерация данных потребителями
Среднестатистический пользователь смартфона генерирует 6–7 ГБ данных в месяц. Умножив на миллиарды пользователей, получим эксабайты в месяц. Один петабайт может хранить годовые данные примерно 150 000 пользователей.
Домашнее хранилище
Типичное домашнее хранилище в 2024 году — 2–10 ТБ. Для достижения петабайта потребуется около 100 крупнейших потребительских жёстких дисков.
В науке и промышленности
Физика элементарных частиц
Большой адронный коллайдер в ЦЕРНе производит около 50 ПБ записанных данных в год. Данные распределяются по 170 вычислительным центрам в 42 странах через Всемирную вычислительную сеть БАК.
Геномика
Секвенирование одного генома человека даёт около 200 ГБ данных. Крупные проекты — UK Biobank (500 000 геномов), «Все мы» (1 миллион геномов) — производят данные, измеряемые в петабайтах.
Астрономия
Обсерватория Веры Рубин будет собирать 20 ТБ данных за ночь и накопит около 60 ПБ за 10-летний обзор. Климатические модели генерируют петабайты данных при каждом крупном моделировании.
Искусственный интеллект
Обучение больших языковых моделей (GPT-4 и подобных) требует наборов данных объёмом в несколько петабайтов. Тренд к увеличению обучающих выборок делает ИИ одним из основных драйверов спроса на петабайтные хранилища.
Интересные факты
При скачивании одного петабайта через домашнее интернет-соединение со скоростью 100 Мбит/с потребуется примерно 2,5 года непрерывной загрузки — 24 часа в сутки.
Все письменные произведения человечества — каждая книга, статья и документ — оцениваются примерно в 400 петабайтов в оцифрованном виде. Библиотека Конгресса (170 миллионов единиц хранения) составляет около 20 ПБ.
Один петабайт может хранить около 3,4 лет непрерывной записи видео в формате 4K, или около 250 миллионов фотографий высокого разрешения со смартфона.
Google обрабатывает более 20 петабайтов данных в день — поисковые запросы, письма Gmail, видео YouTube и данные карт.
Теоретическая ёмкость хранения человеческого мозга оценивается примерно в 2,5 петабайта (исследование Института Солка).
В 2024 году стоимость хранения одного петабайта на корпоративных жёстких дисках составляла $15 000–25 000 — по сравнению с более чем $100 миллионами в 2000 году.
Wayback Machine (Интернет-архив) хранит более 100 петабайтов снимков веб-страниц — значительную часть истории интернета с 1996 года.
Таблица конвертаций
| Единица | Значение | |
|---|---|---|
| Терабайт (TB) | 1 000 | Конвертировать → |
| Гигабайт (GB) | 1 000 000 | Конвертировать → |
| Мегабайт (MB) | 1 000 000 000 | Конвертировать → |
| Килобайт (KB) | 1 000 000 000 000 | Конвертировать → |
| Байт (B) | 1 000 000 000 000 000 | Конвертировать → |