💾Объём данных|Метрическая (СИ)

Петабайт

Обозначение: PBВесь мир

1 000TB1 000 000GB1 000 000 000MB1 000 000 000 000KB1 000 000 000 000 000B

Что такое Петабайт (PB)?

Формальное определение

Петабайт (обозначение: ПБ, международное: PB) — единица измерения объёма цифровой информации, равная 10¹⁵ байтам, или 1 000 000 000 000 000 байтов (один квадриллион байтов). В Международной системе единиц (СИ) приставка «пета-» обозначает множитель 10¹⁵. Один петабайт равен 1000 терабайтам, 1 000 000 гигабайтам или 10⁹ мегабайтам.

Важно отличать петабайт от пебибайта (PiB) — его двоичного аналога, определённого Международной электротехнической комиссией (МЭК). Один пебибайт равен 2⁵⁰ байтам (1 125 899 906 842 624 байт), что примерно на 12,6% больше одного петабайта. Операционные системы, такие как Windows, исторически отображали объём хранилища в двоичных единицах, но обозначали их десятичными приставками СИ, что приводило к путанице.

Роль в хранении данных

Петабайт относится к верхнему ярусу часто используемых единиц хранения — между терабайтом и эксабайтом. По мере роста объёмов данных петабайт перешёл из абстрактной концепции в практическую единицу, повседневно используемую облачными провайдерами, научными учреждениями и крупными предприятиями.

Этимология

Происхождение приставки

Приставка «пета-» была принята Международной системой единиц в 1975 году на 15-й Генеральной конференции по мерам и весам. Она происходит от греческого слова «пенте» (πέντε — «пять»), поскольку петабайт представляет 1000⁵ байтов. Система наименований следует стандартной схеме СИ: кило (10³), мега (10⁶), гига (10⁹), тера (10¹²) и пета (10¹⁵).

Появление в компьютерной терминологии

Слово «байт» было придумано Вернером Бухгольцем в IBM в 1956 году. Восьмибитный байт стал стандартом к 1970-м годам. Термин «петабайт» вошёл в широкое техническое использование в 2000-х годах, когда корпоративные хранилища и научные наборы данных достигли этого масштаба.

Точное определение

Стандарт СИ

Согласно Международной системе единиц один петабайт определяется как ровно 10¹⁵ байтов, или 1000 терабайтов. Это определение используется производителями накопителей, телекоммуникационными компаниями и международными организациями по стандартизации (ISO, МЭК).

Двоичный аналог

Двоичным аналогом петабайта является пебибайт (PiB), определяемый как 2⁵⁰ байтов (1 125 899 906 842 624 байт). Разница существует из-за того, что компьютеры работают в двоичной системе, где адресация памяти кратна степеням 1024. МЭК ввела двоичные приставки в 1998 году (киби-, меби-, гиби-, теби-, пеби-, эксби-) для устранения неоднозначности.

Передача данных

В контексте передачи данных петабайты используются для измерения совокупного объёма трафика. Точки обмена интернет-трафиком, подводные кабели и сети доставки контента передают петабайты данных ежедневно.

История

Рост цифрового хранения

Первый коммерческий жёсткий диск IBM 350 (1956 год) вмещал около 3,75 мегабайт — примерно в 267 миллионов раз меньше одного петабайта. К середине 1990-х годов крупнейшие в мире хранилища данных — ЦЕРН, АНБ — достигли петабайтного масштаба. Большой адронный коллайдер (БАК) в ЦЕРНе генерирует около 1 петабайта необработанных данных в секунду во время столкновений.

Коммерциализация

Коммерциализация петабайтных хранилищ началась в 2005–2010 годах с ростом облачных вычислений. Amazon Web Services запустила S3 в 2006 году, а к 2012 году сервис хранил более 1 эксабайта данных. Google обрабатывает более 20 петабайтов данных в день.

Физические носители

Первыми системами хранения, способными вместить один петабайт, были ленточные библиотеки. Первые жёсткие диски ёмкостью 1 ТБ появились в 2007 году, и для сборки массива на 1 ПБ требовалось около 1000 дисков. К 2024 году ёмкость отдельных дисков достигла 30 ТБ, сокращая петабайт до 34 дисков.

Современное применение

Облачные вычисления и дата-центры

Петабайт — стандартная рабочая единица для корпоративных облачных хранилищ. Крупнейшие облачные провайдеры (AWS, Azure, Google Cloud) предлагают тарифы хранения, измеряемые в петабайтах. Один крупный корпоративный клиент может хранить от 10 до 100 ПБ в облаке.

Научные исследования

В науке петабайт необходим для физики высоких энергий, геномики, астрономии и климатологии. Архивы проекта «Геном человека» превышают 40 ПБ. Система данных наблюдения Земли NASA (EOSDIS) управляет более чем 60 ПБ.

Медиа и развлечения

Netflix хранит свою библиотеку контента примерно в 100–200 ПБ. YouTube получает более 500 часов видеозагрузок в минуту, генерируя петабайты нового контента еженедельно.

Государственные учреждения

Правительственные организации — одни из крупнейших потребителей петабайтных хранилищ. Национальные метеослужбы хранят петабайты данных наблюдений и моделей.

Применение в быту

Масштаб в перспективе

Один петабайт эквивалентен примерно 500 миллиардам страниц текста, или 13,3 годам непрерывного HD-видео (1080p). Потребовалось бы около 745 миллионов дискет (1,44 МБ каждая) для хранения одного петабайта.

Генерация данных потребителями

Среднестатистический пользователь смартфона генерирует 6–7 ГБ данных в месяц. Умножив на миллиарды пользователей, получим эксабайты в месяц. Один петабайт может хранить годовые данные примерно 150 000 пользователей.

Домашнее хранилище

Типичное домашнее хранилище в 2024 году — 2–10 ТБ. Для достижения петабайта потребуется около 100 крупнейших потребительских жёстких дисков.

В науке и промышленности

Физика элементарных частиц

Большой адронный коллайдер в ЦЕРНе производит около 50 ПБ записанных данных в год. Данные распределяются по 170 вычислительным центрам в 42 странах через Всемирную вычислительную сеть БАК.

Геномика

Секвенирование одного генома человека даёт около 200 ГБ данных. Крупные проекты — UK Biobank (500 000 геномов), «Все мы» (1 миллион геномов) — производят данные, измеряемые в петабайтах.

Астрономия

Обсерватория Веры Рубин будет собирать 20 ТБ данных за ночь и накопит около 60 ПБ за 10-летний обзор. Климатические модели генерируют петабайты данных при каждом крупном моделировании.

Искусственный интеллект

Обучение больших языковых моделей (GPT-4 и подобных) требует наборов данных объёмом в несколько петабайтов. Тренд к увеличению обучающих выборок делает ИИ одним из основных драйверов спроса на петабайтные хранилища.

Интересные факты

1

При скачивании одного петабайта через домашнее интернет-соединение со скоростью 100 Мбит/с потребуется примерно 2,5 года непрерывной загрузки — 24 часа в сутки.

2

Все письменные произведения человечества — каждая книга, статья и документ — оцениваются примерно в 400 петабайтов в оцифрованном виде. Библиотека Конгресса (170 миллионов единиц хранения) составляет около 20 ПБ.

3

Один петабайт может хранить около 3,4 лет непрерывной записи видео в формате 4K, или около 250 миллионов фотографий высокого разрешения со смартфона.

4

Google обрабатывает более 20 петабайтов данных в день — поисковые запросы, письма Gmail, видео YouTube и данные карт.

5

Теоретическая ёмкость хранения человеческого мозга оценивается примерно в 2,5 петабайта (исследование Института Солка).

6

В 2024 году стоимость хранения одного петабайта на корпоративных жёстких дисках составляла $15 000–25 000 — по сравнению с более чем $100 миллионами в 2000 году.

7

Wayback Machine (Интернет-архив) хранит более 100 петабайтов снимков веб-страниц — значительную часть истории интернета с 1996 года.

Таблица конвертаций

ЕдиницаЗначение
Терабайт (TB)1 000Конвертировать
Гигабайт (GB)1 000 000Конвертировать
Мегабайт (MB)1 000 000 000Конвертировать
Килобайт (KB)1 000 000 000 000Конвертировать
Байт (B)1 000 000 000 000 000Конвертировать

Все конвертации с Петабайта

Часто задаваемые вопросы

Сколько терабайтов в одном петабайте?
Один петабайт равен ровно 1000 терабайтам в десятичной системе СИ. В двоичной системе один пебибайт (PiB) равен 1024 тебибайтам (TiB). Производители накопителей используют определение СИ.
Чем петабайт отличается от пебибайта?
Петабайт (PB) использует десятичную систему СИ и равен 10¹⁵ байтам. Пебибайт (PiB) использует двоичную систему МЭК и равен 2⁵⁰ байтам. Пебибайт примерно на 12,6% больше петабайта.
Сколько данных в одном петабайте?
Один петабайт может хранить примерно 500 миллиардов страниц текста, 250 миллионов фотографий со смартфона, 13,3 лет HD-видео или 20 миллионов картотечных шкафов с документами.
Сколько стоит хранение одного петабайта?
В 2024 году хранение одного петабайта на корпоративных дисках стоило $15 000–25 000 только за оборудование. Облачное хранение Amazon S3 Standard стоит примерно $23 000 в месяц за петабайт, а архивное S3 Glacier Deep Archive — около $1000 в месяц.
Кто использует петабайты хранения?
Крупные облачные провайдеры (AWS, Google, Azure), научные организации (ЦЕРН, центры геномики), социальные сети (Facebook, YouTube), стриминговые сервисы (Netflix), разведывательные службы, метеослужбы, финансовые учреждения.
Сколько времени занимает передача одного петабайта?
При домашней скорости 100 Мбит/с — около 2,5 лет. При 1 Гбит/с — около 93 дней. При 100 Гбит/с (канал дата-центра) — около 22 часов. Поэтому для физической транспортировки AWS предлагает сервис Snowmobile — 45-футовый контейнер для перевозки до 100 ПБ.
Что идёт после петабайта?
Следующая единица — эксабайт (EB), равный 1000 петабайтам (10¹⁸ байтов). Далее идут зеттабайт (10²¹) и йоттабайт (10²⁴). Мировое создание данных в 2023 году оценивалось примерно в 120 зеттабайтов.
Можно ли купить жёсткий диск на петабайт?
В 2024 году ни один отдельный диск не достигает петабайта. Крупнейшие HDD — около 30 ТБ, SSD — до 100 ТБ. Петабайт требует массива из множества дисков в серверной стойке. Корпоративные системы хранения (NetApp, Dell EMC, Pure Storage) масштабируются до нескольких петабайтов.