💾Объём данных|binary

Байт

Обозначение: BВесь мир

0,001KB0,000001MB0GB0TB8bit

Что такое Байт (B)?

Формальное определение

Байт (обозначение: B) — единица цифровой информации, состоящая из 8 бит. Бит (двоичный разряд) — фундаментальная единица информации в вычислительной технике, представляющая одно двоичное значение: 0 или 1. Байт из 8 бит может представлять 2⁸ = 256 различных значений — от 0 до 255 в беззнаковом представлении или от -128 до 127 в знаковом.

Байт является базовой адресуемой единицей памяти практически во всех современных компьютерных архитектурах. Когда процессор считывает данные из памяти или записывает их, он обычно оперирует байтами или группами байтов (словами). Каждый байт в памяти компьютера имеет уникальный адрес.

Связь с другими единицами данных

Один байт равен 8 бит. В десятичной (СИ) системе префиксов: 1 килобайт (КБ) = 1000 байт, 1 мегабайт (МБ) = 1 000 000 байт, 1 гигабайт (ГБ) = 10⁹ байт, 1 терабайт (ТБ) = 10¹² байт. В двоичной системе префиксов (стандарт МЭК): 1 кибибайт (КиБ) = 1024 байт, 1 мебибайт (МиБ) = 1 048 576 байт, 1 гибибайт (ГиБ) = 1 073 741 824 байт.

Этимология

Происхождение слова

Слово «byte» было придумано Вернером Бухгольцем в 1956 году во время проектирования компьютера IBM Stretch (IBM 7030). Бухгольц намеренно выбрал написание «byte» вместо «bite» (укус), чтобы избежать путаницы с «bit» (бит) в технической документации. Изначальная концепция «bite» — небольшой кусочек данных, который компьютер может «откусить» и обработать — сохранилась в изменённом написании.

Система IBM System/360, представленная в 1964 году, стандартизировала байт как 8 бит. Этот 8-битный байт стал универсальным стандартом, поскольку мог представлять все необходимые для обработки текста символы.

Стандарт 8 бит

Выбор 8 бит на байт не был неизбежным. Ранние компьютеры использовали различные группировки: 6-битные байты (64 символа), 7-битные (как в ASCII, 128 символов) и 9-битные. 8-битный байт победил, потому что 8 — это степень двойки (2³ = 8), он обеспечивает 256 значений (достаточно для расширенных кодировок) и позволяет эффективную двоичную арифметику.

История

Заря цифровых вычислений

В первых цифровых компьютерах 1940–1950-х годов данные организовывались в машинные слова, а не в байты. ENIAC (1945) обрабатывал данные в 10-разрядных десятичных числах. Manchester Baby (1948) использовал 32-битные слова. Концепция байта как фиксированной группы бит ещё не существовала.

IBM и рождение байта

Вернер Бухгольц ввёл термин «byte» в 1956 году для проекта IBM Stretch. Поворотный момент наступил с IBM System/360 в 1964 году. Этот революционный компьютер стандартизировал байт в 8 бит и сделал побайтовую адресацию памяти нормой. System/360 использовал кодировку EBCDIC — 8-битную кодировку, требующую 8-битного байта.

Коммерческий успех System/360 установил 8-битный байт как отраслевой стандарт. К 1970-м годам 8-битный байт стал практически универсальным.

Эра микропроцессоров

Микропроцессоры Intel 8008 (1972) и Intel 8080 (1974) были 8-битными процессорами, обрабатывающими один байт за раз. Intel 8086 (1978) расширился до 16 бит (2 байта), последующие поколения — до 32 бит (4 байта) и 64 бит (8 байт). На протяжении всей этой эволюции байт оставался фундаментальной единицей адресации.

Современное значение

Сегодня байт настолько фундаментален, что определяет способ измерения всей цифровой информации. Размеры файлов выражаются в байтах и их кратных. Ёмкость хранилищ — от USB-накопителей до облачных дата-центров — указывается в байтах.

Современное применение

В компьютерной памяти

Все данные в компьютере хранятся в виде байтов. Один символ ASCII занимает 1 байт, символ Unicode (UTF-8) — от 1 до 4 байт, целое число — обычно 4 или 8 байт, число с плавающей запятой — 4 или 8 байт. Оперативная память измеряется в гигабайтах — типичный современный компьютер имеет 8–64 ГБ ОЗУ.

В размерах файлов

Операционные системы показывают размеры файлов в байтах и их кратных. Текстовое электронное письмо — 2–5 КБ. Фотография высокого разрешения — 3–8 МБ. Полнометражный фильм — 1–5 ГБ. Установка операционной системы может занимать 20–50 ГБ.

В передаче данных

Скорости сети измеряются в битах в секунду (Мбит/с, Гбит/с), а объёмы переданных данных — в байтах. Провайдер может предлагать лимит 1 ТБ в месяц. Облачное хранилище — 15 ГБ бесплатно.

В кодировках символов

ASCII использует 7 бит (хранится в 1 байте) для представления 128 символов. Расширенный ASCII использует все 8 бит для 256 символов. Unicode с кодировкой UTF-8 использует от 1 до 4 байт на символ. Подавляющее большинство веб-страниц используют кодировку UTF-8.

Применение в быту

Размеры файлов в повседневной жизни

Каждый пользователь компьютера или смартфона ежедневно сталкивается с байтами. «Фото: 3,2 МБ» означает, что файл содержит примерно 3,2 миллиона байт данных. Скачивание приложения на 50 МБ — перенос 50 миллионов байт по сети.

Покупка накопителей

При покупке USB-накопителей, SD-карт, внешних жёстких дисков или облачных хранилищ байты — фундаментальная единица сравнения. USB-накопитель на 256 ГБ хранит примерно 256 миллиардов байт.

Текст и символы

В обычном тексте на латинице каждый символ занимает примерно 1 байт (в ASCII или UTF-8). Типичная страница текста содержит 2000–3000 символов, или примерно 2–3 КБ. Роман на 300 страниц — около 500–750 КБ простого текста. Эмодзи и кириллические символы могут занимать 2–4 байта каждый в UTF-8.

Музыка, фото и видео

Типичный MP3-файл — 3–5 МБ. Фотография высокого разрешения в JPEG — 3–8 МБ. Минута видео 1080p — примерно 100–150 МБ. Полнометражный фильм в 4K может превышать 50 ГБ.

Интересные факты

1

Слово «byte» было намеренно изменено с «bite» Вернером Бухгольцем в 1956 году, чтобы предотвратить путаницу с «bit» в технических документах IBM. Это намеренное искажение стало одним из самых распространённых слов в технологиях.

2

Один байт может представлять любое число от 0 до 255, любой из 256 цветов в базовой графике или любой символ ASCII. Эта универсальность сделала байт основным строительным блоком цифровых данных.

3

Весь текст Библии короля Якова содержит примерно 4,5 миллиона символов — около 4,5 МБ. Одна несжатая фотография 4K может превышать 24 МБ — в одном фото больше байт, чем во всей Библии.

4

В 2024 году человечество генерирует примерно 120 зеттабайт (120 × 10²¹ байт) данных ежегодно — около 120 миллиардов терабайт. Это число удваивается примерно каждые два года.

5

Первый IBM PC (1981) имел 16 КБ или 64 КБ оперативной памяти. Современный смартфон с 8 ГБ ОЗУ имеет в 125 000–500 000 раз больше памяти.

6

Байт иногда в шутку называют «октетом» в сетевой терминологии, потому что некоторые исторические системы использовали байты размером, отличным от 8 бит. Термин «октет» однозначно означает ровно 8 бит.

7

Первый коммерческий жёсткий диск IBM 350 (1956) хранил 5 миллионов байт (5 МБ) и был размером с два холодильника. Современная карта microSD размером с ноготь хранит 1 ТБ — в 200 000 раз больше.

8

Если напечатать каждый байт, сгенерированный человечеством в 2023 году, как один символ на бумаге, стопка страниц простиралась бы от Земли до Солнца и обратно более тысячи раз.

Таблица конвертаций

ЕдиницаЗначение
Килобайт (KB)0,001BKB
Мегабайт (MB)0,000001BMB
Гигабайт (GB)0BGB
Терабайт (TB)0BTB
Бит (bit)8Bbit

Часто задаваемые вопросы

Сколько бит в байте?
В одном байте 8 бит. Бит — это один двоичный разряд (0 или 1), а 8 бит, объединённых вместе, образуют байт, способный представлять 256 различных значений (2⁸ = 256). Этот 8-битный стандарт был установлен архитектурой IBM System/360 в 1964 году.
В чём разница между байтом и битом?
Бит — наименьшая единица цифровой информации (0 или 1). Байт — группа из 8 бит. Байты используются для измерения размеров файлов и ёмкости хранилищ (КБ, МБ, ГБ), а биты в секунду (бит/с) — для измерения скорости передачи данных. Для перевода байт в биты умножьте на 8.
Сколько байт в килобайте?
В десятичном (СИ) определении 1 килобайт = 1000 байт. В двоичном (МЭК) определении 1 кибибайт (КиБ) = 1024 байт. Десятичное определение используют производители накопителей, а двоичное — операционные системы. Из-за этого «256 ГБ» накопитель показывает меньше места в системе.
Почему мой жёсткий диск показывает меньше места, чем заявлено?
Производители используют десятичное определение: 1 ГБ = 1 000 000 000 байт. Операционные системы используют двоичное: 1 ГиБ = 1 073 741 824 байт. Диск на «500 ГБ» содержит 500 000 000 000 байт, что ОС покажет как 465 ГиБ. Диск содержит ровно заявленное количество байт — разница только в условностях обозначения.
Что может хранить один байт?
Один байт может хранить один символ ASCII (букву, цифру или символ), число от 0 до 255, один из 256 оттенков серого в изображении или одно значение цветового канала в цифровой фотографии.
Почему для байта выбрано 8 бит?
Восемь бит были выбраны потому что: (1) 8 — степень двойки (2³), что согласуется с двоичной архитектурой; (2) 256 значений (2⁸) достаточно для всех основных символов; (3) 8 позволяет эффективно упаковывать два 4-битных «полубайта» для шестнадцатеричного представления.
В чём разница между заглавной B и строчной b?
Заглавная B означает байт (8 бит), а строчная b — бит. Это различие важно: скорость интернета 100 Мбит/с — это 12,5 МБ/с. Ёмкость хранилищ измеряется в байтах (КБ, МБ, ГБ), а скорости сети — в битах в секунду.
Сколько байт в типичном текстовом сообщении?
Стандартное SMS может содержать до 160 символов в кодировке GSM 7-бит, что составляет около 140 байт. Типичное короткое сообщение (50–100 символов) — примерно 50–100 байт в ASCII. Сообщения с эмодзи или кириллицей могут быть больше, так как эти символы занимают 2–4 байта в UTF-8.