Перейти к содержимому
Skip to content
← Все статьи

Latency и Throughput: ключевые метрики производительности сети

Что такое Latency и Throughput?

Latency (задержка) и throughput (пропускная способность) — две фундаментальные метрики производительности сети и приложений. Хотя они связаны, они измеряют разные аспекты работы системы. Путаница между ними — распространённая ошибка, которая ведёт к неэффективной оптимизации и плохому пользовательскому опыту.

Latency — это время, необходимое одной единице данных (пакету, запросу, сообщению) для перемещения от источника к получателю. Измеряется в миллисекундах (мс). Это задержка перед тем, как что-то произойдёт.

Throughput — это объём данных, успешно переданных за единицу времени. Измеряется в запросах в секунду (RPS), мегабитах в секунду (Мбит/с) или транзакциях в секунду (TPS). Это ёмкость — сколько работы система может выполнить.

Аналогия с автомагистралью

Представьте шоссе между двумя городами. Latency — это время, за которое одна машина проедет из города А в город Б. Throughput — это количество машин, прибывающих в город Б за час. Шоссе может иметь низкую задержку (высокий скоростной режим), но низкую пропускную способность (одна полоса). Или высокую пропускную способность (восемь полос), но высокую задержку (много светофоров).

Ключевой вывод: улучшение одной метрики автоматически не улучшает другую. Добавление полос не делает машины быстрее. Повышение скоростного режима не увеличивает количество полос.

Измерение задержки

Задержка складывается из нескольких компонентов:

Ключевые метрики задержки для веб-приложений:

МетрикаЧто измеряетЦелевое значение
TTFB (Time to First Byte)Время от запроса до первого байта ответа< 200 мс
DNS LookupВремя разрешения домена в IP< 50 мс
TCP HandshakeВремя установления TCP-соединения< 50 мс
TLS HandshakeВремя согласования шифрования< 100 мс
P99 Latency99-й перцентиль времени ответа< 1 с

Измерение пропускной способности

Измерение throughput зависит от контекста:

Важно: пропускная способность канала (bandwidth) — это не throughput. Bandwidth — это теоретический максимум. Throughput — фактически наблюдаемая скорость передачи, которая всегда ниже из-за накладных расходов протоколов, перегрузки и потерь пакетов.

# Измерение сетевого throughput с помощью iperf3
iperf3 -c server.example.com -t 30

# Измерение HTTP throughput с помощью wrk
wrk -t12 -c400 -d30s https://example.com/api/health

# Измерение throughput с помощью Apache Bench
ab -n 10000 -c 100 https://example.com/api/endpoint

Связь между Latency и Throughput

Под нагрузкой latency и throughput находятся в обратной зависимости. Когда throughput приближается к максимальной ёмкости системы, задержка растёт — часто экспоненциально. Это описывается теорией массового обслуживания, в частности формулой Литтла:

L = λ × W

Где:
L = среднее количество элементов в системе
λ = средняя скорость поступления (throughput)
W = среднее время пребывания элемента в системе (latency)

Это значит: при росте throughput (λ) либо растёт длина очереди (L), либо увеличивается задержка (W), либо и то и другое. На практике при приближении сервера к максимальному RPS время ответа резко возрастает.

Точка перегиба (Knee Point)

У каждой системы есть «точка перегиба» — уровень throughput, при котором задержка начинает резко расти. Работа за пределами этой точки приводит к каскадным отказам: очереди переполняются, срабатывают тайм-ауты, повторные попытки увеличивают нагрузку, и система «складывается». Определение и соблюдение этой границы критически важно для планирования ёмкости.

Оптимизация задержки

Стратегии снижения latency:

Оптимизация пропускной способности

Стратегии увеличения throughput:

Мониторинг обеих метрик

Эффективный мониторинг сайтов отслеживает обе метрики вместе. Панель мониторинга должна показывать:

Инструменты вроде Enterno.io обеспечивают мониторинг задержки ваших эндпоинтов в реальном времени, оповещая о превышении пороговых значений. В сочетании с отслеживанием throughput вы можете обнаружить деградацию производительности до того, как её заметят пользователи.

Типичные ошибки

Выводы

Latency измеряет задержку, throughput — ёмкость. Обе метрики критически важны, и оптимизация одной может ухудшить другую. Мониторьте обе с помощью перцентилей, определите точку перегиба вашей системы и проектируйте архитектуру так, чтобы задержка оставалась низкой даже при масштабировании. CDN, кэширование и повторное использование соединений — для latency; горизонтальное масштабирование, асинхронная обработка и пулы соединений — для throughput.

Проверьте ваш сайт прямо сейчас

Проверить →
Другие статьи: Производительность
Производительность
Метрики производительности API
14.03.2026 · 12 просм.
Производительность
Инвалидация кеша CDN: стратегии доставки свежего контента
16.03.2026 · 17 просм.
Производительность
Оптимизация изображений для веба
14.03.2026 · 16 просм.
Производительность
Оптимизация доставки контента: стратегии CDN и граничные вычисления
16.03.2026 · 12 просм.