レイテンシ
Latency
リクエストからシステムの応答まで、データ転送にかかる時間遅延。AIシステムやWebアプリで重要な性能指標です。
レイテンシとは?
レイテンシは、ユーザーのリクエストからシステムが応答するまでの時間遅延を表す重要な性能指標です。 ネットワーク通信、AIモデルの推論、Webアプリケーションのレスポンスなど、あらゆるシステムで測定されます。通常ミリ秒(ms)単位で表現され、ユーザーが感じる応答速度の速さ・遅さを直接左右します。
ひとことで言うと: 「待ち時間」です。ボタンを押してから反応が返ってくるまでのミリ秒単位の時間です。
ポイントまとめ:
- 何をするものか: システム応答までの時間を計測する指標
- なぜ必要か: ユーザー体験、システム信頼性、ビジネス成果に直結
- 誰が使うか: インフラエンジニア、AIエンジニア、アプリ開発者
なぜ重要か
レイテンシは知覚時間として機能します。Googleの研究によると、100 msの応答遅延でユーザーの満足度が低下し、1秒を超える遅延はエンゲージメント大幅低下を招きます。eコマースでは、100 msの追加遅延でコンバージョン率が最大1%低下し、売上減少につながります。推論レイテンシが重要なAIシステムでも同様で、リアルタイム判断が必要な自動運転やロボティクスでは、数ミリ秒の遅延が安全性に影響します。
仕組みをわかりやすく解説
レイテンシは複数のコンポーネントから構成されます。ネットワークレイテンシは、データが送信元から宛先まで物理的に移動する時間で、光ファイバーでも光速の法則に支配されます。サーバー処理レイテンシは、受け取ったリクエストをCPUが処理して応答を生成するまでの時間です。データベースクエリレイテンシは、ディスク上のデータを検索して取得するまでの時間で、ストレージの種類(SSD vs HDD)で大きく異なります。
これらはすべて加算されます。例えば、ネットワーク往復50 ms、サーバー処理200 ms、データベース100 ms、クライアント処理50 msであれば、ユーザーが経験する総合レイテンシは400 msになります。全体を削減するには、各段階を均衡よく最適化することが重要です。
計算方法
レイテンシを測定する標準的な方法は複数あります。Time to First Byte (TTFB) はリクエスト送信から応答の最初のバイト受信までの時間で、ネットワークとサーバー処理の合計を反映します。Round-Trip Time (RTT) はパケットの往復時間で、通常5~200 msです。パーセンタイルレイテンシ はP50(中央値)、P95(95パーセンタイル)、P99(99パーセンタイル)などで表現され、平均値だけでは見逃す外れ値を可視化できます。
実務では、平均値よりもP95やP99を重視します。なぜなら、ユーザーの95%が経験する速度を知ることが、実際のユーザー体験を反映するからです。
目安・ベンチマーク
| 用途 | 目安 | 体感 |
|---|---|---|
| インタラクティブUI | <100 ms | 即座に反応する |
| Webページ読み込み | <1,000 ms | ストレスなし |
| リアルタイムゲーム | <50 ms | 遅延を感じない |
| ビデオ通話 | <150 ms | 自然な会話 |
| 金融取引 | <10 ms | ミリ秒単位の競争 |
伝送媒体による典型的なレイテンシ:光ファイバー 1~10 ms、4G LTE 20~50 ms、5G <10 ms、衛星インターネット 500+ ms。ストレージ媒体では、NVMe SSD <0.1 ms、SSD <1 ms、HDD 5~10 ms です。
実際の活用シーン
Eコマース最適化 チェックアウトプロセスのレイテンシを50 msから30 msに削減すると、カート放棄率が3%低下し、年間売上が数百万円増加する可能性があります。
AI推論パイプライン AIチャットボットの応答時間を200 msから100 msに改善すれば、ユーザー満足度が大幅に向上し、離脱率が低下します。
グローバル配信 CDNを活用して、地理的に分散したサーバーからコンテンツを配信することで、物理的距離による遅延を最小化できます。
メリットと注意点
低レイテンシの実現により、ユーザー体験が大幅に向上し、ビジネスKPIが改善されます。しかし、過度なレイテンシ削減は開発コストを増加させ、ROIがマイナスになるケースもあります。重要なのは、ビジネスニーズに応じた適切なレイテンシ目標を設定し、それを効率的に達成することです。特にモバイル環境では、ネットワーク条件が変動するため、最悪ケースを想定した設計が必須です。
関連用語
- 推論レイテンシ — AIモデルの応答時間
- CDN — レイテンシ削減の重要技術
- エッジコンピューティング — 物理的近接によるレイテンシ削減
- Core Web Vitals — レイテンシを含むパフォーマンス指標
- Page Speed — ページ読み込み速度とレイテンシ
よくある質問
Q: 「良好な」レイテンシはどのくらい? A: アプリケーション次第です。Webサイトは<1秒、リアルタイムゲームは<50 msが目安ですが、ビジネスモデルに応じて判断します。
Q: 高帯域幅ならレイテンシは改善される? A: いいえ。帯域幅(転送量)とレイテンシ(速度)は別概念です。100 Gbpsの衛星リンクでも、物理的距離のため500+ msのレイテンシが生じます。
Q: レイテンシは完全に排除できる? A: いいえ。光速の法則により物理的下限があります。最小理論値は「物理距離÷光速」で計算されます。