MOS(平均オピニオン評点)
MOS (Mean Opinion Score)
MOSは、実際の利用者が音声・映像品質を1~5点で評価し、その平均値で品質を数値化する標準的な測定方法。
MOS(平均オピニオン評点)とは?
MOSは、複数の利用者が音声やビデオの品質を1~5点のスケールで評価し、その平均値を算出する標準的な品質測定方法です。 シグナル対雑音比のような技術指標だけでなく、「実際に人間がどう感じるか」を数値化します。通信事業者、放送局、ストリーミングサービスが、品質改善の必要性を判断するうえで最も信頼される指標です。
ひとことで言うと: 「このビデオの画質、実際にはどう?」と複数人に聞いて、平均点で品質を決めるテスト方法です。
ポイントまとめ:
- 何をするものか: 人間の知覚に基づいた品質測定(技術指標とは異なる)
- なぜ必要か: 技術的には正常でも、利用者体験が悪い場合があるから
- 誰が使うか: 通信キャリア、動画配信企業、音声通信企業、機器メーカー
なぜ重要か
VoIPの音声品質が「データ喪失率2%」と言われても、利用者体験はどの程度悪いのか不明確です。MOSなら「4.2点(ほぼ問題ない)」と直感的に品質レベルがわかります。新しいコーデック、ネットワーク構成、エンコーディング設定を導入するとき、技術指標ではなくMOSで比較することで、実際の改善効果が実感できます。これは開発投資の優先順位付けや、顧客への品質保証を支える重要な根拠となります。
仕組みをわかりやすく解説
MOSテストは5つのステップで実施されます。テスト設計では、評価対象のコンテンツ(様々な品質のビデオ、音声サンプル)を選定します。参加者募集では、聴覚障害などの障害がない代表的なユーザーを集めます。評価環境設定では、ノイズや照度などの外乱を統一し、公平な評価を実現します。サンプル提示と評価では、複数のサンプルを聴衆に順番に見せ、1~5点で評価させます。統計分析では、評価値の平均と信頼区間を算出します。
評点スケールの意味は標準化されています:5点は「優秀」(日常的に使える品質)、4点は「良好」(商用利用に問題ない)、3点は「普通」(利用者によっては不満)、2点は「不良」(多くが不満)、1点は「劣悪」(ほぼ使い物にならない)です。
計算方法
MOS = (全評価値の合計) ÷ (評価人数)
例:10人がビデオを評価し、スコアが「5, 4, 4, 5, 3, 4, 4, 5, 4, 4」の場合: MOS = (5+4+4+5+3+4+4+5+4+4) ÷ 10 = 42 ÷ 10 = 4.2点
通常、信頼区間も報告されます。例:「MOS 4.2 ± 0.3(95%信頼区間)」は、真の平均値が3.9~4.5点の範囲にある確率が95%という意味です。
目安・ベンチマーク
| MOSスコア | 品質レベル | ユーザー満足度 | 一般的なアプリケーション | 実務上の判断 |
|---|---|---|---|---|
| 4.5~5.0 | 優秀 | 非常に満足 | 参照品質、プレミアムサービス | 最高品質で運用可 |
| 4.0~4.4 | 良好 | 満足 | 商用VoIP、標準配信 | 実用レベル |
| 3.5~3.9 | 受け入れ可 | やや不満 | 低帯域利用時の基準 | 改善対象 |
| 3.0~3.4 | 普通 | 不満が目立つ | 応急対応レベル | 早期改善必須 |
| 2.5~2.9 | 不良 | かなり不満 | 緊急通信のみ | 運用不可 |
| 2.0~2.4 | 劣悪 | ほぼ使用不可 | リハビリ・テスト用途 | 即時改善 |
業界別の一般的な目標:
- VoIP(音声通話): MOS 4.0以上を目標。3.5を下回ると解約増加
- ビデオ配信: MOS 4.2以上。スポーツ中継は4.5以上推奨
- ストリーミング音楽: MOS 4.5以上(圧縮音声でも高品質)
実際の活用シーン
通信キャリアのネットワーク改善 新しい音声コーデック導入前に複数の設定でMOSを測定し、実際に品質改善効果があるか確認してから全国展開します。
動画配信プラットフォームの品質監視 リアルタイムMOSを監視し、ネットワーク障害で品質が低下したら、自動的にビットレートを下げて「見られない」を防ぎます。
ゲーム配信サービスの遅延対策 音声通話品質(MOS 4.0以上)とビデオ品質(MOS 4.2以上)のバランスを取り、ゲーム中の通信品質を最適化します。
メリットと注意点
メリット側では、 MOSは技術者でない利用者にもわかりやすく、品質改善の優先順位付けが容易です。規制機関も認める標準指標として信頼性が高く、国際比較も可能です。
注意点としては、 MOSテストは人間が評価するため、属性(年齢、技術リテラシー)による偏りが発生する可能性があります。テストが実際の利用シーンと異なる環境で行われると、現実との乖離が生じます。また、品質知覚は時間とともに変わるため、定期的な再測定が必要です。
関連用語
- 品質保証 — MOSが支える品質管理の基本
- ビデオコーデック — ビデオMOS測定の対象となる圧縮技術
- ネットワーク最適化 — MOSの結果を踏まえた改善施策
- ユーザーエクスペリエンス — MOSが測定する利用者の満足度
- A/Bテスト — MOSを使った比較検証手法
よくある質問
Q: MOSと客観的品質指標(PSNR等)の関係は? A: MOSは主観的、PSNR等は客観的指標で別物です。通常は両者を組み合わせ、客観指標の自動計測でリアルタイム監視し、定期的にMOSで利用者体験を確認する方法が採られます。
Q: 新しいコーデックの導入判断基準は? A: 既存の0.2点以上改善を見込める場合に導入検討します。改善が0.1点未満なら、互換性コストに見合わないと判断されます。
Q: 異なるシーン(スポーツ vs. 映画)でMOSが変わるか? A: はい、変わります。動きが多いスポーツ中継と静的な映画では、同じMOSでも体感が異なります。利用シーン毎に個別テストが必要です。