AI・機械学習

適合率

Precision

モデルが正と判定したもののうち、実際に正かった割合です。偽陽性が少ない信頼性の高さを測定します。

適合率 AI 機械学習 モデル評価 偽陽性
作成日: 2025年12月19日 更新日: 2026年4月2日

適合率とは?

適合率(Precision)は、モデルが「正」と判定したもののうち、実際に「正」だった割合です。 言い換えれば、モデルの判定の信頼性や正確さを表す指標です。スパムメール、不正取引、病気の診断など、「誤検知」(本来は負なのに正と判定すること)のコストが大きい場合に特に重要です。

ひとことで言うと: 医師が「この患者は病気です」と診断した時、その診断の正確さ。診断の信頼度の高さです。

ポイントまとめ:

  • 何をするものか: モデルの正判定がどれだけ信頼できるかを測定する指標
  • なぜ必要か: 偽検知のコストが大きいシステムでは、正判定の信頼性が最優先だから
  • 誰が使うか: セキュリティ、医療、フィルタリング、マーケティングなどの領域の専門家

なぜ重要か

例えば、スパム判定で適合率が低い(誤検知が多い)と、重要なメールが頻繁にスパムフォルダに落ちます。顧客は銀行通知や大切な連絡を見落とし、信頼を失う可能性があります。一方、医療診断で適合率が低いと、本来健康な患者に「病気です」と誤診してしまい、不要な手術や治療につながります。

適合率が高いモデルは、「この結果が本当に正である確率が高い」という信頼性を与えるため、システム利用者の信頼獲得に欠かせません。

仕組みをわかりやすく解説

適合率は、以下の式で計算されます:

適合率 = 真陽性(TP) ÷ (真陽性(TP) + 偽陽性(FP))

言葉で言い換えると:

適合率 = 正と判定して実際に正だったもの ÷ 正と判定したすべてのもの

例: スパムフィルターが50通をスパムと判定し、そのうち40通が本当のスパムで、10通が正当なメール(誤検知)だった場合:

適合率 = 40 ÷ 50 = 0.8(80%)

つまり、このフィルターが「スパムです」と言ったメールの80%が本当のスパムで、20%は間違いということです。

再現率との大きな違いは、適合率は「モデルが判定したもの」に焦点を当てるのに対し、再現率は「実際の状況」に焦点を当てることです。

実際の活用シーン

メールスパムフィルター

Gmailなどのスパムフィルターが「適合率を重視」する理由は、正当なメール(大切な仕事のメール、銀行通知)を誤ってスパム扱いすることが最悪だからです。多少のスパムが通り抜けても、重要なメールを見落とすより許容できます。

銀行の不正検知

クレジットカード会社が購買承認前に「これは不正取引ですか?」と判定する場合、誤検知は顧客の購買活動を不便にします。適合率を高く保つことで、誤検知による顧客フラストレーションを減らせます。

医療スクリーニング

症状から「この患者は病気の可能性があります」と診断する場合、誤診(偽陽性)は不要な治療や患者の心理的負担を生みます。適合率が高いシステムなら、診断の信頼性が高く、フォローアップ検査の必要性も絞られます。

メリットと注意点

メリット: 適合率が高いモデルは、その判定を信頼でき、誤検知による2次的な被害を最小化できます。特に調査コストが高い場合や、ユーザーの信頼が重要な場合に有効です。

注意点: 適合率を高くしすぎると、再現率が低下します。例えば、「確信がない場合は判定しない」という戦略を取ると、適合率は高くなるが、本来は正なものも見落とす可能性があります。医療診断なら、患者を見落とす(偽陰性)ことも重大な問題です。両者のバランスが重要です。

関連用語

  • 再現率 — 実際の正のうち、何個を見つけたか。適合率とは逆の視点です。
  • F1スコア — 適合率と再現率の調和平均。両者のバランスを単一数値で表現します。
  • 混同行列 — 真陽性、偽陽性など、分類結果を整理した行列。
  • 分類 — 適合率が使われる機械学習の基本的なタスク。
  • ROC曲線 — 様々な閾値でのモデル性能を視覚化するグラフ。

よくある質問

Q: 適合率が100%のモデルがあるのですか?

A: 理論的にはあります。例えば、1つのメールだけをスパムと判定し、それが本当のスパムなら、適合率は100%です。ただし、この場合、他の99個のスパムメールを見落としているかもしれず、実用性は低いです。高い適合率と高い再現率を同時に実現するのは困難で、通常はトレードオフがあります。

Q: 適合率が重要な場合と再現率が重要な場合は、何が違うのですか?

A: 誤検知(偽陽性)のコストが大きければ適合率、見落とし(偽陰性)のコストが大きければ再現率を優先します。メールスパム判定は誤検知が破壊的なので適合率重視。医療診断は見落としが生命に関わるので再現率重視、というように分かれます。

Q: 適合率と正解率(Accuracy)の違いは?

A: 適合率は「正と判定したもの」の中での正確性。正解率は「全ての判定」の正確性です。データが不均衡(例:患者1%、健康者99%)の場合、すべてを健康と判定するモデルは正解率99%でも、実用性は0です。適合率なら実用性の問題を見抜けます。

関連用語

検証セット

機械学習におけるモデル評価とハイパーパラメータ調整の基盤となる検証セットについて、その役割と実装方法を詳しく解説します。...

×
お問い合わせ Contact