混同行列とは?
混同行列(こんどうぎょうれつ)とは、機械学習や統計学の分野で用いられる、分類の結果をまとめた表のことです。この表を使うことで、モデルがどれだけ正確にデータを分類できたかを評価することができます。
混同行列の基本的な構成
混同行列は通常、縦軸と横軸があり、各クラス(分類したいカテゴリ)の予測結果を示します。たとえば、あるデータを「猫」と「犬」に分類した場合、混同行列は次のようになります。
実際の猫 | 実際の犬 | |
---|---|---|
予測が猫 | ||
予測が犬 |
用語の説明
<dl> <dt>TP(真陽性)dt> <dd>モデルが正しく猫と予測した猫の数。dd> <dt>FP(偽陽性)dt> <dd>モデルが猫と予測したが、実際は犬だった数。dd> <dt>FN(偽陰性)dt> <dd>モデルが犬と予測したが、実際は猫だった数。dd> <dt>TN(真陰性)dt> <dd>モデルが正しく犬と予測した犬の数。dd> dl>混同行列の目的
混同行列を使うことで、モデルの「正確性」を測ることができます。具体的には、以下のような指標を計算することができます。
- 正確率(Accuracy): (TP + TN) / (TP + TN + FP + FN)
- 適合率(Precision): TP / (TP + FP)
- 再現率(Recall): TP / (TP + FN)
混同行列の活用例
たとえば、ある動物病院が診断精度を向上させたいと考えた場合、混同行列を用いてどのタイプの誤診が多いのかを確認することができます。この情報をもとに、スタッフへの研修や機器の改善を行うことができます。
まとめ
混同行列は、機械学習モデルの性能を理解し、改善点を見つけるための強力なツールです。正確なデータ分析によって、より良い結果を導くために活用しましょう。
div><div id="kyoukigo" class="box28">混同行列の共起語
分類:データを特定のカテゴリに分けるプロセス。混同行列は分類の結果を評価するのに使われます。
正解:実際の値やラベルのこと。混同行列は予測結果と正解を比較するために利用されます。
誤分類:データが間違ったカテゴリに分類されてしまうこと。混同行列ではこの誤りを可視化することができます。
真陽性:実際に正しいクラスに分類されたデータの数。混同行列で駅する最も望ましい結果です。
偽陽性:実際には正しくないのに、正しいクラスと分類されたデータの数。誤分類の一種です。
真陰性:実際に正しいクラスとして分類されず、また正しくないクラスにも分類されなかったデータの数。
偽陰性:実際には正しいクラスであるのに、誤って別のクラスに分類されてしまったデータの数。
精度:モデルの正確さを示す指標。混同行列を使って算出される重要な数字です。
再現率:実際に正しいクラスに分類される割合。混同行列の情報から求めることができます。
F1スコア:精度と再現率の調和平均で、分類モデルのパフォーマンスを評価するためによく使われる指標です。
div><div id="douigo" class="box26">混同行列の同意語コンフュージョンマトリックス:英語の「Confusion Matrix」をそのまま日本語にした表現。特に機械学習の分野で使われる。
分類行列:混同行列は分類の結果を示す行列であるため、こう呼ばれることもある。
誤認識行列:モデルの誤判定を示すため、特に誤りの分析に重点を置いた呼び方。
div><div id="kanrenword" class="box28">混同行列の関連ワード分類:データを異なるカテゴリに分けるプロセス。混同行列は分類アルゴリズムの性能を評価するためのツールです。
真陽性 (TP):実際にポジティブなクラスに属するデータを正しくポジティブと予測した数。モデルの正確性を示します。
偽陽性 (FP):実際にはネガティブなクラスに属するデータを誤ってポジティブと予測した数。モデルの誤分類を示します。
真陰性 (TN):実際にネガティブなクラスに属するデータを正しくネガティブと予測した数。
偽陰性 (FN):実際にはポジティブなクラスに属するデータを誤ってネガティブと予測した数。
精度 (Accuracy):正しく分類されたデータの割合。全体の中で、正しく予測された件数を示します。
適合率 (Precision):モデルが正ポジティブと予測した中で、どれだけが実際にポジティブだったかの割合。
再現率 (Recall):実際のポジティブクラスの中から、モデルがどれだけ正しくポジティブと予測したかの割合。
F値 (F1-Score):適合率と再現率の調和平均。モデルのバランスを評価する指標として使われます。
ROC曲線:受信者操作特性曲線。異なる閾値での真陽性率と偽陽性率をプロットしたグラフ。モデルの性能を視覚的に比較できます。
AUC (Area Under Curve):ROC曲線の下の面積。AUCの値が1に近いほど、モデルの予測精度が高いことを示します。
div>混同行列の対義語・反対語
混同行列の関連記事
学問の人気記事
前の記事: « 香炉とは?その魅力と使い方を解説!共起語・同意語も併せて解説!