不確かさ評価とは何か・医療現場での基本と実践

不確かさ評価とは・医療現場で知るべき基本と実践

精度管理を毎日しているのに、その検査値の「信頼幅」は患者に説明できていません。

この記事の3ポイント要約

🔬

不確かさ評価とは「確かさ」を示す指標

「不確かさ」という言葉の語感とは裏腹に、測定データがどれだけ信頼できるかを数値で示す指標です。臨床検査における測定結果の品質を国際的に証明する手段です。

📋

ISO 15189 が求める必須要件

ISO 15189（臨床検査室の国際規格）では測定の不確かさの提示が求められており、2018年の医療法改正以降、検体検査の精度確保はすべての医療機関に義務・努力義務化されています。

📊

タイプA・タイプBの2方法で評価する

GUMに基づき、繰り返し測定の統計解析（タイプA）と、機器公差や校正証明書の情報（タイプB）を組み合わせて合成標準不確かさを算出します。

このページの目次

不確かさ評価とは・医療現場で知るべき基本と実践

不確かさ評価とは何か・「誤差」との根本的な違い

「不確かさ評価」という言葉を初めて聞いたとき、多くの医療従事者は「測定値の誤差を求めることと何が違うの？」と感じるかもしれません。しかし、この2つの概念にはまったく別の哲学が存在します。

従来の「誤差」の概念は、測定誤差＝測定値−真の値、という式で定義されます。ここで根本的な問題があります。「真の値」は誰も知ることができない、という点です。まさに「神のみぞ知る値」です。そのため、誤差を厳密に評価することには、原理的な限界が伴っていました。

一方、「測定の不確かさ」は、真の値を想定せず、最良推定値（測定値の期待値）を中心に、値のばらつきを標準偏差という形で数値化します。つまり、「真の値からどれだけ外れているか」ではなく、「この測定値はどの範囲に収まる可能性があるか」を定量的に示す指標です。

結論は、不確かさは測定の信頼性そのものを示す指標です。

さらに興味深いのは、「測定不確かさ（measurement uncertainty）」という語感です。NITE（製品評価技術基盤機構）は、この言葉は「確かでない」という印象を与えるが、実際には「測定データの確かさを示す指標」であると説明しています。名前と意味が逆方向に見える点が、臨床現場での混乱を生みやすいポイントです。意外ですね。

臨床検査の世界では、1993年にISOが国際文書GUM（Guide to the Expression of Uncertainty in Measurement：計測の不確かさ表現のガイド）を発行したことで、不確かさ評価の概念が世界標準として定着しました。それ以来、計量に関わる国際的な8機関が共同で、すべての測定分野で統一したルールを適用するよう推進してきました。

概念	定義	問題点
誤差	測定値 − 真の値	真の値が不明のため、厳密な評価が不可能
不確かさ	測定結果のばらつきを特徴づけるパラメータ	なし（真の値を前提としない）

参考情報：NITEによる「測定不確かさ」の解説（不確かさが「確かさの指標」である理由を詳しく説明しています）
測定不確かさとは | 適合性認定 | 製品評価技術基盤機構（NITE）

不確かさ評価とISO 15189の関係・医療機関が対応すべき理由

「うちは認定を受けていないから関係ない」と考えている臨床検査技師も少なくありません。しかし、それは大きな誤解です。

ISO 15189（臨床検査室−品質と能力に関する特定要求事項）では、「測定の不確かさ」の評価と提示が明確に求められています。具体的には第3章3.17項において、不確かさとは「測定結果に付随するパラメータで、合理的に測定対象物質に起因する値の分散を性格づけるもの」と定義されています。さらにISO 15189:2022（最新版）では、測定不確かさ（MU）の評価として「該当する場合、測定された量の値のMUをその意図する用途に対して評価し、維持管理しなければならない」と規定されています。

ここが重要なポイントです。

2018年12月1日に「医療法等の一部を改正する法律」が施行されました。この改正により、医療機関が自ら実施する検体検査について、品質と精度の確保が法律上明確化されました。外部精度管理調査の受検は努力義務化され、特定機能病院については、さらに義務化の強化が議論されています。

🏥 医療法改正のポイントをまとめると。

- 施行日：2018年12月1日
- 対象：医療機関が自ら実施する検体検査すべて
- 内容：品質・精度の確保が法律上明確化
- 外部精度管理：受検が努力義務化
- 精度確保責任者：医師または臨床検査技師が担う

ISO 15189の認定を受けていない施設であっても、医療法の要求に基づいて検体検査の精度を確保する責任があります。不確かさ評価はその中核をなす概念です。精度管理が必要なのは原則です。

参考情報：日本臨床検査標準協議会（JCCLS）による「ISO 15189 第8回不確かさの考え方」（ISO 15189の不確かさ要件を臨床検査の文脈でわかりやすく説明しています）
「これで解決ISO 15189」第8回不確かさの考え方について（シスメックス）

不確かさ評価の手順・タイプAとタイプBの使い分け方

不確かさ評価の実際の流れを知ると、意外にも既存の精度管理業務と重なる部分が多いことに気づきます。これは使えそうです。

GUMに基づく不確かさ評価は、大きく7つのステップで進めます。

測定・校正の手順を標準操作手順書（SOP）として明確化する

特性要因図などを用いてばらつきの要因を列挙する

各要因をタイプAまたはタイプBに分類し、標準不確かさを見積もる

各成分を二乗和合成し「合成標準不確かさ uc」を算出する

合成標準不確かさに包含係数（k）を乗じて「拡張不確かさ U」を求める

測定結果を「y ± U（k=2）」の形式で報告する

評価の全過程を文書として記録・保管する

ここで最も重要な概念が「タイプA」と「タイプB」の分類です。

タイプA評価は、一連の観測値の統計解析によって不確かさを求める方法です。わかりやすく言えば、繰り返し測定によって得られた実測データから標準偏差を計算する方法です。例えば、内部精度管理試料を2〜3ヶ月間にわたって毎日2回測定したデータに一元配置分散分析を適用し、日間変動・日内変動の標準不確かさを算出する方法がこれに当たります。

タイプB評価は、統計的方法以外の手段で不確かさを見積もる方法です。機器の校正証明書に記載された不確かさ、メスフラスコやピペットの公差（誤差の上限）、試薬メーカーの認証標準物質に付記されたデータなどが情報源となります。これらは矩形分布（一様分布）を仮定して標準偏差に変換します。公差が ±a の場合の標準不確かさは $$u = \frac{a}{\sqrt{3}}$$ で求められます。

タイプAとタイプB、両方組み合わせるのが基本です。

そして各成分を次の式で合成します。

$$u_C = \sqrt{u_x^2 + u_y^2 + \cdots}$$

拡張不確かさは、一般的に包含係数 k=2 を用います。k=2 のとき、測定値が拡張不確かさの区間に含まれる確率（信頼の水準）はおよそ 95.4% に相当します。つまり、「この測定値は真の値が y±U の範囲に約95%の確率で含まれます」と説明できるようになります。

| 包含係数 k | 信頼の水準 |
|-----------|-----------|
| k = 1 | 約 68.3% |
| k = 2 | 約 95.4% |
| k = 3 | 約 99.7% |

臨床検査ではk=2が標準的な選択です。

参考情報：産業技術総合研究所による不確かさ評価の入門解説（GUMに基づく手順をわかりやすくまとめています）
不確かさ評価入門（産業技術総合研究所）

不確かさ評価における主要なばらつき要因と臨床検査への影響

「どの要因まで拾えばいいのか？」という疑問は、不確かさ評価に取り組む多くの臨床検査技師が感じる共通の壁です。

ISO 15189の文脈で示されている代表的なばらつき要因を確認しましょう。採血量・溶血・採血時間などのサンプル採取段階、遠心時間・温度などのサンプル調整段階、校正物質（キャリブレータ）のロット間差、標準物質の認証値に付記された不確かさ、測定値の四捨五入による丸め、分注精度やコンタミネーション、試薬ロット間差、検査室の温度・湿度、保管温度・保管時間、そして実施者の手技・知識・体調に至るまで、非常に広範囲にわたります。

厳しいところですね。

ただし、GUMは「すべての要因を網羅しなければならない」とは求めていません。「測定結果にばらつきを与える主要因を抽出し、その不確かさを評価することが求められている」と明記されています。また、「信頼できる評価ならば、第三者が評価した結果を利用してもよい」とされており、試薬メーカーや機器メーカーが提供する校正証明書のデータを活用することが認められています。

一点特に覚えておきたいのは、複数の不確かさ成分を合成する際の特性です。各成分のうち最も大きな値が、合成結果の大部分を支配します。例えば、要因Xの標準不確かさが1.00、要因Yが0.10の場合、合成標準不確かさは $$\sqrt{1.00^2 + 0.10^2} \approx 1.005$$ となり、ほぼ要因Xだけで決まってしまいます。

つまり、大きな要因だけ抑えれば十分というのが現実的な結論です。

臨床検査室では内部精度管理データをすでに蓄積しているはずです。JCCLSが推奨する方法では、管理物質を毎日2回以上、2〜3ヶ月間測定した蓄積データに一元配置分散分析を適用するだけで、測定条件による標準不確かさ（日間・日内変動成分）を推定できます。新たに大規模な実験を組まなくても、既存データで第一歩を踏み出せます。

日本臨床検査標準協議会（JCCLS）は、Excelを使った不確かさ計算プログラムを無償で提供しています。不確かさ評価を初めて取り組む施設は、このツールを起点にするのが最も効率的です。

参考情報：JCCLSが示す臨床検査における不確かさのケース別推定法（日常検査値の不確かさを内部精度管理データから算出する具体的な手順が記されています）
臨床検査における測定の不確かさ・ケース別推定法（JCCLS）

不確かさ評価の「精度管理との使い分け」・医療従事者だけが持つ独自視点

日々の精度管理（QC）をしっかりやっていれば、不確かさ評価は不要なのではないか──そう感じている医療従事者は少なくありません。しかし、この考え方には見落としがあります。

精度管理は「測定が安定した状態にあるかどうか」を監視するプロセスです。QCチャートを用いて管理限界を超えていないかをチェックし、日々の測定の再現性（精密性）を確認します。一方で、不確かさ評価は「測定値そのものにどの程度の幅があるか」を定量的に示す行為です。両者は目的も使用場面も異なります。

精度管理と不確かさ評価、どちらも欠かせません。

具体的に考えてみましょう。例えば血糖値が6.0 mmol/Lと測定されたとします。精度管理が適切に行われていれば、「この装置は安定して動いている」ことはわかります。しかし、その6.0という値が95%の確率でどの範囲に収まるかは、精度管理だけでは示せません。不確かさ評価によって、例えば「6.0 ± 0.3 mmol/L（k=2）」と示すことができて初めて、医師が臨床判断を下す際の「値の信頼幅」を共有できます。

これが、不確かさ評価が臨床的に持つ最大の意義です。測定値に付随する信頼幅を明示することで、臨床医が「この値の変化は測定のばらつき範囲内か、それとも患者の真の状態変化か」を判断する材料を提供できます。

また、不確かさ評価の結果が「基準を超えていた」場合、それは問題の発見につながります。JCCLSは、不確かさの基準として次の4つを示しています。生理的変動幅に基づく基準、臨床的有用性に基づく専門家の基準、国際的なエキスパートグループによる基準、現状の技術水準に基づく基準です。基準と比較することで、「改善すべき測定プロセスはどこか」を特定できます。

🔍 精度管理と不確かさ評価の役割の違い。

| 項目 | 精度管理（QC） | 不確かさ評価 |
|------|-------------|-------------|
| 目的 | 測定の安定性・再現性の監視 | 測定値の信頼幅の定量化 |
| タイミング | 毎日・リアルタイム | 定期的・文書として記録 |
| 判断軸 | 管理限界内か否か | 不確かさが基準内か否か |
| 臨床活用 | 異常値の早期検出 | 検査値の解釈支援 |

不確かさ評価の実施結果は、文書として施設内に保管することが必須です。その文書には、①不確かさの成分とその評価方法、②評価に使用したデータと計算方法、③データの解析手順、④使用した定数や補正値とその出典、を含めなければなりません。単に計算するだけでは不十分で、追跡可能な形（トレーサブル）に残すことが条件です。

記録の保管まで含めて「不確かさ評価」が完成します。

参考情報：シスメックス社が提供するISO 15189解説シリーズ（不確かさ評価の基本概念から算出方法、評価基準の設定まで体系的にまとめられています）
「測定の不確かさ」の概念と基本的な評価方法について（シスメックス・Sysmex Journal）