「測定値が正確なら不確かさ評価は不要」と思っているなら、それで患者への過剰投与リスクが最大30%高まる可能性があります。
「不確かさ(Uncertainty)」という言葉を初めて聞いたとき、多くの検査技師や医師は「測定誤差のことでしょ?」と受け取りがちです。しかし、不確かさと誤差は似て非なる概念です。
誤差(Error)は「真の値と測定値の差」であり、原則として1つの値で表されます。一方、不確かさとは「測定結果に付随する、合理的に測定量に帰属し得る値のばらつきを特徴づけるパラメータ」と国際計量用語集(VIM)で定義されています。つまり、不確かさは"幅"であり、測定値そのものに付随する信頼区間のようなものです。
具体的に考えてみましょう。あるHbA1c測定結果が「6.5%」だったとします。誤差の概念では「真の値が6.5%に対してどれだけズレているか」を問いますが、不確かさの概念では「この6.5%という値は実際には6.3%〜6.7%の範囲にある可能性がある」という表現になります。これが基本です。
不確かさ評価が国際的に標準化されたのは、1993年にISO・IEC・BIPMなどの国際機関が共同で作成した「GUM(Guide to the Expression of Uncertainty in Measurement)」の発行がきっかけです。GUMは現在も改訂を重ね、医療・化学・物理など幅広い分野で参照されています。
重要なのは、不確かさは「測定の質を否定するもの」ではなく、「測定結果をより正直に伝えるための手段」だという点です。誤差ゼロは理想ですが、現実には達成不可能です。つまり不確かさ評価が原則です。
不確かさの評価方法には大きく分けて2種類あります。GUMではこれを「タイプA(A法)」と「タイプB(B法)」と呼びます。どちらかが優れているわけではなく、状況に応じて使い分けるのが原則です。
タイプA評価(統計的方法)は、繰り返し測定によって得られたデータの統計解析から不確かさを算出します。たとえばある検体を10回測定し、その標準偏差を求めることで「繰り返し精度に由来する不確かさ」を評価します。臨床検査室では精度管理データ(QCデータ)の長期的な変動係数(CV%)もこのタイプAの範疇に入ります。
タイプB評価(非統計的方法)は、統計以外の情報源から不確かさを見積もる方法です。具体的には、機器メーカーが提供する仕様書の許容誤差範囲、標準物質の証明書(Certificate of Analysis)に記載された値の不確かさ、過去の測定データや科学的文献などが根拠となります。
医療検査の現場では、両タイプを組み合わせて使うのが一般的です。たとえば血糖測定では、測定装置の繰り返し精度(タイプA)と、使用するキャリブレーター標準液の不確かさ(タイプB)の両方を考慮します。
意外と見落とされがちなのが「タイプBでも十分な不確かさ評価が成立する」という点です。測定回数が少ない状況や、破壊検査・希少サンプルを扱う場面では、文献値や証明書の情報を活用したタイプB評価が現実的かつ合理的な選択肢になります。これは使えそうです。
日本臨床化学会や日本臨床検査標準協議会(JCCLS)も不確かさ評価の指針を公表しており、実務担当者にとって参考になります。
日本臨床検査標準協議会(JCCLS)公式サイト:臨床検査に関する標準化・ガイドラインの情報が掲載されています。不確かさ評価に関連するJCCLS規格を参照する際に活用できます。
実際に不確かさを算出するには、決まったステップを踏む必要があります。GUMに基づく標準的な手順を、臨床検査の文脈に落とし込んで説明します。
ステップ1:測定量の定義
まず「何を測定するのか」を明確にします。たとえば「血清クレアチニン濃度(酵素法)」のように、測定対象・方法・マトリックスを具体的に定義します。曖昧な定義は後のすべてのステップを不安定にします。
ステップ2:不確かさ要因の特定(要因分析)
測定結果に影響を与えるすべての要因をリストアップします。この工程では「フィッシュボーン図(特性要因図)」がよく使われます。検体採取時の変動、前処理・希釈の誤差、試薬ロット差、機器の校正状態、温度・湿度などの環境要因が代表的な要因です。
ステップ3:各要因の標準不確かさ算出
各要因について個別に標準不確かさ($$u_i$$)を算出します。タイプAなら繰り返し測定の標準偏差をそのまま使用し、タイプBなら許容誤差を適切な係数(矩形分布なら$$\sqrt{3}$$、正規分布なら適切なカバレッジファクター)で除した値を使います。
ステップ4:合成標準不確かさの算出
各要因が独立している場合、合成標準不確かさ($$u_c$$)は各標準不確かさの二乗和の平方根(二乗和平方根:RSS法)で求めます。
$$u_c = \sqrt{u_1^2 + u_2^2 + u_3^2 + \cdots + u_n^2}$$
ステップ5:拡張不確かさの算出
合成標準不確かさにカバレッジファクター($$k$$)を掛けて拡張不確かさ($$U$$)を求めます。医療・化学分野では信頼水準約95%に対応する$$k=2$$が一般的に使われます。
$$U = k \times u_c$$
$$k=2$$のとき、報告された「真の値」はこの拡張不確かさの範囲内に約95%の確率で含まれるとされています。
結論は「測定値 ± U」の形で報告するということです。この手順を一度テンプレート化しておくと、検査室での実務がスムーズになります。
医療機関の臨床検査室にとって、ISO 15189の認定取得は「検査の質」を対外的に証明する重要な手段です。そして不確かさ評価は、ISO 15189の要求事項に明確に含まれています。
ISO 15189:2022(最新版)の第7.3.3条では、「検査室は、測定の不確かさを推定しなければならない」と規定されており、特に「報告された測定結果の解釈に不確かさが関連する場合」には患者への報告にも反映させることが求められています。これは必須です。
実際の認定審査では、以下の点が確認されます。
認定を取得した後も、不確かさ評価は「一度やれば終わり」ではありません。試薬ロット変更、機器更新、測定法の変更があった場合には再評価が必要です。意外ですね。
日本では公益財団法人日本適合性認定協会(JAB)がISO 15189の認定を行っています。JABのウェブサイトでは認定基準や審査の手引きが公開されており、実務担当者が事前に確認しておくべき情報が揃っています。
公益財団法人日本適合性認定協会(JAB)公式サイト:ISO 15189認定の申請手順、審査基準、認定取得済み機関リストなどが掲載されています。不確かさ評価の審査要件を確認する際に参照できます。
ここまでは測定・規格の文脈で不確かさ評価を解説してきましたが、実は「臨床判断」の場面でも不確かさの概念は非常に重要です。この視点は教科書や検索上位記事ではほとんど触れられていません。
たとえば、糖尿病の診断基準である「HbA1c 6.5%以上」という閾値を考えてみましょう。ある患者のHbA1c測定値が6.5%で、その測定の拡張不確かさが±0.3%($$k=2$$)だったとします。この場合、真の値は95%の確率で6.2%〜6.8%の範囲にあることになります。
つまり、6.5%という測定値だけを見て「診断基準に達した」と即断するのは、不確かさを無視した判断になりえます。これは患者にとって深刻なリスクになり得ます。実際、国際糖尿病連合(IDF)やADA(米国糖尿病学会)のガイドラインでも、閾値付近の値については複数回測定や他の検査との組み合わせを推奨しています。
| 測定値 | 拡張不確かさ (k=2) | 95%信頼区間 | 臨床判断への影響 |
|---|---|---|---|
| 6.5% | ±0.3% | 6.2%〜6.8% | 診断基準境界線上 → 再検討推奨 |
| 7.8% | ±0.3% | 7.5%〜8.1% | 明らかに基準超過 → 影響小 |
| 6.1% | ±0.3% | 5.8%〜6.4% | 基準未満だが境界近い → 経過観察 |
この視点を持つことで、「測定値をそのまま臨床判断に使う」のではなく「測定値の不確かさを踏まえた上で判断する」という、より患者安全に直結した医療実践が可能になります。
腎機能マーカーのeGFR、心筋マーカーのトロポニン、凝固系検査など、臨床的決定閾値が重要な検査項目では特にこの考え方が有用です。不確かさ評価は品質管理の話だけではなく、患者ケアの質に直接つながる概念だということです。
実際の検査報告書に「測定値 ± 拡張不確かさ」を記載するかどうかは施設ごとの判断ですが、少なくとも検査担当者が不確かさの大きさを把握した上で臨床側に情報提供できる体制を整えることが、今後の検査室運営において重要になってきます。
一般社団法人日本検査血液学会(JSLM)公式サイト:血液検査・臨床検査における精度管理・不確かさ評価に関する学術情報が掲載されています。臨床的決定閾値と測定不確かさの関係を深く学ぶ際の参考になります。
不確かさ評価を導入しようとする検査室が最初につまずくのが、いくつかの根強い誤解です。これらを整理しておくことで、実務導入がスムーズになります。
誤解1:「精度管理(QC)ができていれば不確かさ評価は不要」
内部品質管理(IQC)と不確かさ評価は目的が異なります。QCは「測定が管理状態にあるか」を監視するためのもので、不確かさ評価は「測定結果がどの程度の幅を持つか」を定量化するものです。QCデータは不確かさ評価の「タイプA」の入力データとして活用できますが、QCのみでは不確かさ評価は完結しません。QCだけでは不十分です。
誤解2:「不確かさが小さければ小さいほど良い」
不確かさを過度に小さく見積もると、実際の測定能力を誇張することになり、臨床判断を誤らせるリスクがあります。重要なのは「正確に見積もること」であり、「できるだけ小さくすること」ではありません。
誤解3:「GUMの計算は複雑で専門家でないとできない」
確かにGUMの完全な適用は複雑ですが、臨床検査では「トップダウンアプローチ」と呼ばれる簡略化手法が広く使われています。このアプローチでは、外部精度評価(EQA)のバイアスデータとIQCの変動係数(CV%)を組み合わせるだけで、実用的な不確かさが算出できます。難しく考えすぎる必要はありません。
不確かさを「トップダウン」で算出するシンプルな式は次のとおりです。
$$u_{combined} = \sqrt{u_{bias}^2 + u_{precision}^2}$$
ここで$$u_{bias}$$はバイアスから算出した標準不確かさ、$$u_{precision}$$は精度(CV)から算出した標準不確かさです。それぞれを2倍した拡張不確かさ($$k=2$$)が報告値となります。
この式は暗記する必要はありませんが、概念として「バイアスと精度の両方が不確かさに寄与する」ということだけ覚えておけばOKです。
臨床検査室向けには、欧州の検査室評価プログラム「EQAS」や国内の「日臨技」が提供する精度評価サービスのデータも$$u_{bias}$$の算出に活用できます。使用しているEQAサービスのデータ様式を一度確認してみることをおすすめします。