副次的評価項目で「有意差あり」の結果が出ても、それだけで治療の有効性は証明できません。
臨床試験では、調べたい患者さんへの利益(生存期間・再発率・QOLなど)をいくつかの評価項目に絞って測定します。 その中で「一番知りたい項目」が主要評価項目(プライマリーエンドポイント)、それ以外すべてが副次的評価項目(セカンダリーエンドポイント)と呼ばれます。 副次的という言葉の由来はラテン語の「secundus=二番目の」で、東京大学医科学研究所の臨床試験基本用語集でも「重要度においてプライマリーエンドポイントの次に位置するもの」と明確に定義されています。 oncolo(https://oncolo.jp/dic/secondary-endpoints)
つまり、「サブ指標」ということですね。
主要評価項目は原則1つに絞るのが基本ですが、副次的評価項目は多数設定しても構いません。 ただし、項目数が増えると「多重性の問題」が生じます。複数の検定を繰り返すほど、偶然有意差が出る確率が上がるためです。 日本製薬工業協会のガイダンスでも「主要評価項目で有効性が示された場合に限定して副次的評価項目の検証が可能」と整理されています。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000bx8p-att/pmct.pdf)
これは見落とされがちなポイントです。
副次的評価項目として取り上げられやすい指標は、患者の痛みやQOL(生活の質)のような「ソフトな・測定しにくい基準」が多い傾向にあります。 数値化しにくい場合は、スケールやスコアに変換して客観性を担保する工夫が必要です。 歯科臨床においても、術後疼痛VASスコアやPatient-Reported Outcome(患者報告アウトカム)が副次的評価項目に設定されるケースが典型例です。 ja.wikipedia(https://ja.wikipedia.org/wiki/%E5%89%AF%E6%AC%A1%E8%A9%95%E4%BE%A1%E9%A0%85%E7%9B%AE)
この2つの違いを正確に理解しておくことは、論文を読む際の出発点になります。以下の表で整理します。
| 項目 | 主要評価項目(Primary) | 副次的評価項目(Secondary) |
|---|---|---|
| 設定数 | 原則1つ | 複数可 |
| 統計的検出力 | 試験全体のサンプルサイズ計算の基準 | 検出力が担保されないことが多い |
| 有意差の解釈 | 治療の有効性の証拠になりうる | それ単独では有効性の証明にならない |
| 試験との関係 | 試験の目的そのもの | 主要評価項目を補完する位置づけ |
| 歯科での例 | インプラント6か月後の骨結合率 | 術後疼痛スコア・患者満足度・咀嚼機能 |
サンプルサイズの計算は主要評価項目だけで行われることが多く、副次的評価項目にはその検定に必要な統計的検出力が担保されていません。 結果として「副次的評価項目は有意差なし」であっても「効果がなかった」と断言できない、という状況が生まれます。これが原則です。 tmd-ac(https://www.tmd-ac.net/achievement/20180525_1.pdf)
副次的評価項目の結果に注意すれば大丈夫です。
副次的評価項目は「試験開始前に必ず定義する」というルールがあります。 試験終了後に「やっぱりこの指標も見ておけばよかった」と後から追加することは、研究の信頼性を根本から損なうため厳禁です。 ja.wikipedia(https://ja.wikipedia.org/wiki/%E5%89%AF%E6%AC%A1%E8%A9%95%E4%BE%A1%E9%A0%85%E7%9B%AE)
事前定義が条件です。
AMEDのQuality by Designチェックリストでは、「副次的評価項目は必要最小限とすること」「主要評価項目を補完するための客観的評価項目とすること」「多数の項目を評価する場合は検定の多重性に配慮すること」の3点が明示されています。 歯科分野の具体例として、放射線性顎骨壊死(ORN)に関する口腔外科系の研究では、主要評価項目を「治療の実態と有効性」とした上で、副次的評価項目として「1年間の新規ORN患者数」「外科療法を考慮する際の基準」など複数の臨床的特徴が設定されています。 数値として計測できるもの(新規患者数)と判断基準のような質的情報が混在する点が実務上の特徴です。 jsoms.or(https://www.jsoms.or.jp/medical/pdf/2023/0808_3.pdf)
設定の際に参考になる資料として、東京医科歯科大学附属病院が公開している「人を対象とする研究の基本知識」は、評価項目の妥当性・根拠・バイアス排除の方法まで実践的にまとめており、歯科従事者にとって手元に置きたい文書です。
東京医科歯科大学:人を対象とする研究の基本知識(評価項目設定の解説)
歯科臨床で論文を参照して治療方針を決める際、副次的評価項目の「有意差あり」という記述だけを根拠にしてしまうケースがあります。意外ですね。
しかしO'Neilらの定義にあるように、副次的評価項目は「それ自体が臨床的に有意な治療効果の証拠となるものではない」のが大原則です。 主要評価項目で有効性が示されて初めて、副次的評価項目の結果を補足的に解釈する文脈が生まれます。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000bx8p-att/pmct.pdf)
主要評価項目が先、というのが原則です。
具体的なリスクとして、歯科用材料や薬剤の比較試験で主要評価項目(例:12か月後のアタッチメントレベル改善量)が有意差なしであるにもかかわらず、副次的評価項目(例:プロービングデプス変化量)の有意差だけを強調してプロモーションに使う例があります。この場合、患者への説明や治療選択に誤りが生じるリスクがあります。
論文評価の視点として、日本薬学会が公開しているエンドポイントに関する解説は、用語の定義と使い方を網羅的に確認するのに役立ちます。
公益社団法人 日本薬学会:エンドポイントの解説(用語定義と評価項目の種類)
副次的評価項目と混同されやすい概念に「探索的評価項目(Exploratory Endpoint)」があります。これは検証を意図しない、仮説生成目的の指標で、副次的評価項目とは明確に区別されます。 日本製薬工業協会のガイダンスでは「検証を意図しない評価項目は副次評価項目ではなく探索的評価項目」と定めており、この3つの階層構造を理解することが歯科論文リテラシーの核心です。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000bx8p-att/pmct.pdf)
整理するとこうなります。
歯科分野の三叉神経痛や口腔外科研究においても、この3層構造で評価項目が組まれている臨床試験が登録されています。 研究プロトコルや学術論文のMethods欄を読む際に、どの層の評価項目について述べているのかを常に確認する習慣をつけることで、根拠の強さを正確に把握できます。 rctportal.mhlw.go(https://rctportal.mhlw.go.jp/detail/um?trial_id=UMIN000060471)
oncolo.jpが提供するエンドポイント用語解説は、がん領域の臨床試験を中心に書かれていますが、副次評価項目・探索的評価項目それぞれの定義が平易に解説されており、歯科従事者がこの概念を整理する入り口として有用です。
oncolo.jp:探索的評価項目の解説(副次的評価項目との違いを整理)
| 指標 | 英語表記 | 計測期間 | 特徴 |
| ------------ | ------------------------- | ------------ | ------------------------------ |
| PFS(無増悪生存期間) | Progression-Free Survival | 治療開始〜増悪または死亡 | がんが悪化しない期間。短期間で評価できる |
| OS(全生存期間) | Overall Survival | 治療開始〜死亡 | 最も信頼性が高いが、評価に時間がかかる |
| TTP(無増悪期間) | Time to Progression | 治療開始〜増悪 | PFSと近似するが、他疾患死亡を除外する wikipedia |