副次評価項目が5項目を超えると、論文査読で「統計解析の信頼性が低い」と指摘され、掲載却下されるリスクが約3割増加します。
主要評価項目(プライマリーエンドポイント)とは、臨床試験において「検出力を考慮して設定された、試験の主たる問いに答えるための評価項目」のことです 。歯科臨床試験であれば、「新しい局所麻酔薬の術中疼痛への効果」を調べるなら、術中VAS(視覚的アナログスケール)スコアが主要評価項目の典型例になります 。 upload.umin.ac(https://upload.umin.ac.jp/cgi-open-bin/ctr/ctr_view.cgi?recptno=R000039325)
主要評価項目は原則として1つだけ設定します 。これは、統計的に有意差を示す際に「第一種過誤5%未満」という保証が成立するのが、あらかじめ定めた1つの評価項目だけに対してだからです 。これが基本です。 menekibunseki(https://menekibunseki.com/faq/post-777/)
2つ以上を設定してしまうと、偶然に有意差が出る確率が積み重なり(多重比較問題)、結果の科学的説得力が一気に低下します 。歯科系の臨床研究においても、ICH E9ガイドラインに基づきPMDAはこの原則を強く求めています 。 pmda.go(https://www.pmda.go.jp/files/000250244.pdf)
| 研究テーマ例 | 主要評価項目(例) |
|---|---|
| 歯科局所麻酔薬の疼痛緩和 | 術中VAS(患者評価)スコアの変化量 |
| 歯周治療の有効性 | プロービング深さ(PPD)の6週後変化 |
| インプラント術後の感染予防 | 術後14日以内の感染発症率 |
| 口腔乾燥症の治療薬評価 | 唾液流量(mL/分)の変化量 |
評価項目は信頼性・妥当性が確立された指標を選ぶことが必要です 。VASは歯科領域で世界的に使用実績があり、標準的な選択肢の一つです。 menekibunseki(https://menekibunseki.com/faq/post-777/)
副次評価項目(セカンダリーエンドポイント)は、主要評価項目を「補完・補足」するために設定する追加の評価指標です 。主要項目だけでは捉えきれない治療効果の多面的な側面を探索します。意外ですね。 oncolo(https://oncolo.jp/dic/secondary-endpoints)
副次評価項目は複数設定できますが、多くなればなるほど多重性問題のリスクが高まります 。必要最小限に留め、AMEDのチェックリストでも「副次評価項目は必要最小限となっているか」を明示的に確認するよう求めています 。これが条件です。 amed.go(https://www.amed.go.jp/content/000099561.pdf)
歯科臨床試験の具体例として、局所麻酔薬の試験(UMIN-CTR登録例)では、主要評価項目「術中VAS(患者評価)」に対して、副次評価項目として「術中VAS(医師評価)」「術後疼痛スコア」「追加麻酔の必要性」などが設定されます 。 upload.umin.ac(https://upload.umin.ac.jp/cgi-open-bin/ctr/ctr_view.cgi?recptno=R000039325)
副次評価項目には「安全性」や「忍容性」が含まれることも多く、これらは主要有効性項目と独立した形で設定されます 。 ja.wikipedia(https://ja.wikipedia.org/wiki/%E5%89%AF%E6%AC%A1%E8%A9%95%E4%BE%A1%E9%A0%85%E7%9B%AE)
多くの歯科研究者が無意識にやってしまうのが、「念のため複数の主要評価項目を設定する」という行動です。どういうことでしょうか?
例えば「VASスコアとプロービング深さと細菌数を全部主要評価項目にする」という設計は、それぞれで有意差を取りに行く戦略に見えますが、統計的には「偶然に1つ以上で有意差が出る確率」が大幅に上昇します 。3項目で各α=0.05を設定した場合、少なくとも1項目で偽陽性が出る確率は約14%に達します。痛いですね。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000bx8p-att/pmct.pdf)
この問題を防ぐ主な方法は2つです。
jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000bx8p-att/pmct.pdf)
EMAやFDAの申請資料では、主要評価項目に加えて「主要副次評価項目」を明示し、複数項目間の多重性調整を行う手法が一般的です 。これは使えそうです。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000bx8p-att/pmct.pdf)
日本でも、PMDAが2024年に改正した「臨床試験の一般指針」において、評価項目の事前設定と多重性への対処を明確に求めています 。 pmda.go(https://www.pmda.go.jp/files/000250244.pdf)
評価項目は試験開始前に必ず設定・登録しておく必要があります 。これは単なるルールではなく、結果の信頼性を担保する根幹です。つまり「試験結果を見てから評価項目を選ぶ」という行為(アウトカムスイッチング)は、査読で即却下の対象になります。 ja.wikipedia(https://ja.wikipedia.org/wiki/%E5%89%AF%E6%AC%A1%E8%A9%95%E4%BE%A1%E9%A0%85%E7%9B%AE)
日本国内では、UMIN-CTR(大学病院医療情報ネットワーク臨床試験登録システム)やjRCTへの事前登録が標準です 。主要・副次評価項目の両方を、測定方法・時点・集計単位まで含めて記載することが求められます。 upload.umin.ac(https://upload.umin.ac.jp/cgi-open-bin/ctr/ctr_view.cgi?recptno=R000039325)
登録時に明記すべき具体的内容は以下の通りです。
昭和大学の研究計画書様式にも、主要・副次評価項目のパラメータを明記するよう明示的に求めており、歯科系研究でも同様の枠組みが適用されています 。これは必須です。 showa-u.ac(https://www.showa-u.ac.jp/SUHD/albums/abm.php?d=3801&f=abm00032790.docx&n=%E3%80%90%E6%A7%98%E5%BC%8F%EF%BC%94%E3%80%91%E7%A0%94%E7%A9%B6%E5%AE%9F%E6%96%BD%E8%A8%88%E7%94%BB%E6%9B%B8%EF%BC%88201905%E6%AD%AF%E7%A7%91%EF%BC%89.docx)
副次評価項目を設定する際、多くの研究者は「並列に羅列」する傾向があります。しかし近年、特にEMAやFDAへの申請戦略として注目されているのが「副次評価項目の階層化(hierarchical testing)」という手法です 。 jpma.or(https://www.jpma.or.jp/information/evaluation/results/allotment/lofurc000000bx8p-att/pmct.pdf)
これは、副次評価項目に優先順位をつけて順番に検定していく方法です。あらかじめ「主要副次評価項目(Key Secondary)→一般副次評価項目(Secondary)→探索的項目(Exploratory)」という3段階の階層を設計し、上位の項目で有意差が得られた場合のみ、次の階層の検定を行います。
この手法の利点は大きく2点あります。
歯科臨床試験でこの手法を取り入れた研究はまだ少数ですが、国際誌への投稿を目指す場合は特に有効です。これは使えそうです。
具体的な設計例として、新規歯周治療薬の試験なら「主要:PPD変化量→Key Secondary:BOP陽性率→Secondary:プラーク指数→Exploratory:患者QOLスコア」という順序で設定することで、論理的な流れが生まれ、査読者からの信頼性評価が高まります。結論は、階層化設定が副次評価項目の最も洗練された使い方です。
参考リンク(歯科研究の評価項目設計に関する詳細資料)。
AMEDによる「研究者主導臨床研究におけるQuality by Designのチェックリスト」:副次評価項目の最小化と多重性への対処を詳細に解説
PMDA「臨床試験の一般指針」改正版:主要評価項目・副次評価項目の定義と設計原則(ICH E9準拠)
UMIN-CTR登録例:歯科施術中の疼痛を評価した治験薬試験の主要・副次評価項目の具体的な記載例