自律型手術ロボットの法律問題(2026)その1-自律型手術支援システムの実験と医師法17条の発展提案

「祝テンバガー・DaVinci手術システムと「医療ロボットの法律問題」(2017)」 (以下、10バガーメモ)というのは、2015/03/07(土)から開催されたMedical × Security Hackathon 2015でなした講演タイトル『医療ロボットの法律問題』をお話ししたときの講演メモをまとめたものです。

この時点においては、自律型の医療ロボットというのは、考えにくかったのですが、今では、自律型医療ロボットも次第に実験されるようになってきているみたいです。

ちなみに、SFの中では、プロメテウスの中にでてきます。記事ですと「夢のロボット手術~プロメテウス(ネタバレ注意!)」(山口デスクの「ヨミドク映画館」)。 手術シーンは、こちら(Youtube)

第1 自律型手術ロボットの実験の現状

自律型手術ロボットといっても、具体的な作業について、いわばベンチマークとなる作業があります。

具体的には、

  • peg transfer(ペグ移し)->腹腔鏡手術訓練(FLS)の標準課題で、輪状の物体を一方のペグから他方へ移す器用さの基本テストです。
  • needle pickup(針把持)->縫合針をつかむ動作で縫合の前提技能
  • deformable object manipulation(変形物体操作)->ガーゼや組織ファントムなど形が変わる物体の操作で、ダイナミクスが予測しにくいため特に難しいとされます。

これらは患者に触れない安全な台上で行える基礎課題群で、自律手術研究の標準的な実験対象です。

これらの作業について、実際の自律型手術の作業を行う手法に関しては、

  1. モデルベース戦略->ロボットの運動学・動力学や環境(組織の力学・幾何)を明示的な数式モデルで記述し、そこから計画と制御を導く古典的アプローチです。解釈可能で大量データを要さない一方、軟組織の変形のモデル化が難しく、変動に脆いという弱点があります
  2. 強化学習(RL)->報酬を最大化するよう試行錯誤で方策を獲得する手法です。患者で試行錯誤するのは危険なため、多くがシミュレーションで学習し実機へ転移する(sim-to-real)戦略を採ります。報酬設計の難しさとsim-to-realギャップが主な課題です。
  3. 模倣学習(IL)

があります。ということで、1と2とでは上述のようなデメリットがあるので、ここでは、模倣学習についてみます。

模倣学習

模倣学習(imitation learning)は、専門家(エキスパート)が実演したお手本データを使って、その振る舞いを再現する方策(policy)を機械に学習させる枠組みです。「報酬をどう設計するか」ではなく「上手い人の動きをそのまま真似る」という発想が核にあります。

これは、

手術には、(1)良し悪しを報酬関数で記述しにくい、(2)実機での試行錯誤(強化学習)は患者リスク上ほぼ不可能、(3)一方でda Vinciが世界中で稼働し術中映像・運動データという実演データが大量に蓄積されている——という事情があります。この「報酬設計が困難だが良質な実演データは豊富」という条件が、模倣学習を手術自律化の主流アプローチにしている背景です。

ということになるそうです(Claudeのまととめ)。この方法についての代表的な論文は、

  • Schmidgall ほか”General-purpose foundation models for increased autonomy in robot-assisted surgery” (リンク)
  • Kim他 “SRT(Surgical Robot Transformer): Imitation Learning for Surgical Tasks” (リンク)
  • Kimほか”SRT-H: A Hierarchical Framework for Autonomous Surgery via Language Conditioned Imitation Learning”(リンク)

になります。

  • Schmidgall ほか”General-purpose foundation models for increased autonomy in robot-assisted surgery” (リンク)

この論文は、その要旨によるとき

データから学習する外科用ロボットシステムは、いくつかの理由から、ロボット学習の他の分野ほど急速に進展することができていない。(1) モデルを学習させるための既存の大規模なオープンソースデータが不足していること、(2) シミュレーションでは生体組織の物理的・視覚的な複雑さを再現できないため、手術中にこれらのロボットが扱う軟体組織の変形をモデル化することが困難であること、(3) 外科用ロボットは臨床試験で患者に危害を加えるリスクがあり、より徹底した安全対策が必要であること。本論説記事は、手術用ロボット向けのマルチモーダル・マルチタスク型「視覚・言語・動作」モデルの開発を通じて、ロボット支援手術におけるロボットの自律性を高める道筋を示すことを目的としています。最終的に、我々は、手術用ロボットが汎用モデルの恩恵を受ける上で独自の立場にあると主張し、ロボット支援手術の自律性向上に向けた3つの指針を提示します。

を論じています。

具体的な内容としては

ロボットシステムへの高容量ロボットトランスフォーマーの適用における最近の進展により、大規模な外科医のデモンストレーションデータセットを活用することで、ロボット支援手術の自律性をさらに高める機会が生まれました。

という認識のもと(プレプリント版では)

  • 課題1:リスク回避(Risk avoidance) — 手術では起こりうる全事象を事前に想定することは不可能であり、未経験の事態への適応が要求されるという本質的限界を認めた上で、二つの不確実性定量化手法を提案します。一つは保守的Q学習(CQL)で、訓練分布外の状態への過大評価を抑え、確信度メトリクスを術者に伝えて手動オーバーライドを可能にします。もう一つは適合予測(conformal prediction)で、単一の予測ではなく確率的な予測集合を返し、統計的保証を与えます。

  • 課題2:医療データの統合(Unification of medical data) — 実際に請求に応じてデータを共有したのは6.8%にすぎず、医療分野のコード共有率は0〜23%とAI分野の35〜51%に大きく劣る。さらに著者らは医療上の失敗事例のデータを得ることが困難であり、それがモデルを有害な判断から遠ざける上で重要であると指摘します。

  • 課題3:模倣品質を超える安全性(Beyond imitation-quality safety) — RTは本質的にデモを模倣するため、その性能はデータ品質に上限を規定される。しかし究極の目標は「人間の遠隔操作者より安全な」システムであり、模倣だけでは原理的にそこへ到達できません。処方箋として、患者の短期・長期アウトカムをフィードバックに用いる方策と、専門医による手技品質評価を報酬信号に用いる方策が提示されます。ただし著者ら自身が、アウトカムは患者の全身状態など手術外要因に左右され、品質評価も術者間で意見が割れるため、いずれもノイズを含むと認めています。

模倣学習についての一般的なアプローチをもとに、具体的に、実験について展開されている論文が以下のものになります。

  • Kim他 “SRT(Surgical Robot Transformer): Imitation Learning for Surgical Tasks” (リンク)

これは、実際の検証になります。

本研究では、模倣学習を通じてda Vinciロボット上で外科的操作タスクを学習できるかどうかを検証する。しかし、da Vinciシステムには、模倣学習の単純な実装を妨げる特有の課題が存在する。特に、関節の測定値が不正確であるため、その順運動学は不整合であり、このような近似的な運動学データを用いて単純にポリシーを学習させると、しばしばタスクの失敗につながる。この制限を克服するため、我々は相対的な動作定式化を導入し、近似された運動学データを用いてポリシーの学習と展開を成功させることを可能にした。このアプローチの有望な成果として、近似された運動学データを含む膨大な臨床データリポジトリを、さらなる補正を行うことなくロボットの学習に直接活用できることが挙げられる。我々は、組織操作、針の取り扱い、結紮という3つの基本的な外科的タスクを成功裏に実行することで、この知見を実証した。

というのが概要です。この実験における問題点は、

(1) 難易度の高い外科的操作タスクを学習するには、模倣学習だけで十分か?

(2) dVRKの相対運動は、その絶対的な順運動学よりも一貫性が高いか?

(3) 高い成功率を達成するには、手首カメラの使用が不可欠か?

(4) 我々が提案するモデルは、未見の新規シナリオに対してどの程度汎化できるか?

動作表現また、さまざまな動作表現を用いて参照軌跡を追跡し、その追跡誤差を比較することで、相対運動と絶対運動の一貫性を直接比較した。さらに、手首カメラの有無によるポリシー性能を比較することで、手首カメラの重要性を検証した。最後に、提案モデルが、動物組織が存在するといった、未見の新規シナリオに対して汎化できるかどうかを検討する。これらの実験は、「組織の持ち上げ」、「針の拾い上げと引き渡し」、「結び目の作成」という3つのタスクの文脈で検討される。これらの疑問に答えるため、様々な手法を用いて学習させたポリシーのタスク成功率を比較する。

というものでした。

これに対して組織挙上・針把持と受け渡し・結紮の3タスクで検証します。その結果、軌道追跡のRMSE比較では、ロボット構成を変えるとcamera-centricの誤差が0.6mm→2.8mmに悪化する一方、相対表現は0.7〜0.9mmで安定します。タスク成功率では、camera-centricが全タスクでほぼ0であるのに対し、hybrid-relative + ACTが最高性能を達成し、結紮で18/20を記録します。手首カメラを外すと結紮が4/20まで急落し、その重要性が裏付けられます。汎化評価では、豚・鶏組織や未学習の3D縫合パッド上でのゼロショット成功例が示されます。

  • Kimほか”SRT-H: A Hierarchical Framework for Autonomous Surgery via Language Conditioned-Imitation Learning”(リンク)(プレプリント)

ビデオの図(ビデオは、ここから)

この論文(以下、SRH-T論文といいます)について、構成を維持しながら、Claudeに要約させると以下のようになります。

全体構成

この論文はSnience Robotics形式のため、通常のarXiv論文と節構成が異なり、Introduction → Results → Discussion → Materials and Methods → Supplementary という順序です

1. Introduction(導入)

従来の自律手術研究の限界を3点に整理します。シミュレーションや卓上タスク(peg transfer等)に偏っていたこと、in vivoの実証(針ステアリング、吻合)はあっても、それらは操作(manipulation)より単純なナビゲーションのステップを扱い、単一用途に最適化された手作りの戦略に依存していたことです。

そのうえで本研究の新規性を3点宣言します。第一に把持・クリッピング・切離という多様な道具使用を伴う接触リッチな操作、第二に組織の見た目・解剖・形態が大きく変動する現実的なex vivo環境、第三に個別スキルではなく数分間にわたる手術ステップ全体を扱うこと。前作SRTが「単一サブタスク」の実証だったのに対し、ここで「ステップ全体」へと射程が拡大しています。

2. システム設計(Resultsの前半で記述)

階層構造が核心です。高レベル方策(HL)が自然言語の指示を発行し、低レベル方策(LL)が軌道を実行します。HLは画像履歴を入力に、(1)次のタスク指示、(2)修正フラグ(boolean)、(3)修正運動指示——の3つを出力ます。修正フラグが二値スイッチとして働き、通常時はタスク指示を、リカバリ時は修正指示をLLへ送ります。この「言語で粗く計画し、誤りを言語で修正する」設計が、前作SRTの結論節が明示した限界(言語指示に応答できない)への直接の回答です。LLは前作のhybrid-relative行動表現をそのまま継承し、dVRKの運動学的不整合を補償します。つまりSRTの技術的土台の上にSRT-Hの言語階層が乗る構造です。

ユーザは音声やGUIでHLの出力を一時的に上書きでき、その介入は保存されてDAggerループで継続学習に使われます。これは展望論文(2401.00678)が掲げた「術者への制御委譲」「失敗からの学習」を具体化した部分です。

対象タスクは胆嚢摘出術のクリッピング・切離で、計17タスク(把持1+クリップ6+切離4+各動作後の退避)から成ります。データ収集上の工夫として、ラッチ無効化クリップと「ハサミを閉じない切離模擬」により、1つの胆嚢から数百のデモを反復取得可能にしています。

3. Results(実験結果)

四つの評価軸が順に示されます。

コア実験:8つの未学習胆嚢で全例100%成功、平均所要317秒(約5分17秒)、自己修正は手技全体で平均6回。組織の色・質感・解剖が顕著に異なる中で、関連構造を認識し、自らの失敗から回復して全例を完遂しました。

バリアント比較(アブレーション):設計要素の寄与を切り分けます。修正指示なし(タスク指示のみ)はリカバリ成功率が100%→66.7%に低下、手首カメラ除去は通常・リカバリとも低下(77.8%・50%)、HLのDAgger微調整なしも低下、LLのみのend-to-end版は最低(33.3%)。階層構造と修正言語インタフェースが決定的に重要であることが示されます。またデータ量を33%・66%・100%と変えると成功率が66.7%→77.8%→100%と上昇し、データ規模の重要性も裏付けられます。

HL方策のアブレーション:センタークロップ入力、L1距離でスケールした交差エントロピー損失、4フレームの観測履歴——の3工夫が検証され、タスク指示予測で約97%の精度を達成。観測履歴を外すと10%超の大幅低下が生じます。注目すべき副次実験として、GPT-4oをHL方策に転用した比較があり、GPT-4oは「胆嚢把持」という重要ステップを省略したり、クリッピング/切離からの退避を完了前に誤って指示したりと、領域特化の理解に欠けることが示されます。汎用VLMでは手術計画に不十分で、ドメイン微調整が必要という結論です。

熟練外科医との比較:予備的比較として、外科医はSRT-Hより速く完遂する一方、SRT-Hは外科医より軌道長が短く、平均ジャークも小さい、すなわちより滑らかで短い軌道を生成すると報告されます。ただし著者らは胆嚢数の不足を認め、優越性の強い主張は避けています。

4. Discussion(考察)

論文はLoA 0(自律性なし)からLoA V(完全自律)までの枠組みを引いた上で、SRT-HはLoA IV(高度自律)に位置づけられる——信頼性高く自律実行し自己修正もするが、自己修正指示はシステム自身が生成したものであってユーザが発したものではないと自己分類します。決定的な留保として、本システムは分布外シナリオに対して故障しないわけではないため、外科医が常にその動作を監督すべきであると明記します。さらに環境複雑性(LoEC IV)・タスク複雑性(LoTC IV)でも自己分類し、LoTC Vに達しない理由を「臨床的・解剖学的知識の欠如」と率直に述べています。

先行する自律腸吻合研究(Saeidi 2022)との直接比較では、吻合は一見高度に見えるが、足場固定・蛍光マーカー・専用縫合器という補助に依存し手作り状態機械を用いていたのに対し、SRT-Hは特殊な固定具・マーカー・専用器具を要さず模倣学習で適応的技能を獲得し、術中自己修正も可能、と優位性を主張します。

限界として、ex vivoからin vivoへの移行(出血・組織運動・腹腔鏡ポートへの手首カメラ適合)が挙げられます。安全性向上の方向として、展望論文が掲げた保守的Q学習(CQL)と適合予測(conformal prediction)の組込み、自動運転由来の安全切替プロトコル、不確実性に基づく遠隔操作者への介入要請が示されます。

5. Materials and Methods(材料と方法)

データ収集の詳細(34胆嚢から約16,000軌道・約17時間、非臨床の研究助手2名が外科レジデントの訓練下で収集)、HL方策の構成(Swin-T小型版エンコーダ+Transformerデコーダ、3秒ごとに推論、損失関数の数式)、LL方策の構成(EfficientNet-B3+DistilBERT言語埋め込みをFiLM層で融合、20次元行動空間、6D回転表現、約7,200万パラメータをRTX 4090単体で学習)、推論時のチャンク実行ホライズン調整などが厳密に記述されます。付録には18種の修正指示一覧、GPT-4oプロンプト、HL方策の性能表が収録されています。


SRT-Hは Hierarchical Surgical Robot Transformer(階層型外科手術ロボットトランスフォーマー)の略です。論文ではSRT-Hを、SRT-Hは、タスク指示と修正指示を含む自然言語の指示を発行する高レベル(HL)方策と、低レベルの軌道を実行する低レベル(LL)方策から構成される階層構造を用いる。この構造により複雑な手技を短いタスクへ分解し、長時間ステップで自然に生じるLL方策の誤りをHL方策が修正できる、という設計思想によって構築された自律のためのフレームワークということができます。その本質を階層型アーキテクチャに置いています。

4で上げられた自律手術のレベルの議論については、自律性のレベル 医療用ロボットの自律性レベル(LoA)は、純粋な遠隔操作から完全自律に至るまで、明確な段階に分類されるとして、

  • LoA 0は自律性が全くない状態を表し、ロボットは人間の操作者によって制御される単なる道具として機能する。
  • LoA Iは「ロボット支援」と定義され、ロボットが機械的な誘導や仮想的な制約といった継続的な制御支援を提供するものの、制御権は依然として人間が完全に保持している。
  • LoA IIは「タスク自律」を指し、ロボットが、人間からの離散的な制御コマンドによる入力に基づいて、縫合などの特定のタスクを自律的に実行する。
  • LoA III(条件付き自律)では、システムがタスク戦略を自律的に生成できるが、人間のオペレーターがその中から選択するか、自律的に選択された戦略を承認する必要がある。
  • LoA IVに分類される「高度な自律」システムは、医療上の判断を独立して下すことができるが、依然として有資格の医師による監督を必要とする。
  • 最後に、LoA Vは完全自律を表し、ロボットが人間の介入を一切必要とせずに手術全体を遂行できる状態を指す。

と整理されます(論文としては、Tamás Haidegger. Autonomy for surgical robots: Concepts and paradigms. IEEE Transactions on Medical Robotics and Bionics, 1(2):65–76, 2019. が引用されています。) 。

ということで、まだ、LoA Vの完全自律というわけではありませんが、それこそ、自動運転自動車のWaymoを経験した身(リンク)としては、完全自律手術ロボットが実現する日も近いだろうとおもいます。そこで、そのような完全自律の手術ロボットについてのその法的論点を改めて検討する時期が来たようにおもわれます。

第2 「自律型医療ロボットの法律問題」(2026)

2017年時点での「医療ロボットの法律問題」を日本法(医薬品医療機器等法=薬機法、医療法等)の枠組みからまとめた記事です。

この記事の射程は主に次の3点に集約されています。そのとき使用した図をもとに再度考えていきます。

第一に、システム自体の問題として①自律性の限界(自律ロボットが医療行為をなしうるか)、②安全・セキュリティ、③透明性・許容性。第二に、関係者に関するリスク対応の問題に分けられるとしています。そして、このエントリは、「自律性の限界」を未解決の入口の問いとして提示しているものの、完全自律型手術機器が現実化したときの責任配分には踏み込んでいません。

ここで、①自律性の限界(自律ロボットが医療行為をなしうるか が正面から議論される場合が到達したということになります。

1 自律性の限界(自律ロボットが医療行為をなしうるか)

1.1 医師法17条の解釈の一般論

これについては、10バガーメモで、

医師の医学的判断及び技術をもってするのでなければ人体に危害を及ぼし、又は及ぼす虞のある行為

については、「医行為」となります。 (なお、タトゥー事件最高裁決定(最決令和2年9月16日)は、これに「医療関連性」(医療及び保健指導に属する行為であること)を加えているとされるようですが、細かくは、省略)

医師法17条は、

医師でなければ、医業をなしてはならない

と規定しています。違反には31条で罰則が科されます。これに上述のような自律型手術ロボットを利用した手術は、医師法17条違反にならないのか、ということになります。

これについては、平成30年12月19日の医政局医事課長通知(医政医発1219第1号)「人工知能(AI)を用いた診断、治療等の支援を行うプログラムの利用と医師法第17条の規定との関係について」が参考になります(PMDAのリンク)。

その内容は、「厚生労働行政推進調査事業費補助金(地域医療基盤開発推進研究事業)AI 等の ICT を用いた診療支援に関する研究(H29-医療—指定−015)」(診療支援研究といいます)という研究に関して

人工知能(AI)を用いた診断・治療支援を行うプログラムを利用して診療を行う場合についても、診断、治療等を行う主体は医師であり、医師はその最終的な判断の責任を負うこととなり、当該診療は医師法(昭和 23 年法律第 201 号)第 17 条の医業として行われるものであるので、十分ご留意をいただきたい。

というコメントをしています。では、この通知は、上述のSRT-Hをもちいた手術について、なにかの関係を与えるのかということになります。この点については、この診療支援研究は、

AI は診療プロセスの中で医師主体判断のサブステップにおいて、その効率を上げて情報を提示する支援ツールに過ぎない

という利用に関して、論じたものにすぎませんでした。

患者に間接作用する“診断支援のためのAI 医療システム”と、患者に直接作用する“治療支援の AI 医療システム”とに類型化することができる

ということは、一般的な理解のようです(医薬品医療機器総合機構科学委員会専門部会 AI 専門部会「AI を活用した医療診断システム・医療機器等に関する課題と提言 2017」(2017 年))。したがって、上記井内は、その意味で自律型手術システムに、そのまま適用されるものではないといえるでしょう。しかしながら、患者に直接作用するシステムといえども、基本的には、同様な枠組が適用されるものと考えられます。

そうはいっても、上述のLoA IVの

 医療上の判断を独立して下すことができるが、依然として有資格の医師による監督を必要とする(can make medical decisions independently but still require supervision by a qualified doctor.)。

というのは、厳密には、手術ロボットについては

人体に危害を及ぼし、又は及ぼす虞のある行為を独立の動作のもとに行いうるが、依然として有資格の医師による動作のオーバーライドが必要とされること

ということだと考えられます。ここで、「動作」とすべきなのは、

  • 判断について医師が決定し、その後、一定の動作をなすとプログラムされている場合についても医師によるオーバーライドが必要であること
  • 人体への危害は、判断および動作から成り立ちうるが、危害が及ぶのは、「動作」によってであって、「判断」そのものではないこと

となるものと思われます。

1.2「意味ある人間の制御」(meaningful human control)

自律型手術ロボットによる、人体に危害を及ぼし又は及ぼす虞のある独立動作について、医師法17条の適用上、

当該動作が、有資格の医師によるオーバーライドが現実になしうる環境——すなわち意味ある人間の制御(meaningful human control)が及ぶ環境——のもとで行われる場合には、当該医行為はなお医師によってなされていると評価でき、17条の医業独占に反しない。

と解されるものと思われます。

SRT-Hのような自律判断型システムでは、機械が医師の意図とは独立した内部状態(観測履歴の統合)に基づいて判断を生成するため、素朴な道具理論——機械は医師の意図を体現するにすぎない——は維持しがたいことになります。そこで道具理論を、結果ではなく可能性のレベルで再構成する。すなわち、機械が自律判断するとしても、医師がその判断を理解し覆却しうる地位を現に保持している限り、機械はなお医師の支配下にある「制御可能な道具」であり、医行為の主体は医師に留まる、と解することができます。ここで決定的なのは、医師が実際に毎回オーバーライドしたか(行使の事実)ではなく、オーバーライドしうる環境が現に確保されているか(支配の可能性)である。医師法17条の趣旨が、危険を有資格者の支配下に置くことで国民の生命身体を守る点にある以上、支配の可能性が確保されていれば、立法目的は充足されると考えられます。

逆に、そのような制御が形骸化し、医師が判断形成を理解も覆却もできない環境のもとで動作がなされる場合には、医行為の主体は機械に移転しており、17条の趣旨——有資格者による医学的判断の担保——が損なわれることになります。

問題は、いかなる環境であれば「意味ある(meaningful )」制御といえるか、になります。ここで、Table S2の数値が論証に組み込まれます。観測履歴を外すとタスク指示予測の精度が97.29%→85.44%(約11.85ポイント低下)、F1で97.18%→84.56%(約12.62ポイント低下)に落ち、修正フラグのF1に至っては91.03%→57.07%へと半減します。この事実は、SRT-Hの判断——とりわけ「いま自分は失敗状態にあるか」という自己状態認識——が、過去数秒の観察履歴の統合に決定的に依存していることを示します。

この技術的事実は、二方向の含意を持ちます。

  • 消極方向から見れば、これはMHCの形骸化リスクを示す。機械の判断が時系列的文脈の内部統合として形成される以上、医師は出力された言語指示は読めても、その指示がどの観察履歴を根拠に形成されたかは認識できません。判断形成過程がブラックボックスである以上、医師の「追随」は出力の事後承認にとどまりやすく、真の意味での判断の共有・検証には達しがたいことになたます。したがって、単に医師が立ち会っているだけでは追随可能性要件は充たされず、MHCは名目に堕する危険があることになります。
  • 積極方向から見れば、これはMHCを要件として要求すべき必要性そのものを基礎づけます。判断がこれほど高度に文脈依存的で、その中核(自己状態認識)が履歴を欠くと半減するほど不安定である——裏返せば、分布外状況で履歴の統合が機能不全に陥れば、システムは正常動作の外観のまま誤った自己認識に基づいて動作しうる。前回確認した約10%の解剖学的異常胆嚢の除外という設計上の限界と合わせれば、この不安定性が顕在化する局面は現実に存在する。だからこそ、機械の自己状態認識が崩れる事態を外部から検知し介入する医師の関与が、危険縮減のために不可欠となる。MHCは、機械の時系列的自己認識が破綻する分布外局面における、最後の安全弁として要求されることになります。

このような考察の元、MHCが実質を備えるためには、少なくとも次の三要件が必要と解されます。

  1. 第一に、判断の可視性です。医師が、機械の生成する判断を実時間で認識できなければなりません。SRT-Hにおいては、HL方策の出力が「胆嚢を把持」「右アームを右へ」といった自然言語で表現される設計が、この要件に資することになります。数値ベクトルでなく可読な言語で判断が提示されることは、可視性の最低限を満たします。
  2. 第二に、覆却の実効性です。医師が、認識した判断を現実に覆せる手段を持たねばなりません。SRT-Hが音声・GUIによるオーバーライドを実装し、3秒間その出力を上書きできる設計は、この要件に対応します。
  3. 第三に、追随可能性です。これが最も問題含みの要件です。判断が可視で覆却可能であっても、医師が判断列に実時間で追いつけなければ、制御は形骸化します。SRT-Hは3秒ごとに判断を更新し、その判断は過去4フレームの時系列積分として形成されます。医師がこの更新速度と判断形成の文脈依存性に認知的に追随しうるか——ここにMHCの実質性の最大の試金石があります。

上記三要件(可視性・覆却の実効性・追随可能性)を充たすMHC環境のもとにおいては、機械が独立動作のもとに危険行為を行っても、医師が当該危険を実質的に支配・縮減しうる地位を保持しているため、医行為はなお医師に帰属し、17条違反は生じないと解されます。

一方、三要件のいずれか——とりわけ追随可能性——を欠く環境においては、どのように考えるかという問題があります。

医師が判断形成に追随できず、オーバーライドが事後承認の形式に堕する環境下では、医行為の主体は実質的に機械へ移転しており、有資格者による医学的判断の担保という17条の趣旨が損なわれる。この環境での運用は、たとえ形式的に医師が立ち会っていても、医業独占の潜脱と評価されることになり、そのような自律型手術ロボットの使用は、医師法違反と考えられます。

そのような環境を確保し得ないような設計は、医療機器としても認められないということになります。そして、いかなる使用環境を整えてもMHCの三要件を構造的に充足しえない設計の機器は、適法な使用が原理的に不可能であるがゆえに、薬機法上の承認要件たる安全性確保を充たさず、医療機器として承認されえないと考えられます。すなわち、MHC環境の確保を可能にする設計であることが、自律型手術ロボットの医療機器承認の必要条件となると考えられます。
ただし、設計上MHC確保が可能であることは承認の必要条件にとどまり、現実の運用におけるMHCの実現は、施設・術者・運用基準という別の規律層によって補完されねばならないことになります。

1.3 「意味ある人間の制御」を超えた自律

自律型手術支援システムの医師法上の位置づけを順に詰めていくと、最後には

意味ある人間の制御(meaningful human control。以下「MHC」という。)を超えた自律型手術ロボットをどう考えるべきか

という問いに行き着きます。これについては、性質の異なる二つの側面があります。

第一は、MHCが事実上不可能となる段階です。機械の判断が速すぎ、また複雑すぎて、医師が原理的に追随できません。判断が過去の観測履歴の時系列的統合として形成され、その履歴を欠くと自己状態認識が半減するという技術的知見が示した「追随可能性の高いハードル」が、技術の進展によってついに越えられなくなった状態です。ここでは、医師は監督したくてもできません。

第二は、MHCがかえって有害となる段階です。SRT-H論文は既に、システムが外科医より滑らかで短い軌道を生成すると報告し、医療AIをめぐる先行の検討でも、AIが医師の能力を明らかに超えた場合が想定されていました。機械が医師より安全・正確に判断し実行するのであれば、医師のオーバーライドはむしろ性能を劣化させ、患者を危険にさらしかねません。ここでは、医師が介入しないことこそが患者の最善となります。

とりわけ第二の場合には、患者の生命身体を守るために医師の関与を求めるという考え方が、その前提そのものを失います。医師が関与しないほうが患者の生命身体にとって安全である――この反転した状況にどう対応するかについては、自動運転の権限委譲を参照すべきだと思います。自動運転がレベル4・5(高度・完全自律)において「運転者」概念を後退させ、システムの型式認証と製造者責任に重心を移したのと同様に、自律型手術ロボットについても、執刀の「主体」の特定を放棄し、システム認証と運用機関・製造者の責任へと再編すべきでしょう。この場合には、「適法に承認された自律システムによる動作は医業独占の例外とする」旨の、明文の例外規定を置くことになります。

もっとも、この再編には、説明責任(accountability)の実現が困難になるという問題が伴います。患者の相手方たる医療法人が負う債務には、結果について賠償する責任だけでなく、何が起きたかを説明する義務(顛末報告義務。民法第645条の準用)が含まれます。患者は、自己の身体に何がなされ、なぜ過誤が生じたかを知る正当な利益を持つからです。ところがMHCを超えますと、判断を実質的に行ったのは機械であり、その判断は過去の観測履歴を時系列的に統合したブラックボックスの内部で形成されます。医療法人は責任主体として説明義務を負い続けますが、説明すべき判断内容そのものが、医療法人にも医師にも製造者にも事後に再構成できない、という懸念が生じます。

いま一つ、万が一、自律型手術ロボットによって医療事故が発生した場合にどうすべきか、という問題が生じます。この点もまた、自動運転をめぐって既に行われた議論の方向で対応することが望ましいと考えられます。

すなわち、問うべきは「自律システムは事故を起こすか」ではありません。「自律システムを採用した場合に社会に生じる総事故コスト(機械由来の過誤による生命身体の損失×件数+保険料)と、採用しない場合に社会に生じる総事故コスト(医師由来の過誤による生命身体の損失×件数+医師の疲労や手術アクセスの地理的偏在に起因する不利益)の、いずれが小さいか」という比較衡量に視点を据えるべきです。前者が後者を下回るのであれば、社会全体としては採用が合理的である、という帰結になります。医師法第17条の「より安全な方を選ぶ」という趣旨に照らせば、同条が医師独占を定めたのは医師の方が安全だったからであり、機械の方が安全であるならば、同じ趣旨が機械の採用を支持する方向へと、第17条を発展させなければなりません。

では、第17条を発展させるために具体的に何を要するのでしょうか。自動車における自賠責保険に相当する強制保険の基盤が医療には存在しないため、無過失補償基金等の新設が必要となります。そのうえで、先に述べた説明責任の実現困難という問題を併せて考えますと、対応すべき柱は次の三点に収斂します。

  1. 第一に、医師法第17条の例外(行為規制の解除)
  2. 第二に、保険による損失分配(無過失補償基金)
  3. 第三に、記録義務による説明の確保

このように考えを進めた結果として「自律型手術支援システムの実装と責任に関する法律(試案)」を作成しました。試案は、この三点を一体の仕組みとして条文化し、各条がいかなる論点に対応するかを逐条解説と対応表で示しています。

自律型手術支援システムの実装と責任に関する法律(試案)RobotSurgeryをクリック

この試案の条文を実際に起草したのは、対話の相手である人工知能Claudeでした。そのことに、正直なところ、いくらかの敗北感がないと言えば嘘になります。もっとも、振り返ってみますと、この敗北感は奇妙な相似の上に立っています。このエントリで論じてきたのは、まさに「機械が人間の能力の一部を上回ったとき、人間の関与をどう位置づけ直すか」という問いでした。執刀の主体の特定を放棄し、システムと運用者の責任へと再編する――そう論じた当の検討において、文章を組み立てる作業の一部が機械に委ねられたのです。主題と過程が、ここで思いがけず重なり合います。

そして、執刀の比喩を借りるならば、構想という名の判断を下し、不正確な定式を一つひとつ補正し、議論を次の段へと進める方向づけを行ったのは、筆者の側でした。機械が引き受けたのは、その判断を条文の形式へと整える清書の作業にすぎません。手術において執刀主体の特定を放棄してもなお監督と責任が人間に残るように、この覚書においても、何を問い、どこへ進むかという判断は、最後まで人間の手のうちにありました。敗北を喫したのではなく、制御の様式が組み替わったわけです。このブログの作業自体が、医師法17条を巡る議論のミラーとなっていたといえます。

基本的には、ちょっとした思考実験なので、公表されている論文について精査している余裕はなかったので、なんなのですが、方向性としては、このような方向性でいいものと考えます。過去の研究とかをふまえた研究等については、資金を募りたいなあと思うところでもあります。

第3 10バガーメモのその余のアップデート

10バガーメモについていえば、2026年の段階で考えるべきこととしては

  1. 「故障」概念に基づく責任論の射程外問題、
  2.  インフォームド・コンセントの再設計
  3.  SBOM義務化の延長線上にある「学習データ・モデルの来歴管理」
  4. 機器の同一性の問題

があると思います。これらの問題については、次のエントリでまとめたいと思います。

関連記事

  1. 脆弱性発見ツールの法律問題-MythosとCVD/法規制/輸出規…
  2. Line Developer’s Day
  3. CyConX travel report Day Two key…
  4. 行政分野での自動的意思決定(AI)のEU の参考文献を読む
  5. サイバー影響工作の定義-CSS CYBER DEFENSE “C…
  6. AIの基盤モデルとAI規則案修正(6月14日)
  7. 「人工知能の発展と企業法務の未来(1)」NBL角田論文を読んで
  8. 英国のサイバー軍 公式に登場
PAGE TOP