AIコンサル

【2026年6月最新】OpenEvidence(オープンエビデンス)完全ガイド:全米4割の医師が使う医療AIの仕組み・日本での使い方・企業AI活用への示唆

2026-01-21濱本 隆太

全米4割の医師が利用し、月間1,500万件の臨床相談を処理する医療AI「OpenEvidence」を、Nadler CEO発信情報+NEJM公式パートナー発表+日本側ガイドラインまでを2026年6月時点の一次情報で整理。Claude/ChatGPTとの違い、日本で使う際の手順、保険収載との乖離、企業の機密文献AI活用(ZEROCK)に応用できる示唆を、ビジネスパーソンにもわかる視点で解説します。

【2026年6月最新】OpenEvidence(オープンエビデンス)完全ガイド:全米4割の医師が使う医療AIの仕組み・日本での使い方・企業AI活用への示唆
シェア

こんにちは、株式会社TIMEWELLの濱本隆太です。

2026年5月、米国の医療AI「OpenEvidence」が2億ドルを追加調達し、全米4割の医師が利用するインフラに成長したことが大きく報じられました[^isao]。月間1,500万件の臨床相談を処理し、NEJM(New England Journal of Medicine)・JAMAおよびそれら11の専門誌の公式AIパートナーに認定されています[^decades]。

医療従事者向け検索AIと一括りにされがちですが、OpenEvidenceの設計思想は「査読済み医学文献に特化して訓練し、出典付きで答えるAI」という点にあります。汎用LLMとは別の方向に進化したこの設計は、医療以外の業界、特にエンタープライズAIにも大きな示唆を与えます。

私自身、AIコンサルティングの現場で「ChatGPTに社内ドキュメントを読み込ませて使っていいか」「ハルシネーション対策はどう設計するか」という相談を毎週受けています。OpenEvidenceの仕組みを丁寧に紐解いていくと、その問いに対する答えの一つが見えてきます。2026年6月時点の一次情報をベースに、OpenEvidenceの仕組みと普及状況、日本の医師が使う具体的手順、日本で運用する際の落とし穴、そこから抽出できる企業AI活用への示唆、までを順に整理します。

OpenEvidenceとは:全米4割の医師が日常的に使う医療AI

OpenEvidenceは、ハーバード大学医学大学院ベス・イスラエル・ディーコネス医療センターからのスピンアウトとして発足した米国の医療向けAIスタートアップです[^openevidence]。創業者・CEOは経済データAI「Kensho」(後にS&Pグローバルに5億5,000万ドルで売却)を立ち上げたDaniel Nadler氏で、2社目の挑戦として「医師の意思決定を支援するAI」を選びました。

普及スピードが特異です。2026年初頭の時点で、米国の医師約100万人のうち約40%が登録ユーザーとなり、月間1,500万件以上の臨床相談がプラットフォーム上で処理されているとされます[^decades]。便利な検索ツールというより、米国医療のフロントエンドに新しい層が一枚追加されたと見たほうが、規模感を捉えやすいと思います。

指標 数値 補足
米国医師の利用率 約40% 全米100万人ベース
月間臨床相談数 1,500万件以上 2026年1月時点
提携医学雑誌 NEJM・JAMA+11専門誌 公式AIパートナー
直近資金調達額 2億ドル 2026年5月
評価額 60億ドル超 同調達ラウンド
主要投資家 Sequoia Capital、Kleiner Perkins他 シリーズBおよびC

2026年5月の2億ドル調達でユニコーン化したと報じられているわけではなく、すでに評価額60億ドルを超える「メディカルAIの最大手」として扱われています[^isao]。Sequoia CapitalやKleiner Perkinsといった一流ベンチャーキャピタルが上位ラウンドに参加し、提携先には世界最高峰の医学雑誌が並びます。

収益モデルも独特です。OpenEvidenceは医療従事者には無料で提供され、製薬企業の広告と研究パートナーシップから収益を得る構造になっています。Google検索が広告モデルでユーザー無料を実現したのと同じ発想で、医療版のフロントエンドを押さえに行っている、と読むのが個人的にしっくりきます。

仕組み:なぜ「出典付き」で答えられるのか

汎用LLM(ChatGPT、Claude、Geminiなど)はインターネット上のテキスト全般で訓練されています。一方OpenEvidenceは、訓練データを「査読済み医学文献に厳しく絞り込む」ことで差別化しています。

公開情報から推察すると、訓練コーパスは次のような構成になっていると見られます。

  1. 査読済み医学雑誌:NEJM、JAMA、Lancet、BMJ、Cell、Natureなど300以上のジャーナルからの論文本文
  2. 臨床ガイドライン:米国内科学会(ACP)、米国心臓協会(AHA)、NCCN(がん)、IDSA(感染症)など、専門学会の最新版ガイドライン
  3. 規制機関の一次情報:FDA(食品医薬品局)の添付文書・承認情報、CDC(疾病予防管理センター)の感染症ガイダンス
  4. 薬剤データベース:相互作用、用量、禁忌情報

このコーパスに対して大規模言語モデルを訓練・チューニングしたうえで、検索拡張生成(RAG)で関連文献を取り出して回答を生成しています。回答には必ずDOI付きの引用が並び、医師はその場で原文に飛んで一次情報を確認できる作りです[^openevidence]。

押さえておきたいのは、「ハルシネーションが起こりにくい」のではなく「ハルシネーションが起きても医師が即座に検証できる」設計だ、という点です。幻覚を完全に防ぐAIは現時点では存在しません。OpenEvidenceは出典を必ず返すことで、医師の批判的吟味(critical appraisal)をワークフローに組み込ませる構造を選んでいます。

汎用LLMとの違いを表に整理します。

項目 OpenEvidence ChatGPT/Claude(汎用)
訓練コーパス 査読済み医学文献に特化 一般的なウェブテキスト全般
出典 DOI付きで必ず提示 任意(ハルシネーションあり)
最新ガイドライン反映 公式パートナー経由で即時 学習データのカットオフに依存
主たるユーザー 医療従事者(認証あり) 一般ユーザー
料金 医師は無料 有料プランあり
規制との整合性 「教育ツール」として運用 医療目的での使用は推奨外

2026年初頭にAnthropicがClaude Opus 4.7のメディカルベンチマーク改善を発表し[^anthropic]、汎用LLMの医療タスク性能は確実に上がっています。それでも、ガイドラインのバージョン管理、出典の引用責任、医療従事者という閉じたユーザーベース、という3点でOpenEvidenceの位置取りは独自性を保っています。

AI研修・コンサルティングをお探しですか?

WARPの研修プログラムとコンサルティング内容をまとめた資料をご覧ください。

日本の医師が使う具体的手順

「日本から使えるのか」という問いは、私のところにもしばしば届きます。結論から言えば、2026年6月時点では使えます。openevidence.com に直接アクセスし、医師であることを証明する書類をアップロードして審査を受ける。これが基本のフローです。

登録手順

  1. ウェブ版にアクセスhttps://www.openevidence.com/ を開く
  2. アカウント作成:メールアドレスを登録(gmail等の個人メールも可だが、医療機関のドメインだと審査が早い)
  3. 医師認証:医師免許証の画像をアップロード。日本の医師免許証でも受け付けられた事例が複数報告されている[^decades]
  4. 専門領域・所属の登録:診療科、所属医療機関などを入力
  5. 承認後、利用開始:通常1〜3営業日で利用可能になる

ゲストモードでの一時的な利用も可能で、認証前にプロダクトの感触を試すことができます。スマートフォン向けにはiOS・Androidのネイティブアプリが提供されており、外来の合間に手元で参照する用途でも使われています。

日本語での使用

2026年に入り、日本語での入力に対応しました。質問を日本語で書くと、英語の論文を解釈したうえで日本語で回答が返ってきます。引用論文のリンクは英語のままなので、深掘りには英語論文を読む力が必要ですが、サマリー段階での言語障壁は大きく下がっています。

GIGAZINEが2026年6月1日に実施した検証では、「最近、慢性的な疲労感と関節の痛みがあり、原因がわからず困っています」といった主訴を入力すると、鑑別すべき疾患候補、それぞれの根拠論文、推奨される検査が出典付きで返ってきたと報告されています[^gigazine]。一般ユーザーが診断ツールとして使うことは想定外。ただし医師が情報整理に使う前提なら、日本語環境でも十分機能するレベルに達したと見ています。

使い方の典型パターン

実際に使われている問い方には、いくつかの定石があります。

  • 鑑別診断:「50歳男性、3週間続く乾性咳嗽と労作時呼吸困難。CRP正常、心電図異常なし。鑑別診断を5つ、それぞれの根拠論文付きで」
  • 薬剤選択:「妊娠20週の妊婦に対する重症COVID-19の治療選択肢を、最新ガイドラインに基づき教えてください」
  • 副作用評価:「Drug A と Drug B の相互作用を、最近5年間の症例報告とともに整理してください」
  • 患者説明:「ステージIIIの乳がん患者に対するアジュバント療法の選択肢を、患者向けに平易な英語で要約してください」

医師向けプロダクトでありつつ、患者説明用テキストの下書きや臨床研究のリサーチクエスチョン設計など、隣接する用途への染み出しも進んでいます。


【企業のAI活用に応用するなら】

「査読済み文献に特化して、出典付きで答える」というOpenEvidenceの設計思想は、医療以外の業界でも応用可能です。法律事務所は判例AI、製造業は技術文献AI、金融機関は規制文書AIといった具合に、専門領域コーパスに特化したAIへの需要が立ち上がっています。

TIMEWELLが提供するエンタープライズAIエージェント ZEROCK は、企業の社内文書・契約書・規程・特許など機密情報のナレッジ管理に特化したAIエージェントです。日本国内AWSサーバーで運用、LLM学習対象外、回答に必ず出典URLを付与します。

→ ZEROCKの個別相談を予約する(30分)


ChatGPT、Claude、UpToDateとの違い

OpenEvidenceの立ち位置を理解するには、競合や隣接プロダクトとの違いを押さえる必要があります。私が現場でよく聞かれるのは「ChatGPTで十分では?」「UpToDateと何が違うの?」の2つです。

ChatGPT・Claudeとの違い

汎用LLMは「あらゆる質問に答えられる代わりに、医療領域では責任を持ちきれない」設計になっています。利用規約上も医療目的での利用には注意喚起が入る。ハルシネーションが診療判断に直接影響する領域では、規約・運用の両面で導入のハードルが高いのが実情です。

OpenEvidenceは逆に、「医療しか答えない代わりに、医療では責任を持つ」というポジションを取りました。医師認証、出典の必須提示、教育ツールとしての位置付け、FDA未承認の臨床判断機能との明確な切り分け。この4点で線を引いています。汎用LLMが「広く浅く」なのに対し、OpenEvidenceは「狭く深く」を選んだ、と理解するのが個人的にはしっくりきます。

UpToDateとの違い

UpToDateは、Wolters Kluwerが提供する臨床意思決定支援システムで、医療従事者向けに30年近い歴史があります。専門医のチームが手動で査読しながら記事を執筆・更新する構造で、信頼性は非常に高い一方、回答までのステップが多く、自然言語での「会話的」な検索には向いていません。

両者の違いを整理すると次のようになります。

比較軸 OpenEvidence UpToDate
形式 エージェント型(会話的) データベース型(記事閲覧)
情報源 査読済み論文+ガイドライン 専門医による執筆記事
更新頻度 連続的(学習データ更新) 記事単位で随時更新
料金(医師) 無料 有料サブスク
検索体験 質問→直接回答+出典 キーワード→記事→読解
強み 即応性と網羅性 専門家編集の信頼性

UpToDateを完全に代替するというより、「外来診療中の3分間で結論まで持っていきたい局面」がOpenEvidence、「腰を据えて領域全体を読み込みたい局面」がUpToDate、という棲み分けで使われ始めています。両方を併用する医師も多く、OpenEvidenceが既存ツールを駆逐したわけではありません。

「最初に診断仮説を出してくれる」体験設計

OpenEvidenceが現場で支持される理由として、「会話の最初のターンで、診断仮説のリストを返してくる」UX設計があります。検索結果や論文リストではなく、最初から「疑うべき疾患はこれとこれです、それぞれの根拠論文はこちら」という構造化された回答が返ってくる。医師の認知プロセス(鑑別を立てて検証する)と並走する作りになっており、従来のデータベース型ツールでは実現が難しかった体験だと思います。

日本で運用する際の注意点:保険収載・国内ガイドラインとの乖離

ここまで読むと「日本でも使えるなら使ったほうがよい」と感じるかもしれません。実際に外来で活用している日本の医師は増えていますが、運用上の注意点は無視できないと考えています。

「最新の標準治療」が日本では未承認・保険外のケース

OpenEvidenceは米国の最新エビデンスを反映しているため、米国では標準治療として推奨されている薬剤や治療法が、日本では未承認だったり保険適用外だったりすることが普通にあります。たとえば肥満症治療薬や一部のがん免疫療法、希少疾患の遺伝子治療は、米国で承認されてから日本で保険収載されるまでに数年単位のラグが生じます。

OpenEvidenceの回答を読んで「最新の標準治療」として患者に提示してしまうと、保険診療では使えない、自由診療になる、そもそも国内で入手できない、といった事態が起きます。提示されたエビデンスを批判的に評価し、日本のガイドラインと保険ルールに照らして読み替える運用が前提になります。

国内学会ガイドラインとの差異

日本のがん診療ガイドライン、循環器学会ガイドライン、糖尿病学会ガイドラインは、独自のエビデンス評価とコンセンサスプロセスを経て策定されています。同じRCTを評価しても推奨度がNCCNや欧米学会と異なるケースは少なくありません。

OpenEvidenceは米国学会のガイドラインを優先的に学習しているため、回答が国内学会の推奨と食い違うことがあります。この場合、「どちらが正しい」ではなく「どちらの推奨にどんな根拠と背景があるか」を医師が解釈する必要があります。教育用途や参考情報という位置付けで使う限り問題ありませんが、ガイドラインを丸暗記する代替として使うのは危険です。

日本の規制環境との位置付け

日本では、AIを医療機器として使う場合、薬機法上のSaMD(Software as a Medical Device)規制が適用されます。PMDA(医薬品医療機器総合機構)の医療機器プログラム承認を取得している製品とそうでない製品の境界は厳格に管理されています[^pmda]。

OpenEvidenceは現時点で日本のSaMD承認を取得しているわけではなく、あくまで「医療従事者向けの教育情報ツール」として位置付けるのが妥当だと考えています。診断支援AIとして保険算定の対象にしたり、診療録に「OpenEvidenceが診断した」と記載するのは想定外です。

参考になる国内ガイドラインとしては、厚生労働省が2024年9月に公表した「医療デジタルデータのAI研究開発等への利活用に係るガイドライン」があります[^mhlw]。HAIP/CIPが公表した「医療・ヘルスケア分野における生成AI利用ガイドライン 第2版」も実務上の参照点として有用です[^haip]。FDAは2026年早期までに1,350件以上のAI/ML SaMD製品を承認しており、規制と実装の双方が急速に整いつつあります[^fda]。

医師の責任と免責の整理

OpenEvidence側の利用規約でも、最終的な診療判断は医師の責任で行うことが繰り返し明記されています。AIの回答をそのまま採用したことによる医療過誤の責任を、現時点でOpenEvidenceが負うことはありません。汎用LLMの利用規約と本質的に同じ構造です。導入する側は、補助ツールとしての使い方を逸脱しない運用ルールを院内で整備することが必須になります。

企業のナレッジ管理AIに応用できる「文献AI」発想

ここまでOpenEvidenceの仕組みと運用を見てきました。最後に、これを企業のAI活用にどう応用できるか、というビジネス側の論点に踏み込みます。

OpenEvidenceの設計から抽出できる4つの原則

OpenEvidenceが医療現場に浸透した理由を分解すると、次の4つの原則に集約されます。

  1. 専門領域コーパスへの特化。訓練データを汎用ウェブから「査読済み医学文献」に絞り込んだ
  2. 出典URL付き回答の必須化。回答にDOIを必ず付与し、ユーザーが原典を検証可能にした
  3. ユーザー認証によるリスクコントロール。医師であることを認証したうえでしか深い機能を使わせない
  4. 業界の正典との公式提携。NEJMやJAMAとの公式パートナーシップで「正しさ」の根拠を社会的に担保した

この4つは、医療以外の専門領域でもそのまま再現可能だと考えています。法律事務所が判例・条文に特化したAI、製造業が技術文献・特許に特化したAI、金融機関が規制文書・社内コンプライアンス文書に特化したAI、コンサルティングファームがプロジェクト成果物に特化したAI。いずれも「専門領域コーパス特化+出典付き+アクセス制御+業界正典との提携」の組み合わせで成立します。

汎用LLMでは解けない3つの企業課題

私が現場で繰り返し相談を受けるのは、次の3つの課題です。

課題1:機密情報の漏洩リスク ChatGPTやClaudeに社内文書を貼り付けて使うと、契約上は学習対象外でも「漏洩の可能性ゼロ」を保証するのは難しい。顧客との秘密保持契約や、上場企業の情報管理規程との折り合いが付かないケースがあります。

課題2:自社ナレッジが学習されない 汎用LLMは過去のインターネット情報を学習しているだけで、自社の社内文書を踏まえた回答はしてくれません。プロンプトに毎回貼り付けるという力技は再現性が低く、規模化もしません。

課題3:出典が示せない・ハルシネーションが怖い 汎用LLMの回答に出典が付かないため、ユーザーが「これは本当に正しいのか」を検証する手段がない。役員会の意思決定や法務判断に使う段階で、ほぼ確実にブロッカーになります。

OpenEvidenceは医療領域で、この3つの課題を「専門領域特化+出典付き+認証」で解いています。同じ思想を企業の機密文書管理に持ち込んだのが、私たちTIMEWELLが提供するエンタープライズAIエージェント ZEROCK です。

ZEROCKの設計思想

ZEROCKは、企業の社内文書・契約書・規程・特許・議事録など、機密情報のナレッジ管理に特化したAIエージェントです。OpenEvidenceとの対応関係で見ると、次のような設計になっています。

OpenEvidenceの原則 ZEROCKの実装
専門領域コーパスへの特化 顧客企業の社内文書のみを参照対象とするテナント分離設計
出典URL付き回答の必須化 全回答に元ファイル・該当箇所へのリンクを自動付与
ユーザー認証によるリスクコントロール SSO・権限管理・監査ログによる役職別アクセス制御
業界の正典との公式提携 顧客企業の「公式ドキュメント」を信頼ソースとして登録

加えてZEROCKは、日本国内のAWSサーバーで運用され、入力データはLLMの学習対象外として契約・技術の両面で保護されています。医療・金融・公共領域のように国内データレジデンシーが必須の業界でも、調達要件をクリアできる構成です。

GraphRAGによる関係性検索を採用しているため、単純な単語一致ではなく、文書間の関係性を踏まえた回答が可能です。「あの契約の更新条件」「あの規程の改訂履歴」といった、検索ベースのRAGでは取りこぼしやすい問いにも対応できます。

OpenEvidenceが米国医療のフロントエンドに新しい層を作ったように、企業の業務オペレーションにも「自社ナレッジに特化したAIエージェント」という層が今後標準実装されていく、と私は見ています。汎用LLMを禁止するか許可するかの二択ではなく、専門領域AIを別レイヤーで整備する、という発想です。


【こんな企業に向いています】

  • 自社の社内文書・契約書・規程をAIに学習させて、安全にナレッジ検索したい
  • ChatGPT/Claudeを使わせると機密情報が外部に流出するリスクが心配
  • 「AIの回答に出典がない」「ハルシネーションが怖い」とユーザーから言われる
  • 法律事務所・製造業・金融機関などで、専門領域に特化したAIが必要
  • 国内AWSサーバーで動かしたい(医療・金融・公共領域)

ひとつでも該当すれば、ZEROCKの個別相談で30分以内に活用イメージを整理可能です。

→ ZEROCKの個別相談を予約する(30分)→ ZEROCKサービス詳細を見る


まとめ

OpenEvidenceは、汎用LLMとは別の進化系として、医療領域に「専門領域コーパス特化+出典付き+医師認証」のAIを社会実装しました。全米4割の医師が利用し、月間1,500万件の臨床相談を処理する規模に達した事実は、専門領域AIが単なる流行ではなく社会インフラに昇格しうることを示しています。

日本の医師にも開かれており、日本語入力と医師免許認証で利用可能になりました。一方で、米国の最新治療と日本の保険収載のラグ、国内学会ガイドラインとの差異、SaMD規制との位置付けなど、運用上の注意点を踏まえる必要があります。

ここから抽出できる教訓は、医療領域に限りません。「専門領域コーパスへの特化」「出典URL付き回答」「ユーザー認証によるリスクコントロール」「業界正典との公式提携」の4原則は、企業の機密文書AI活用にそのまま転用できます。汎用LLMの議論で疲弊している企業のAI担当者は、一度OpenEvidenceの仕組みを観察して、自社のドメインに翻訳してみる価値があります。

私たちTIMEWELLでは、ZEROCKという形でこの思想を製品化しています。OpenEvidenceの記事を入り口に、企業のナレッジ管理AIを設計し直したいという方は、いつでもお声がけください。

関連記事

参考文献・脚注

[^isao]: ISAO国際公認会計士事務所「Open Evidenceが2億ドル調達」 https://isaocpa.com/ai/807/

[^decades]: decades.co.jp「OpenEvidenceとは?全米4割の医師が使う医療AI」(2026年2月) https://decades.co.jp/openevidence-clinical-guide-202602/

[^mhlw]: 厚生労働省「医療デジタルデータのAI研究開発等への利活用に係るガイドライン」(2024年9月) https://www.mhlw.go.jp/content/001310044.pdf

[^fda]: IntuitionLabs「FDA AI/ML SaMD Guidance Complete 2026 Compliance Guide」 https://intuitionlabs.ai/articles/fda-ai-ml-samd-guidance-compliance

[^openevidence]: OpenEvidence公式 https://www.openevidence.com/about

[^anthropic]: Anthropic公式 Claude Opus 4.7発表 https://www.anthropic.com/news/claude-opus-4-7

[^pmda]: PMDA「医療機器プログラム」 https://www.mhlw.go.jp/stf/seisakunitsuite/bunya/0000179749_00004.html

[^haip]: HAIP/CIP「医療・ヘルスケア分野における生成AI利用ガイドライン 第2版」 https://haip-cip.org/assets/documents/nr_20241002_02.pdf

[^gigazine]: GIGAZINE「OpenEvidence長年の症状について相談してみた」(2026年6月1日) https://gigazine.net/news/20260601-openevidence-medical-ai-review/

[^cubec]: Cubec大規模アップデート発表 https://prtimes.jp/main/html/rd/p/000000007.000124652.html

AI導入について相談しませんか?

元大手DX・データ戦略専門家が、貴社に最適なAI導入プランをご提案します。初回相談は無料です。

この記事が参考になったらシェア

シェア

メルマガ登録

AI活用やDXの最新情報を毎週お届けします

ご登録いただいたメールアドレスは、メルマガ配信のみに使用します。

無料診断ツール

あなたのAIリテラシー、診断してみませんか?

5分で分かるAIリテラシー診断。活用レベルからセキュリティ意識まで、7つの観点で評価します。

AIコンサルについてもっと詳しく

AIコンサルの機能や導入事例について、詳しくご紹介しています。

関連記事