コンテンツまでスキップ

【弁理士徹底解説】Anthropicの「データフロー」特許出願 US 2025/0299074 A1 を読み解く|学習↔推論パイプラインとデータの堀

Anthropicのデータフロー特許出願US2025-0299074を弁理士が解説 EVORIX

AIエージェントの強さは、モデルだけでなく「どんなデータで、どう学習し、どう動かすか」という基盤全体で決まります。Anthropicの「Computer Use」を支える特許群のうち、本記事で深掘りするのは、まさにこのデータの流れ(パイプライン)を守る特許出願 US 2025/0299074 A1です。

これまで本シリーズでは、構築(US 2025/0299023)実行基盤(US 12,430,150)エージェント本体(US 12,566,913)を解説しました。本件はその第4のレイヤー=学習から推論までの"データの血流"(MLOps基盤)を保護します。AI知財に精通した弁理士が、実際のクレームを引用しながら解説します。

💡 要点:本記事は、Anthropic特許シリーズの個別解説(4件目)です。戦略分析編とあわせて読むと、Anthropicの「Computer Use」をめぐる特許網の全体像が立体的に理解できます。

30秒サマリー|AIエージェントの「データの堀」

● 何の出願か:AIエージェントの学習〜推論のデータの流れ(データフロー・ロジック)を統括するシステム。
● 核心技術:①学習サーバと本番サーバの分離、②両者をつなぐデータフロー・ロジック、③「注釈付きエージェント軌跡」という高品質な学習データ。
● ステータス:米国特許出願公開(A1)=審査係属中、全20クレーム。
● 戦略的意味:製品の"骨格"(前3件)に加え、AIの競争力の源泉である"データとパイプライン"まで権利化を狙う。

特許出願の基本情報

項目内容
公開番号US 2025/0299074 A1
発明の名称Data Flow Logic for Providing Artificial Intelligence Agents that Automate Multimodal Software Usage
公開日2025年9月25日
出願日2024年10月8日
優先日2024年3月20日
出願人Anthropic PBC(2025年4月17日に訂正)
クレーム数20
ステータス公開出願(審査係属中)

4つのレイヤー|Anthropic「Computer Use」特許の全体像

Anthropicは、「Computer Use」という一つの製品を、4つの異なるレイヤーで重層的に保護しています。本件を加えた全体像を整理しましょう。

レイヤー特許/出願守るものたとえ
① 構築US 2025/0299023 A1エージェントを作る仕組み・専用言語脚本
② 実行基盤US 12,430,150 B1ランタイム(クライアント/サーバ)舞台
③ エージェント本体US 12,566,913 B2エージェントの知能・動作役者
④ データの流れUS 2025/0299074 A1(本記事)学習〜推論のパイプライン・学習データ血流・栄養

💡 要点:「脚本・舞台・役者」という"見える部分"に加え、本件は"血流"=データとパイプラインを押さえています。AIの競争力はデータ基盤で決まるため、この第4レイヤーの権利化は、特許網に深みを与える重要な一手です。

技術①|学習サーバと本番サーバの分離(train↔inference)

クレーム1の骨格は、2種類のサーバを明確に分離している点にあります。

【学習(training)↔ 推論(inference)の分離】 [学習フェーズ] 学習サーバ(training servers) ・エージェント+学習データセットを受け取り ・エージェントを訓練 → 訓練済みエージェントを生成 │ ▼ 配備(configure) [推論フェーズ] 本番サーバ(production servers) ・訓練済みエージェントを実行 ・クライアントのプロンプトを受け取り ・プロンプト → エージェント呼び出しに翻訳 ・出力を生成してクライアントへ返却

機械学習システムでは、「モデルを訓練する環境(training)」と「実際にユーザーに提供する環境(inference/本番)」を分けるのが一般的です。本件は、このMLOps(機械学習の運用)の基本構造そのものを、AIエージェントの文脈でクレーム化しています。

技術②|データフロー・ロジック=全体の交通整理

この2つのサーバ群をつなぎ、データの流れを統括するのが「データフロー・ロジック(data flow logic)」です。クレーム1によれば、このロジックは次の4つを行います。

段階データフロー・ロジックの動作
学習時エージェントと学習データセットを学習サーバに提供し、訓練させる
配備訓練済みエージェントで本番サーバを構成する
推論時クライアントのプロンプトを本番サーバに提供し、エージェント呼び出しに翻訳させる
返却生成された出力をクライアントに利用可能にする

💡 要点:「データフロー・ロジック」という統括コンポーネントを立てることで、学習〜配備〜推論〜返却というライフサイクル全体を一つのシステムとして請求しています。個々の部品ではなく"流れ"を押さえる、システム特許らしい構成です。

技術③|「注釈付きエージェント軌跡」というデータの堀

本件で最も戦略的に重要なのが、クレーム1に明記された学習データの中身です。クレームは、学習データセットが「マルチモーダル・インターフェース自動化タスクのための、定義済みエージェント軌跡(agentic trajectories)の画像」を含み、「各軌跡には、アクションとエージェントの判断を記述した詳細なマルチモーダル注釈が付される」と規定します。

つまり、AIエージェントが「画面を見て、どう考え、どう操作したか」という一連の行動を記録し、注釈を付けた高品質な学習データです。このようなデータは、一朝一夕には作れません。独自の学習データこそ、競合が容易に再現できない"堀(moat)"であり、それをクレームの要素に組み込んでいる点に、Anthropicの戦略が表れています。

明細書は、学習データとして、ソフトウェア操作の録画動画、Webページ画像、文書、注釈付きのエージェント行動シーケンスなど、複数種類を挙げています。「データの作り方・中身」まで権利範囲に取り込むことで、エージェントの"頭脳の源泉"を守ろうとしています。

クレーム1を逐条で読む

US 2025/0299074 A1|Claim 1(原文/英語)

A system for providing artificial intelligence agents that automate software usage, comprising: a plurality of training servers configured to train agents during training; a plurality of production servers configured to execute the trained agents during inference; a plurality of training datasets, wherein the plurality of datasets includes images of defined agentic trajectories for multimodal interface automation task workflows, each trajectory accompanied by detailed multimodal annotations describing actions and agentic decisions; and a data flow logic configured to: during the training, provide the agents and the plurality of training datasets to the training servers to cause the training servers to train the agents on the plurality of training datasets and thereby produce the trained agents; configure the production servers with the trained agents for use during the inference; during the inference, provide multimodal interface automation prompts issued by clients to the production servers to cause the production servers to translate the prompts into multimodal interface automation agent calls, wherein each multimodal interface automation agent call specifies interface actions to cause the trained agents to generate outputs that automate multimodal interface workflow in response to the multimodal prompts; and make the outputs available to the clients.

弁理士による参考訳(日本語)

ソフトウェア利用を自動化するAIエージェントを提供するシステムであって、
・学習時にエージェントを訓練する複数の学習サーバと、
・推論時に訓練済みエージェントを実行する複数の本番サーバと、
・複数の学習データセットであって、定義済みエージェント軌跡の画像を含み、各軌跡にはアクションとエージェントの判断を記述した詳細なマルチモーダル注釈が付されるものと、
データフロー・ロジックと、を備え、当該ロジックは:
 - 学習時:エージェントと学習データセットを学習サーバに提供し訓練させ、訓練済みエージェントを生成させ、
 - 訓練済みエージェントで本番サーバを構成し、
 - 推論時:クライアントのプロンプトを本番サーバに提供してエージェント呼び出しに翻訳させ(各呼び出しはインターフェース・アクションを指定し、訓練済みエージェントにワークフローを自動化する出力を生成させる)、
 - 当該出力をクライアントに利用可能にする。

権利化を支える限定の整理

限定技術的意味効いている理由
学習サーバ/本番サーバの分離train↔inferenceのMLOps構造システムの具体的なハードウェア構成
注釈付きエージェント軌跡(学習データ)行動と判断を記録した高品質データデータの堀。差別化の源泉を権利化
データフロー・ロジックライフサイクル全体の統括"流れ"を捉えるシステム特許の核

弁理士の視点|なぜ「システム全体」を請求するのか

本件のクレーム1は、特定の小さな部品ではなく、学習サーバ・本番サーバ・学習データ・データフロー・ロジックを含む「システム全体」を請求しています。これには戦略的な意味があります。

① 回避が難しい。大規模にAIエージェントを提供する事業者は、何らかの形で「学習環境」と「本番環境」を持ち、その間でデータを流します。システム全体を押さえることで、構成要素の一部を変えても権利範囲に入りやすくなります。

② データという無形資産を権利に取り込む。「注釈付き軌跡」をクレーム要素にすることで、模倣困難なデータ資産を法的保護の射程に入れています。

注意|広いクレームには相応のリスクも:システム全体を広く請求するクレームは、その分、先行技術により無効とされるリスクも抱えます(とりわけ一般的なMLOps構造は公知技術が多い領域)。本件が審査でどこまでの範囲で登録されるかは、今後の経過を注視する必要があります(本件は係属中)。広いクレームと狭いクレームをバランスよく揃えることが、実務上の定石です。

日米欧の審査でどう評価されるか

米国(USPTO)

学習サーバ・本番サーバという具体的なシステム構成と、注釈付きデータという技術的要素を備えるため、Alice/Mayoテストにおいて「抽象的アイデア」との評価を回避しやすい構成です。ただし、MLOps構造は公知例が多く、進歩性(新規性・非自明性)が論点になり得ます。

日本(JPO)

サーバ群・データフロー・ロジックという情報処理がハードウェア資源で具体的に実現されており、ソフトウェア関連発明として特許適格性を満たしやすい構成です。進歩性は「注釈付きエージェント軌跡」というデータ設計や、データフロー統括の技術的工夫が鍵となります。

欧州(EPO)

学習〜推論のパイプラインという技術的システムへの貢献を主張しやすい一方、純粋な"運用上の取り決め"と評価されないよう、技術的効果(効率・信頼性等)の明示が有効です。

AIエージェント特許の日米欧の審査実務の比較は、「日本・米国・欧州の特許事例と審査実務」で詳しく解説しています。

自社出願への教訓|「データ」と「パイプライン」を守る

① 製品だけでなく"基盤"を守る。実行する技術だけでなく、学習〜推論のパイプライン(MLOps基盤)も権利化の対象です。

② 独自の学習データを権利に取り込む。「注釈付き軌跡」のような模倣困難なデータの作り方・構造は、強力な"堀"になります。クレーム要素への組み込みを検討しましょう。

③ システム全体と部品の両建てで出願する。広いシステムクレームと、狭く堅実な部品クレームを揃え、無効リスクと回避困難性のバランスを取ります。

④ 製品を多層的に分けて出願する。構築・実行基盤・本体・データ基盤のように、レイヤーごとに権利化して特許網を厚くします。

自社のAI、製品だけでなく"データとパイプライン"まで守りませんか?

IT・ソフトウェア・AI分野に精通した弁理士が、権利化可能性の無料診断、データ・MLOpsを含むクレーム設計、競合特許のウォッチ、日米欧での出願戦略までトータルでご支援します。

初回無料相談を予約IT・AI知財サービス

よくある質問(FAQ)

Q. US 2025/0299074 A1はどんな特許ですか?

A. Anthropic(アンソロピック)の米国特許出願公開で、ソフトウェア利用を自動化するAIエージェントを提供する「データフロー・ロジック」を対象とします。学習サーバ(エージェントを訓練)と本番サーバ(訓練済みエージェントを推論実行)を分離し、その間のデータの流れ(学習データの供給、訓練済みモデルの配備、クライアントのプロンプト処理、出力の返却)を統括する点が特徴です。2025年9月25日公開、審査係属中、全20クレーム。

Q. 「データフロー・ロジック」とは何ですか?

A. システム内でデータがどう流れるかを統括する仕組みです。本出願では、①学習時に学習データをサーバへ供給し、②訓練済みエージェントを本番サーバへ配備し、③推論時にクライアントのプロンプトを本番サーバへ流し、④出力をクライアントへ返す、という一連の「データの交通整理」を担います。

Q. この特許は前の3件と何が違うのですか?

A. Anthropicの「Computer Use」は4つのレイヤーで重層的に保護されています。①構築(US 2025/0299023)、②実行基盤(US 12,430,150)、③エージェント本体(US 12,566,913)、そして④本件は「データの流れ=学習から推論までのパイプライン(MLOps基盤)」です。製品の"骨格"だけでなく"血流"まで押さえる構造です。

Q. 「注釈付きエージェント軌跡」とは何ですか?

A. クレーム1に登場する学習データの中核で、マルチモーダル・インターフェース自動化タスクにおける「エージェントの行動の軌跡(agentic trajectories)の画像」に、「アクションとエージェントの判断を記述した詳細な注釈」を付したものです。AIエージェントが"どう考え、どう動いたか"を記録した高品質な学習データであり、競争力の源泉(データの堀)になります。

Q. 自社のAI開発で参考になる点はありますか?

A. 「製品そのもの」だけでなく、「学習から推論までのデータパイプライン」や「独自の学習データの作り方」も特許の対象になり得る、という点です。とりわけ独自の学習データ(注釈付き軌跡など)を生み出す仕組みは、競合が容易に再現できない"堀"となるため、権利化の検討価値が高い領域です。

本記事の注意事項:本記事は、公開された特許出願公報に基づく一般的な技術・制度解説です。US 2025/0299074 A1は審査係属中の公開出願であり、登録されていません。クレームは補正により変更され得るため、最終的な権利範囲は確定していません。引用したクレーム・要約・明細書記載は公開公報データ(Google Patents/FreePatentsOnline等)に基づきますが、法的に重要な用途(FTO・侵害分析・出願等)では、必ずUSPTO正本と最新の経過情報をご確認のうえ、専門家の個別検討をご利用ください。日本語訳は理解のための参考訳であり、正文は英語原文です。

出典