AIエージェントの強さは、モデルだけでなく「どんなデータで、どう学習し、どう動かすか」という基盤全体で決まります。Anthropicの「Computer...
【弁理士徹底解説】Anthropicの「エージェント構築」特許出願 US 2025/0299023 A1 を読み解く|Adept Workflow Languageと公開出願の読み方

AIエージェントがパソコンを操作する――Anthropicの「Computer Use」を支える特許群。これまで本シリーズでは、実行基盤を守るUS 12,430,150 B1、エージェント本体を守るUS 12,566,913 B2を解説してきました。本記事で深掘りするのは、その上流――「エージェントをどう構築(configure)するか」を守る特許出願 US 2025/0299023 A1です。
この出願には、Adept社由来の専用言語「Adept Workflow Language」、クリック/ステップ/タスクの3階層プロンプト、DOM抽象化といった技術が登場します。さらに本件は登録特許ではなく「公開出願(A1)」であるため、「公開出願の読み方」「削除されたクレームが語ること」という、実務者必見の論点も併せて解説します。
💡 要点:本記事は、AIエージェント特許シリーズ/Anthropic編の完結編です。戦略分析編、US 12,430,150解説、US 12,566,913解説とあわせてご覧ください。
目次
30秒サマリー|「構築」を守る3部作の完結編
● 核心技術:①Adept Workflow Language(専用言語)、②クリック/ステップ/タスクの3階層プロンプト、③DOMの複雑さの抽象化、④ユーザー操作の記録による学習データ生成。
● ステータス:米国特許出願公開(A1)=審査係属中(登録特許ではない)。
● 注目点:出願人がAdept→Anthropicへ移転=買収の証拠。クレーム6・11・13が削除済み=審査経過の痕跡。
特許出願の基本情報
| 項目 | 内容 |
|---|---|
| 公開番号 | US 2025/0299023 A1 |
| 発明の名称 | Systems and Methods for Configuring Artificial Intelligence Agents to Automate Multimodal Interface Workflows |
| 公開日 | 2025年9月25日 |
| 出願日 | 2024年10月8日 |
| 優先日 | 2024年3月20日 |
| 現出願人 | Anthropic PBC(2025年4月17日にAdept AI Labs Inc.から移転) |
| ステータス | 公開出願(審査係属中) |
| 関連 | Anthropic「Computer Use」特許群の一つ |
まず押さえる|「A1(公開出願)」と「B1/B2(登録特許)」の違い
本件を読む前に、特許番号末尾の種別記号(kind code)を理解しておきましょう。これは特許実務の基礎であり、ニュースで特許を見る際にも役立ちます。
| 記号 | 意味 | 権利の状態 |
|---|---|---|
| A1 | 特許出願公開(published application) | 審査中・未確定。権利は未成立 |
| B1 | 登録特許(出願公開を経ていないもの等) | 権利成立済み |
| B2 | 登録特許(出願公開後に登録) | 権利成立済み |
「A1」を読むときの心構え:本件US 2025/0299023はA1=出願公開であり、まだ特許になっていません。クレームは審査の過程で補正され、最終的な権利範囲は変わり得ます。前回・前々回に解説したUS 12,430,150 B1/US 12,566,913 B2が登録済み(B1/B2)だったのとは、決定的に状態が異なります。
💡 要点:A1(公開出願)は「これから権利になるかもしれない予告編」、B1/B2(登録特許)は「成立した権利」。同じ技術ファミリーでも、状態によって意味と読み方がまったく違う点を、まず押さえてください。
3部作の全体像|構築→実行基盤→エージェント本体
Anthropicの「Computer Use」は、異なるレイヤーを複数の特許で重層的に保護しています。本件を加えた3つの関係を整理しましょう。
| レイヤー | 特許/出願 | 守るもの | たとえ |
|---|---|---|---|
| ① 構築 | US 2025/0299023 A1(本記事) | エージェントを作る仕組み・専用言語 | 「脚本を書く」 |
| ② 実行基盤 | US 12,430,150 B1 | ランタイム(クライアント/サーバ分担) | 「舞台」 |
| ③ エージェント本体 | US 12,566,913 B2 | エージェントの知能と動作(DSL等) | 「役者」 |
💡 要点:「脚本(構築)→舞台(実行基盤)→役者(エージェント)」と、製品を3つのレイヤーに分けて出願するのは、強い特許網の定石です。競合がどこか1つを回避しても、別のレイヤーに抵触し得る構造を作っています。
技術①|Adept Workflow Language(AWL)という専用言語
本出願の明細書は、「Adept Workflow Language(AWL)」を「ユーザーが(Adeptのモデル上で)強力なマルチモーダルWeb操作を簡単に記述できる、表現力豊かなカスタム言語」と説明しています。
つまり、AIエージェントの動きを人間が「オーサリング(作成)」するための専用プログラミング言語です。前回解説したUS 12,566,913のDSLが「エージェントが実行時に使う言語」だったのに対し、こちらは「人間がワークフローを設計するための言語」という位置づけで、上流の「構築」を支えます。
技術②|3階層のプロンプト(クリック/ステップ/タスク)
クレーム1は、エージェント仕様関数が「クリックレベル・ステップレベル・タスクレベルという複数階層のプロンプト」を構築すると規定します。
抽象的なタスクから具体的な操作まで、3つの粒度でプロンプトを階層化することで、複雑なワークフローを構造的に扱えます。この階層構造そのものがクレームの限定として機能し、権利を具体化しています。
技術③|DOMの複雑さを隠す「抽象化」
もう一つの技術的ハイライトが、エージェント仕様関数が「インターフェース要素を高レベルの参照に抽象化することで、WebページのDOM(文書オブジェクトモデル)の複雑さを隠蔽する(conceal complexities of a webpage DOM)」という限定です。
Webページは、内部的には膨大で複雑なDOM構造を持ちます。これをそのままAIに扱わせるのではなく、「このボタン」「この入力欄」といった高レベルの参照に抽象化することで、エージェントの作成・実行を容易かつ堅牢にしています。
💡 要点:「DOMの複雑さの隠蔽」は、まさに技術的課題(複雑なWeb構造)への技術的解決です。このような記載は、米国Alice、日本のソフトウェア関連発明、欧州COMVIKのいずれにおいても「抽象的アイデアではない」ことを示す強い手がかりになります。
技術④|ユーザーの操作を記録して学習データを作る
明細書はさらに、「ユーザーがインターフェースに対して行った操作を傍受(intercept)し、それを作動コマンドに翻訳して学習データセットを生成する」仕組みにも言及しています。
人間が実際にソフトを操作する様子を記録し、それをAIエージェントの学習データに変換する――いわば「お手本を見せて覚えさせる」アプローチです。エージェントを「構築」するうえで、学習データの作り方まで視野に入れている点が、この出願の射程の広さを示しています。
クレーム1を逐条で読む
US 2025/0299023 A1|Claim 1(原文/英語)
A system for configuring an agent to automate multimodal interface workflows, comprising: a memory; one or more processors coupled to the memory and configured to: construct agent specification functions using prompts and agent functions, wherein the agent specifications are configured to automate a multimodal interface workflow, and wherein the agent specification functions are configured to construct multiple levels of prompts including click-level prompts, step-level prompts, and task-level prompts, and wherein the agent specification functions conceal complexities of a webpage document object model (DOM) by abstracting interface elements into higher-level references; and generate multimodal agent calls, by translating the agent specification functions, that cause an agent to implement the agent functions to produce outputs that performs tasks corresponding to the prompts, wherein the agent calls triggers one or more machine-actuated actions based on the outputs as synthetic actions that automate the multimodal interface workflow, wherein automating the multimodal interface workflow includes modifying elements of the interface, and wherein the interface is a user interface.
弁理士による参考訳(日本語)
① エージェント仕様関数の構築:プロンプトとエージェント機能を用いてエージェント仕様関数を構築する。当該仕様関数は、クリックレベル・ステップレベル・タスクレベルの複数階層のプロンプトを構築し、かつ、インターフェース要素を高レベルの参照へ抽象化することでWebページのDOMの複雑さを隠蔽する。
② マルチモーダルなエージェント呼び出しの生成:前記仕様関数を翻訳して呼び出しを生成し、エージェントにエージェント機能を実装させ、プロンプトに対応するタスクを遂行する出力を生成させる。当該呼び出しは出力に基づき、インターフェース要素の変更を含む自動化を行う機械作動アクション(合成アクション)をトリガーする。
権利化を支える限定の整理
| 限定 | 技術的意味 | 効いている理由 |
|---|---|---|
| プロンプトの3階層 | タスク→ステップ→クリックの粒度管理 | 制御構造の具体化 |
| DOMの複雑さの隠蔽(抽象化) | 複雑なWeb構造を高レベル参照へ | 技術的課題への技術的解決 |
| 仕様関数→エージェント呼び出しの翻訳 | 設計を実行可能な呼び出しへ変換 | 構築と実行を橋渡しする具体的処理 |
審査の痕跡|「削除されたクレーム」が語ること
公開された出願書類を見ると、クレーム6・11・13が「削除(canceled)」されています。これは、出願人が出願後に補正を行ったことの痕跡です。
クレームの削除は、審査対応や権利範囲の整理の過程でよく行われます。公開出願を読む際は、こうした「生きているクレーム」と「削除されたクレーム」を区別し、現時点で何が請求されているのかを正確に把握することが重要です。
💡 要点:登録特許(B1/B2)が「完成した権利」のスナップショットであるのに対し、公開出願(A1)は「審査の途中経過」です。クレームの削除・補正は日常的に起こり、権利範囲は動きます。だからこそ、競合分析やFTOでは最新の経過情報(file wrapper)を継続的にウォッチする必要があります。
出願人の移転が示す「Adept買収」の証拠
本出願のもう一つの読みどころが、出願人(assignee)の移転記録です。本件はもともとAdept AI Labs Inc.の出願でしたが、2025年4月17日にAnthropic PBCへ移転(reassign)されています。
自社出願への教訓
① 「作る側」も特許になる。製品を実行する技術だけでなく、それを構築・オーサリングする仕組み(専用言語、設計ツール)も権利化対象です。
② 抽象化・階層化を技術的フックにする。「DOMの複雑さの隠蔽」「3階層プロンプト」のように、複雑さを扱う構造的工夫はクレームの強い限定になります。
③ 学習データの作り方も射程に入れる。ユーザー操作の記録→学習データ化など、データパイプラインも保護を検討します。
④ 特許の譲渡記録を活用する。競合・買収先の動向は、出願人の移転記録からも読み取れます。
⑤ 公開出願は「経過情報」をウォッチする。A1段階の出願は権利範囲が動くため、関連事業があれば継続監視が不可欠です。
自社のAIエージェント、構築技術まで含めて権利化しませんか?
IT・ソフトウェア・AI分野に精通した弁理士が、権利化可能性の無料診断、クレーム設計、競合特許のウォッチ、FTO調査、日米欧での出願戦略までトータルでご支援します。
初回無料相談を予約IT・AI知財サービスよくある質問(FAQ)
Q. US 2025/0299023 A1はどんな特許ですか?
A. Anthropic(アンソロピック)の米国特許出願公開で、マルチモーダル・インターフェースを自動化するAIエージェントを「構成・構築(configure)」するためのシステム及び方法を対象とします。プロンプトとエージェント機能から「エージェント仕様」を構築し、クリック/ステップ/タスクの3階層のプロンプトを組み立て、WebページのDOMの複雑さを抽象化する点が特徴です。2025年9月25日公開、審査係属中です。
Q. 「A1」と「B1」「B2」は何が違うのですか?
A. 米国特許番号末尾の記号は種別を表します。「A1」は特許出願公開(published application)=まだ審査中で権利は確定していません。「B1」「B2」は登録特許(granted)=権利が成立済みです。本件A1は審査係属中のため、最終的な権利範囲は今後の補正・審査で変わり得ます。
Q. Adept Workflow Language(AWL)とは何ですか?
A. 明細書に記載された、ユーザーがマルチモーダルなWeb操作を簡単に記述できる「表現力豊かなカスタム言語」です。AnthropicがAdept社から獲得した技術で、AIエージェントのワークフローを人間が「オーサリング(作成)」するための専用言語にあたります。
Q. なぜAnthropicの特許なのにAdeptの名前が出てくるのですか?
A. 本出願はもともとAdept AI Labs社のものでしたが、2025年4月17日にAnthropic PBCへ出願人が移転(reassign)されました。Anthropicが2024年にAdeptのチーム・技術を取り込んだ買収(acqui-hire)の事実が、出願人の移転記録という形で裏付けられています。
Q. 公開出願の段階で競合が気をつけるべきことは?
A. 公開出願は将来登録される可能性があり、登録されれば公開時に遡って一定の補償金請求権が生じ得ます(日本の場合)。米国出願でも、係属中の出願は補正により権利範囲が変わり得るため、関連事業を行う場合は経過情報をウォッチし、必要に応じてFTO(Freedom to Operate)の観点で専門家に相談することが重要です。
本記事の注意事項:本記事は、公開された特許出願公報に基づく一般的な技術・制度解説です。US 2025/0299023 A1は審査係属中の公開出願であり、登録されていません。クレームは補正により変更され得るため、最終的な権利範囲は確定していません。引用したクレーム・要約・明細書記載は公開公報データ(Google Patents/FreePatentsOnline等)に基づきますが、法的に重要な用途(FTO・侵害分析・出願等)では、必ずUSPTO正本と最新の経過情報をご確認のうえ、専門家の個別検討をご利用ください。日本語訳は理解のための参考訳であり、正文は英語原文です。
・Anthropicの特許戦略を読み解く|なぜ特許出願が少ないのか
・「Computer Use」の中核特許 US 12,430,150 B1 を読み解く(実行基盤)
・「AIエージェント」特許 US 12,566,913 B2 を読み解く(エージェント本体)
・日本・米国・欧州の特許事例と審査実務(事例編)
出典
- US 2025/0299023 A1(Google Patents):https://patents.google.com/patent/US20250299023A1/en
- クレーム・明細書(FreePatentsOnline):https://www.freepatentsonline.com/y2025/0299023.html