はじめに...
【特許取得のコツ】ChatGPTのプロンプト生成技術は特許になる?事例38から学ぶAI発明の権利化戦略
はじめに
「ChatGPTに質問するとき、どうすれば最適な回答が得られるのか?」—これは多くのユーザーが抱える疑問です。プロンプトエンジニアリングと呼ばれるこの技術分野は、ビジネスでも重要視されるようになり、特許出願の対象としても注目されています。しかし、AIツールの使い方に関する工夫は、果たして特許として認められるのでしょうか?この記事では、特許庁が公表した事例38を通じて、ChatGPTなどの大規模言語モデル(LLM)のプロンプト生成技術が特許になり得る条件を、弁理士の視点から詳しく解説します。
2024年3月、特許庁はAI関連技術の審査事例を拡充し、「プロンプト用文章生成方法」に関する事例38を公表しました。この事例は、ChatGPTなどのAIツールを「どう使うか」という方法にも特許性があり得ることを示すもので、AI開発企業だけでなく、AIツールを活用する一般企業にとっても重要な意味を持ちます。
本稿では、この事例38を詳細に解説し、「単なるAI利用」と「特許性のあるAI活用技術」の違いを明らかにします。読めば、あなたの会社のAI活用方法が特許化できる可能性や、競合他社の特許リスクについても理解できるでしょう。さらに、今後のビジネス展開において知財戦略をどう組み立てるべきかのヒントも得られます。
1. 事例38の概要と技術的背景
1.1 事例38の位置づけと背景
事例38「大規模言語モデルに入力するためのプロンプト用文章生成方法」は、進歩性の判断に関する事例として公表されています。この事例は、LLMへの入力を最適化するための技術、特に制限文字数という技術的制約の中で効果的なプロンプトを生成する方法に関するものです。
現在、OpenAIのGPTシリーズをはじめとする多くのLLMには、一度に入力できるトークン(文字数)の上限が設定されています。例えば、GPT-4では、モデルにより8,192または32,768トークンの入力上限があります。このような制約の中で、いかに質の高いプロンプトを作成するかは、LLMを効果的に活用する上で重要な技術的課題となっています。
特に、文脈や参考情報を付加することでLLMの回答精度を向上させるRAG(Retrieval-Augmented Generation)技術が注目される中、限られた入力トークン数で効率的かつ効果的に情報を付加する技術は、実用的な価値が高いと言えます。
1.2 事例38の請求項
事例38では、以下の2つの請求項が示されています。
請求項1(進歩性なし)
入力された質問文に対して参考情報を付加することにより、大規模言語モデルに入力するためのプロンプトをコンピュータが生成するプロンプト用文章生成方法であって、
前記大規模言語モデルは入力できるプロンプトの文字数の上限である制限文字数が設定されており、質問文を含むプロンプトを入力すると、前記質問文に関する回答文を出力する大規模言語モデルであり、
前記コンピュータが、
前記入力された質問文をもとに、当該質問文の文字数と合わせた合計文字数が前記制限文字数以下の文字数となるように、前記質問文に関連した付加文章を生成する付加文章生成ステップと、
前記入力された質問文に対し、前記付加文章生成ステップにより生成された前記付加文章を前記参考情報として追加することによって前記プロンプトを生成するプロンプト生成ステップと、
を実行することを特徴とするプロンプト用文章生成方法。
請求項2(進歩性あり)
前記付加文章生成ステップは、前記入力された質問文をもとに、当該質問文に関連した関連文章を複数取得し、取得された複数の前記関連文章から、前記参考情報として適した複数のキーワードを抽出し、前記複数のキーワードを使用して、前記合計文字数が前記制限文字数を超えない前記付加文章を生成するステップであることを特徴とする請求項1に記載のプロンプト用文章生成方法。
2. 事例38の技術内容の詳細分析
2.1 発明の詳細な説明の要点
事例38の発明の詳細な説明からは、以下の技術的課題と解決手段が読み取れます。
技術的課題
大規模言語モデルは使用に際して入力の制限文字数が設けられている場合があり、入力された質問文に対して参考情報を無制限に加えることができないという課題がありました。本発明は、有効な参考情報を質問文に対して追加し、所定の制限文字数内でプロンプト用文章を生成する方法を提供することを目的としています。
解決手段
請求項1の解決手段は、入力された質問文をもとに、質問文の文字数と合わせた合計文字数が制限文字数以下となるように付加文章を生成し、それを質問文に追加してプロンプトを生成するというものです。
請求項2では、さらに具体的な解決手段として、質問文に関連した関連文章を複数取得し、それらから参考情報として適したキーワードを抽出し、それらのキーワードを使用して付加文章を生成するという手法を採用しています。関連文章の取得について、例えば、質問者の質問履歴、行動履歴、購買履歴などのデータベースから質問文と関連性が高い情報を抽出する方法が示されています。
効果
請求項1の効果としては、制限文字数内で入力された質問文に対して有効な付加文章を参考情報として加えたプロンプトを生成できることが挙げられています。
請求項2の効果としては、さらに、所定の制限文字数内で、質問文と関連性が高く参考情報として適した付加文章を付加したプロンプトを生成することができ、より信頼性が高く適切な回答文を得ることができるとされています。
2.2 図面の解説
事例38には詳細な図面は含まれていませんが、明細書の記載から、概念的には以下のようなシステム構成が想定されています。
- 質問文入力部:ユーザーからの質問文を受け付ける
- 関連文章取得部:質問文に関連した文章を複数取得する
- キーワード抽出部:取得した関連文章から参考情報として適したキーワードを抽出する
- 付加文章生成部:抽出したキーワードを使用して、制限文字数を考慮した付加文章を生成する
- プロンプト生成部:質問文と付加文章を結合してプロンプトを生成する
- 大規模言語モデル:生成されたプロンプトを入力として回答を生成する
3. 事例38の進歩性判断の詳細分析
3.1 引用発明と技術常識
事例38では、以下の引用発明1と技術常識が示されています。
引用発明1
入力された質問文に対して参考情報を付加することにより、大規模言語モデルに入力するためのプロンプトをコンピュータが生成するプロンプト用文章生成方法であって、
前記大規模言語モデルは、質問文を含むプロンプトを入力すると、前記質問文に関する回答文を出力する大規模言語モデルであり、
前記コンピュータが、
前記入力された質問文をもとに、前記質問文に関連した付加文章を生成する付加文章生成ステップと、
前記入力された質問文に対し、前記付加文章生成ステップにより生成された前記付加文章を前記参考情報として追加することによって前記プロンプトを生成するプロンプト生成ステップと、
を実行することを特徴とするプロンプト用文章生成方法。
技術常識
言語処理の技術分野において、情報処理量が過大にならないようにすることは、当業者が通常考慮する自明な課題であり、また、その解決方法として、入力できる文章の上限である制限文字数を設定し、文章が当該制限文字数以上となる場合に、当該制限文字数以上となる部分を破棄することで、実際に入力される文章を制限文字数以下の文字数となるように作成することは出願時における周知技術である。
3.2 請求項1の進歩性判断
請求項1と引用発明1とを対比すると、以下の相違点が認められます。
相違点
請求項1に係る発明の大規模言語モデルは入力できるプロンプトの文字数の上限である制限文字数が設定されており、付加文章生成ステップは、質問文の文字数と合わせた合計文字数が前記制限文字数以下の文字数となるように、前記質問文に関連した付加文章を生成するのに対し、引用発明1の大規模言語モデルには入力できるプロンプトの文字数の上限である制限文字数が設定されているか否か不明であり、付加文章生成ステップは上述のような付加文章の生成を行っているか否か不明である点。
審査官は、この相違点について、上記の技術常識を考慮すると、制限文字数以下となるように付加文章を生成することは、当業者が容易に想到し得たことであると判断しています。
具体的には、言語処理分野では情報処理量を考慮することは自明の課題であり、制限文字数を設定して、超える部分を破棄するという周知技術を適用することは、当業者の通常の創作能力の発揮に過ぎないというわけです。
3.3 請求項2の進歩性判断
請求項2については、先の相違点に加えて、以下の相違点が認められています。
追加の相違点
請求項2に係る発明の付加文章生成ステップは、入力された質問文をもとに、当該質問文に関連した関連文章を複数取得し、取得された複数の関連文章から、参考情報として適した複数のキーワードを抽出し、複数のキーワードを使用して、合計文字数が制限文字数を超えない付加文章を生成するのに対し、引用発明1の付加文章生成ステップではそのような特定がない点。
この相違点について、審査官は以下のように判断しています。
-
関連文章を複数取得し、その中から参考情報として適したキーワードを抽出し、それを使用して制限文字数内の付加文章を生成するという構成を開示する先行技術は発見されておらず、出願時の技術常識でもない。
-
請求項2に係る発明は、当該構成により「所定の制限文字数内で、質問文と関連性が高く参考情報として適した付加文章を付加したプロンプトを生成することができ、より信頼性が高く適切な回答文を得る」という引用発明1と比較して有利な効果を奏する。
-
これは単なる設計変更ではなく、進歩性を有する発明である。
4. 事例38から学ぶLLM関連発明の特許性判断のポイント
4.1 技術的課題の解決手段の具体性
事例38の請求項1は、単に「制限文字数以下となるように付加文章を生成する」という抽象的な解決手段しか提示していないため、進歩性が否定されています。これは、制限文字数を考慮することが技術常識であり、単に制限文字数内に収めるという発想は当業者が容易に想到できるとされたためです。
一方、請求項2は以下の3つのステップを具体的に特定しています。
- 質問文に関連した関連文章を複数取得する
- 取得された複数の関連文章から、参考情報として適した複数のキーワードを抽出する
- 抽出されたキーワードを使用して、制限文字数内の付加文章を生成する
この具体的な解決手段の記載が、進歩性の肯定的判断につながっています。
LLM関連発明においても、単に「LLMを利用する」というだけでは不十分であり、具体的な技術的手段を提示することが重要です。特に、入力データの前処理や出力データの後処理などの点で独自の工夫を加え、その具体的な処理フローを特定することが進歩性を主張する上で効果的です。
4.2 効果の顕著性と非自明性
請求項2が進歩性を有すると判断された理由の一つは、「より信頼性が高く適切な回答文を得る」という効果が引用発明1からは予測困難な効果と評価されたことです。
この効果は、単に制限文字数内に情報を詰め込むという量的な効果ではなく、関連文章から抽出したキーワードを使用することで、質的にも優れた付加文章を生成できるという点に着目したものです。つまり、量的制約(制限文字数)の中での質的向上という効果を主張しているのです。
LLM関連発明においても、単なる自動化や効率化以上の効果、特に以下のような効果を主張することが有効です。
- 処理精度や品質の向上
- 計算リソースの削減
- 学習効率の向上
- ユーザーエクスペリエンスの改善
- データセキュリティの向上
4.3 周知技術との差別化
事例38では、「制限文字数を設定し、超える部分を破棄する」という周知技術に対して、「関連文章からキーワードを抽出して付加文章を生成する」という新規な手法が進歩性を有すると判断されています。
この判断から、LLM関連発明においても、以下のような周知技術との差別化ポイントを明確にすることが重要であることがわかります。
- 入力データの前処理における独自の手法
- 出力データの後処理における独自の手法
- LLMの動作制御における独自の手法
- ユーザーインターフェースにおける独自の手法
- データ管理における独自の手法
5. LLM関連発明の特許出願戦略
5.1 請求項の記載のポイント
事例38から学べるLLM関連発明の請求項記載のポイントは以下の通りです。
5.1.1 技術的課題を明確にする
単なる効率化や自動化ではなく、LLM利用における具体的な技術的課題を設定します。例えば:
- 制限文字数内で質の高いプロンプトを生成する課題
- LLMの出力の精度や再現性を向上させる課題
- LLMの応答速度を向上させる課題
- 特定分野の専門知識をLLMに効率的に付与する課題
5.1.2 具体的な解決手段を記載する
抽象的な手段ではなく、具体的な解決手段のステップを記載します。事例38の請求項2のように、複数のステップ(関連文章の取得→キーワードの抽出→付加文章の生成)を組み合わせた解決手段を記載することが効果的です。
5.1.3 効果を裏付ける構成要素を含める
「参考情報として適したキーワードを抽出」といった、効果を裏付ける技術的特徴を請求項に含めることが重要です。これにより、単なる設計変更ではなく、特定の効果を狙った技術的工夫であることを主張できます。
5.1.4 複数の独立請求項を用意する
事例38では方法の発明のみが示されていますが、実際の出願では以下のような複数の独立請求項を用意することを検討すべきです。
- 方法の発明
- 装置の発明
- プログラムの発明
- システムの発明
- サーバとクライアント間の通信を含む発明
5.2 明細書の記載のポイント
LLM関連発明の明細書作成において特に重要となるポイントは以下の通りです。
5.2.1 技術的課題の詳細な説明
従来技術の問題点を具体的に指摘し、本発明が解決しようとする技術的課題を明確に説明します。事例38では「制限文字数の存在」という課題が明確に記載されています。LLM関連発明においては、以下のような課題を具体的に記載することが重要です。
- LLMの入力制限(トークン数、文字数など)
- LLMの出力の不安定性や不正確性
- 計算リソースの制約
- 専門分野における知識の不足
- プライバシーやセキュリティの懸念
5.2.2 実施形態の具体的な記載
抽象的な説明ではなく、具体的な実施形態を記載します。関連文章の取得方法、キーワード抽出のアルゴリズム、文章生成のプロセスなどを詳細に説明することが重要です。
具体的には、以下のような内容を記載することが効果的です。
- システム構成図とデータフロー
- 各処理ステップの詳細なアルゴリズム
- 具体的な入出力例
- パラメータの設定方法や最適化手法
- エラー処理や例外処理
5.2.3 効果の裏付け
「より信頼性が高く適切な回答文を得る」といった効果を、具体的な実験結果や比較データなどで裏付けることが効果的です。例えば、以下のような裏付けを記載することを検討すべきです。
- 従来手法との比較実験
- ユーザー評価結果
- 処理速度や精度の定量的評価
- リソース使用量の比較
- 実際の利用シナリオにおける効果
5.2.4 技術分野の特定
LLM関連発明が適用される具体的な技術分野(例:カスタマーサポート、医療診断、法律相談など)を明確にし、その分野特有の課題や効果を記載することで、特許性の向上が期待できます。
6. まとめ:LLM関連発明の権利化戦略
事例38の分析から、LLM関連発明の権利化において重要なポイントは以下の通りです。
6.1 単なるLLMの利用ではなく、独自の技術的工夫を明確にする
- 入力データの前処理(例:関連文章からのキーワード抽出)
- 出力データの後処理
- LLMの動作制御(例:制限文字数内での最適化)
- ユーザーインターフェースの工夫
- 特定分野向けのカスタマイズ
6.2 技術的課題と効果を明確に説明する
- 単なる自動化や効率化以上の技術的課題
- 予測困難な顕著な効果
- 量的制約の中での質的向上
6.3 周知技術との差別化点を明確にする
- 単なる情報処理の制限ではなく、質を向上させる工夫
- 既存のAI技術とは異なる独自のアプローチ
- 特定の技術分野における専門的な知見の活用
6.4 複数の権利化戦略を検討する
- 方法の発明、装置の発明、プログラムの発明など
- 上位概念と下位概念の組み合わせ
- 個別特徴の権利化と組み合わせ特徴の権利化
LLM関連発明の特許出願においては、単にLLMを利用するというだけでは進歩性が認められにくい状況です。しかし、事例38が示すように、入力データの前処理や出力データの最適化など、具体的な技術的工夫を加えることで、進歩性を有する特許として権利化できる可能性があります。
近年、ChatGPTやGeminiなどのLLMを活用した様々なサービスが登場していますが、それらの差別化や競争優位性を確保するためには、LLM関連発明の戦略的な権利化が不可欠です。特に、事例38のように入力データの前処理に工夫を加えることで、より質の高いLLM利用を実現する技術は、今後ますます重要性を増すでしょう。
当事務所では、AI・LLM関連発明の特許出願に豊富な経験を持ち、最新の審査傾向を踏まえた権利化戦略の立案をサポートしています。大規模言語モデルを活用した新たなビジネスの特許保護についてお悩みの方は、ぜひお気軽にご相談ください。
参考文献
- 特許庁「特許・実用新案審査ハンドブック附属書A・附属書B」令和6年3月改訂
- 特許庁「AI関連発明の審査事例追加について」(令和6年3月)
- 特許庁「審査基準 第III部 第2章 第2節 進歩性」
- 特許庁「AI関連技術に関する事例について」
- 日本弁理士会「AI関連発明の特許実務に関する研究報告」