「ChatGPTに質問するとき、どうすれば最適な回答が得られるのか?」—これは多くのユーザーが抱える疑問です。プロンプトエンジニアリングと呼ばれるこの技術分野は、ビジネスでも重要視されるようになり、特許出願の対象としても注目されています。しかし、AIツールの使い方に関する工夫は、果たして特許として認められるのでしょうか?この記事では、特許庁が公表した事例38を通じて、ChatGPTなどの大規模言語モデル(LLM)のプロンプト生成技術が特許になり得る条件を、弁理士の視点から詳しく解説します。
2024年3月、特許庁はAI関連技術の審査事例を拡充し、「プロンプト用文章生成方法」に関する事例38を公表しました。この事例は、ChatGPTなどのAIツールを「どう使うか」という方法にも特許性があり得ることを示すもので、AI開発企業だけでなく、AIツールを活用する一般企業にとっても重要な意味を持ちます。
本稿では、この事例38を詳細に解説し、「単なるAI利用」と「特許性のあるAI活用技術」の違いを明らかにします。読めば、あなたの会社のAI活用方法が特許化できる可能性や、競合他社の特許リスクについても理解できるでしょう。さらに、今後のビジネス展開において知財戦略をどう組み立てるべきかのヒントも得られます。
事例38「大規模言語モデルに入力するためのプロンプト用文章生成方法」は、進歩性の判断に関する事例として公表されています。この事例は、LLMへの入力を最適化するための技術、特に制限文字数という技術的制約の中で効果的なプロンプトを生成する方法に関するものです。
現在、OpenAIのGPTシリーズをはじめとする多くのLLMには、一度に入力できるトークン(文字数)の上限が設定されています。例えば、GPT-4では、モデルにより8,192または32,768トークンの入力上限があります。このような制約の中で、いかに質の高いプロンプトを作成するかは、LLMを効果的に活用する上で重要な技術的課題となっています。
特に、文脈や参考情報を付加することでLLMの回答精度を向上させるRAG(Retrieval-Augmented Generation)技術が注目される中、限られた入力トークン数で効率的かつ効果的に情報を付加する技術は、実用的な価値が高いと言えます。
事例38では、以下の2つの請求項が示されています。
入力された質問文に対して参考情報を付加することにより、大規模言語モデルに入力するためのプロンプトをコンピュータが生成するプロンプト用文章生成方法であって、
前記大規模言語モデルは入力できるプロンプトの文字数の上限である制限文字数が設定されており、質問文を含むプロンプトを入力すると、前記質問文に関する回答文を出力する大規模言語モデルであり、
前記コンピュータが、
前記入力された質問文をもとに、当該質問文の文字数と合わせた合計文字数が前記制限文字数以下の文字数となるように、前記質問文に関連した付加文章を生成する付加文章生成ステップと、
前記入力された質問文に対し、前記付加文章生成ステップにより生成された前記付加文章を前記参考情報として追加することによって前記プロンプトを生成するプロンプト生成ステップと、
を実行することを特徴とするプロンプト用文章生成方法。
前記付加文章生成ステップは、前記入力された質問文をもとに、当該質問文に関連した関連文章を複数取得し、取得された複数の前記関連文章から、前記参考情報として適した複数のキーワードを抽出し、前記複数のキーワードを使用して、前記合計文字数が前記制限文字数を超えない前記付加文章を生成するステップであることを特徴とする請求項1に記載のプロンプト用文章生成方法。
事例38の発明の詳細な説明からは、以下の技術的課題と解決手段が読み取れます。
大規模言語モデルは使用に際して入力の制限文字数が設けられている場合があり、入力された質問文に対して参考情報を無制限に加えることができないという課題がありました。本発明は、有効な参考情報を質問文に対して追加し、所定の制限文字数内でプロンプト用文章を生成する方法を提供することを目的としています。
請求項1の解決手段は、入力された質問文をもとに、質問文の文字数と合わせた合計文字数が制限文字数以下となるように付加文章を生成し、それを質問文に追加してプロンプトを生成するというものです。
請求項2では、さらに具体的な解決手段として、質問文に関連した関連文章を複数取得し、それらから参考情報として適したキーワードを抽出し、それらのキーワードを使用して付加文章を生成するという手法を採用しています。関連文章の取得について、例えば、質問者の質問履歴、行動履歴、購買履歴などのデータベースから質問文と関連性が高い情報を抽出する方法が示されています。
請求項1の効果としては、制限文字数内で入力された質問文に対して有効な付加文章を参考情報として加えたプロンプトを生成できることが挙げられています。
請求項2の効果としては、さらに、所定の制限文字数内で、質問文と関連性が高く参考情報として適した付加文章を付加したプロンプトを生成することができ、より信頼性が高く適切な回答文を得ることができるとされています。
事例38には詳細な図面は含まれていませんが、明細書の記載から、概念的には以下のようなシステム構成が想定されています。
事例38では、以下の引用発明1と技術常識が示されています。
入力された質問文に対して参考情報を付加することにより、大規模言語モデルに入力するためのプロンプトをコンピュータが生成するプロンプト用文章生成方法であって、
前記大規模言語モデルは、質問文を含むプロンプトを入力すると、前記質問文に関する回答文を出力する大規模言語モデルであり、
前記コンピュータが、
前記入力された質問文をもとに、前記質問文に関連した付加文章を生成する付加文章生成ステップと、
前記入力された質問文に対し、前記付加文章生成ステップにより生成された前記付加文章を前記参考情報として追加することによって前記プロンプトを生成するプロンプト生成ステップと、
を実行することを特徴とするプロンプト用文章生成方法。
言語処理の技術分野において、情報処理量が過大にならないようにすることは、当業者が通常考慮する自明な課題であり、また、その解決方法として、入力できる文章の上限である制限文字数を設定し、文章が当該制限文字数以上となる場合に、当該制限文字数以上となる部分を破棄することで、実際に入力される文章を制限文字数以下の文字数となるように作成することは出願時における周知技術である。
請求項1と引用発明1とを対比すると、以下の相違点が認められます。
請求項1に係る発明の大規模言語モデルは入力できるプロンプトの文字数の上限である制限文字数が設定されており、付加文章生成ステップは、質問文の文字数と合わせた合計文字数が前記制限文字数以下の文字数となるように、前記質問文に関連した付加文章を生成するのに対し、引用発明1の大規模言語モデルには入力できるプロンプトの文字数の上限である制限文字数が設定されているか否か不明であり、付加文章生成ステップは上述のような付加文章の生成を行っているか否か不明である点。
審査官は、この相違点について、上記の技術常識を考慮すると、制限文字数以下となるように付加文章を生成することは、当業者が容易に想到し得たことであると判断しています。
具体的には、言語処理分野では情報処理量を考慮することは自明の課題であり、制限文字数を設定して、超える部分を破棄するという周知技術を適用することは、当業者の通常の創作能力の発揮に過ぎないというわけです。
請求項2については、先の相違点に加えて、以下の相違点が認められています。
請求項2に係る発明の付加文章生成ステップは、入力された質問文をもとに、当該質問文に関連した関連文章を複数取得し、取得された複数の関連文章から、参考情報として適した複数のキーワードを抽出し、複数のキーワードを使用して、合計文字数が制限文字数を超えない付加文章を生成するのに対し、引用発明1の付加文章生成ステップではそのような特定がない点。
この相違点について、審査官は以下のように判断しています。
関連文章を複数取得し、その中から参考情報として適したキーワードを抽出し、それを使用して制限文字数内の付加文章を生成するという構成を開示する先行技術は発見されておらず、出願時の技術常識でもない。
請求項2に係る発明は、当該構成により「所定の制限文字数内で、質問文と関連性が高く参考情報として適した付加文章を付加したプロンプトを生成することができ、より信頼性が高く適切な回答文を得る」という引用発明1と比較して有利な効果を奏する。
これは単なる設計変更ではなく、進歩性を有する発明である。
事例38の請求項1は、単に「制限文字数以下となるように付加文章を生成する」という抽象的な解決手段しか提示していないため、進歩性が否定されています。これは、制限文字数を考慮することが技術常識であり、単に制限文字数内に収めるという発想は当業者が容易に想到できるとされたためです。
一方、請求項2は以下の3つのステップを具体的に特定しています。
この具体的な解決手段の記載が、進歩性の肯定的判断につながっています。
LLM関連発明においても、単に「LLMを利用する」というだけでは不十分であり、具体的な技術的手段を提示することが重要です。特に、入力データの前処理や出力データの後処理などの点で独自の工夫を加え、その具体的な処理フローを特定することが進歩性を主張する上で効果的です。
請求項2が進歩性を有すると判断された理由の一つは、「より信頼性が高く適切な回答文を得る」という効果が引用発明1からは予測困難な効果と評価されたことです。
この効果は、単に制限文字数内に情報を詰め込むという量的な効果ではなく、関連文章から抽出したキーワードを使用することで、質的にも優れた付加文章を生成できるという点に着目したものです。つまり、量的制約(制限文字数)の中での質的向上という効果を主張しているのです。
LLM関連発明においても、単なる自動化や効率化以上の効果、特に以下のような効果を主張することが有効です。
事例38では、「制限文字数を設定し、超える部分を破棄する」という周知技術に対して、「関連文章からキーワードを抽出して付加文章を生成する」という新規な手法が進歩性を有すると判断されています。
この判断から、LLM関連発明においても、以下のような周知技術との差別化ポイントを明確にすることが重要であることがわかります。
事例38から学べるLLM関連発明の請求項記載のポイントは以下の通りです。
単なる効率化や自動化ではなく、LLM利用における具体的な技術的課題を設定します。例えば:
抽象的な手段ではなく、具体的な解決手段のステップを記載します。事例38の請求項2のように、複数のステップ(関連文章の取得→キーワードの抽出→付加文章の生成)を組み合わせた解決手段を記載することが効果的です。
「参考情報として適したキーワードを抽出」といった、効果を裏付ける技術的特徴を請求項に含めることが重要です。これにより、単なる設計変更ではなく、特定の効果を狙った技術的工夫であることを主張できます。
事例38では方法の発明のみが示されていますが、実際の出願では以下のような複数の独立請求項を用意することを検討すべきです。
LLM関連発明の明細書作成において特に重要となるポイントは以下の通りです。
従来技術の問題点を具体的に指摘し、本発明が解決しようとする技術的課題を明確に説明します。事例38では「制限文字数の存在」という課題が明確に記載されています。LLM関連発明においては、以下のような課題を具体的に記載することが重要です。
抽象的な説明ではなく、具体的な実施形態を記載します。関連文章の取得方法、キーワード抽出のアルゴリズム、文章生成のプロセスなどを詳細に説明することが重要です。
具体的には、以下のような内容を記載することが効果的です。
「より信頼性が高く適切な回答文を得る」といった効果を、具体的な実験結果や比較データなどで裏付けることが効果的です。例えば、以下のような裏付けを記載することを検討すべきです。
LLM関連発明が適用される具体的な技術分野(例:カスタマーサポート、医療診断、法律相談など)を明確にし、その分野特有の課題や効果を記載することで、特許性の向上が期待できます。
事例38の分析から、LLM関連発明の権利化において重要なポイントは以下の通りです。
LLM関連発明の特許出願においては、単にLLMを利用するというだけでは進歩性が認められにくい状況です。しかし、事例38が示すように、入力データの前処理や出力データの最適化など、具体的な技術的工夫を加えることで、進歩性を有する特許として権利化できる可能性があります。
近年、ChatGPTやGeminiなどのLLMを活用した様々なサービスが登場していますが、それらの差別化や競争優位性を確保するためには、LLM関連発明の戦略的な権利化が不可欠です。特に、事例38のように入力データの前処理に工夫を加えることで、より質の高いLLM利用を実現する技術は、今後ますます重要性を増すでしょう。
当事務所では、AI・LLM関連発明の特許出願に豊富な経験を持ち、最新の審査傾向を踏まえた権利化戦略の立案をサポートしています。大規模言語モデルを活用した新たなビジネスの特許保護についてお悩みの方は、ぜひお気軽にご相談ください。