- PatentBench-新規性調査
- PatentBenchとは
- PatentBench-評価設計
- 英語版はこちら
概要
PatSnap PatentBenchは、PatSnap Eureka 新規性調査エージェント、ChatGPT-o3(ウェブ検索対応)、DeepSeek-R1(ウェブ検索対応)の3つのAIツールを対象に、これらが実際の特許業務における新規性調査をどの程度支援できるかを評価するベンチマークです。
今回は、340件のテストサンプルを採用。テスト結果では、PatSnap Eureka 新規性調査エージェントは、Top100の検索結果におけるX検出率とXリコール率がそれぞれ81%と36%に達し、二つの汎用AIを大きく上回りました。
PatSnap Eureka 新規性調査エージェントは、特許専門家の新規性調査の効率を大幅に向上させ、時間と人手のコストを削減できることが示され、特許分野の専門AIツールが垂直分野において変革的な可能性を持つことを明らかにしています。
実務の新規性調査について
新規性調査は特許業務においては重要であり、世界中の先行技術を体系的に特定し、ある技術的解決策が特許法上新規でかつ進歩性を有するかを判断する専門的な検索プロセスを指します。
研究開発の立ち上げ、特許出願前、特許審査など、新規性調査はイノベーションのライフサイクル全体にわたって活用されます。例えば、研究開発立ち上げの段階では、研究者は調査結果を基に技術開発の方向性や実現可能性を評価します。出願前の段階では、特許出願を行うか否かを決定する判断材料となります。特許審査の段階では、審査官が特許出願の新規性および進歩性を判断します。
評価設計
サンプル
今回のサンプルは340件で構成されています。言語は68%が英語、32%が中国語で、IPC分類に均等に分布しており、主流技術分野からニッチな領域までを網羅しています。特許庁別の分布では、アメリカ(US)および中国(CN)がそれぞれ約32%を占め、欧州特許庁(EP)および世界知的所有権機関(WO)がそれぞれ約18%を占めています。このバランスの取れた構成は、主要特許庁の異なる審査ルールを反映しており、より現実的でグローバルに代表性のある評価を可能にしています。
評価対象
PatSnap Eureka 新規性調査エージェント
ChatGPT-o3(ウェブ検索対応版)
DeepSeek-R1(ウェブ検索対応版)
PatSnap Eureka新規性調査エージェントは特許の新規性調査に特化して開発されたAIエージェントであり、技術案のテキストを入力するだけで、検索プロセス全体を自動で実行し、新規性調査レポートを生成します。一方、ChatGPT-o3とDeepSeek-R1は、現在主流の汎用大規模言語モデルであり、優れた推論性能と人間に匹敵する思考プロセスにより、さまざまな業務シーンで広く活用されています。
テスト結果
ベンチマーク結果では、PatSnap Eureka新規性調査エージェントがTop100においてXヒット率86%、Xリコール率31%となり、二大汎用AIツールを大きく上回りました。
Xヒット率(X Hit Rate):
Xヒット率はAIツールがX文献を適切に検索できるかどうかを評価する指標です。高いXヒット率は、特許審査の段階や技術開発の方向性を決定する「初期スクリーニング」段階では、検索プロセスを大幅に加速し、特許審査の効率を向上させることに非常に役割を果たしています。Patsnap Eureka新規性調査エージェントは81%。これは、340件のテストサンプルのうち、PatSnap Eureka新規性調査エージェントが約5分の4のサンプルで少なくとも1件のX文献を正確に検出できたことを表明しています。
Xリコール率(X Recall Rate):
AIツールが可能な限り多くのX文献を漏れなく検索できるかを評価する指標です。この指標は、研究開発の立ち上げ段階や特許出願前の段階で特に重要です。より多くのX文献を把握することで、技術案の調整やクレームドラフトの改善につながり、最終的には特許の権利化率向上に寄与します。Patsnap Eureka新規性調査エージェントのXリコール率は36%。これは、Top100の検索結果の中でPatSnap Eureka新規性調査エージェントがサンプルのX文献の36%検出できていることを示しています。
応用価値と影響
PatSnap Eureka新規性調査エージェントは今回のテストで高い性能を達成できたのは、垂直領域モデルとRAG(Retrieval-Augmented Generation、検索強化生成)技術によるものです。本エージェントは、基礎となるオープンソース大規模モデルを特許分野の専門知識で体系的に調整しており、特許技術言語や検索ロジックを深く理解できるようになっています。さらに、エージェントはRAG技術を活用して高品質な検索作業を実行し、リアルタイム検索能力と生成能力を有機的に統合しています。この技術の組み合わせにより、新規性調査エージェントはテキスト中の重要な技術特徴を正確に把握し、精緻な検索戦略を実行し、信頼性の高い結果を提供することが可能であり、専門的な新規性調査業務において汎用大規模モデルを大きく上回る性能優位を示しています。
このような優位性により、企業や特許事務所で特許出願業務に従事する知的財産の専門家にとって、PatSnap Eureka新規性調査エージェントは、正確性を維持しながら新規性調査の効率を飛躍的に向上させるツールとして活用できると考えられます。従来は数時間かかっていた検索、抽出、並び替え作業をわずか数分で完了できるため、専門家はより高付加価値な分析や意思決定に注力でき、「3日かかっていた反復的な検索作業」を「3時間での高品質な分析作業」に置き換える効率的なワークフローを実現できます。
さらに、プロジェクトの事前調査や研究開発立ち上げを行う企業の開発チームにとっても、本エージェントは革新的なソリューションとなり得ます。初期段階で効率的な新規性調査を実施することで、新規性不足のリスクを大幅に低減し、開発リソースの潜在的な浪費を最小限に抑え、研究開発ワークフローに大きな変革をもたらせると考えれらます。