• PatentBenchとは
  • 新規性調査 - 評価結果
  • 新規性調査 - 評価設計

Patsnap PatentBench:
知財専用AI評価のグローバルスタンダード

2025年12月

なぜ Patsnap PatentBench は必要なのか

世界中のR&Dチームは、毎年数十億、場合によっては数兆円規模の投資を行い、イノベーションを生み出しています。製品化できるかあるいは訴訟リスクに直面するか、また市場の先行者になれるかどうかは、多くの場合「特許」に左右されます。特許は法律的・技術的・戦略的要素が複雑に絡み合う領域であり、決して容易に扱えるものではありません。

特許関連業務― 検索、分析、明細書作成、審査、訴訟―は依然として高い専門性と知識が求められる高難度な業務です。ツールはあるものの、多くは高度な専門知識を前提としており、大量の処理や迅速な作業には向いていません。

一方、近年の大規模言語モデル(LLM)は飛躍的な進化を遂げており、検索式の生成、論文の要約、法的文書の翻訳など、多くの高度なタスクをこなすようになっています。

しかし、「AIは本当に知財実務のプロフェッショナルを支えうるのか?」という問いへの答えは、まだ明確ではありません。

技術密度の高い「クレーム(請求の範囲)」を正確に解釈できるのか?

新規性調査やドラフティングのような、複雑かつリスクの大きい核心業務を任せられるのか?

どこまでできて、どこがまだ不十分なのか?

Patsnapは、これらの懸念を解消し、AIの技術的限界と可能性を客観的に示すため、「PatentBench」を構築しました。

Patsnap PatentBench とは

PatentBenchは、AI が特許実務をどこまで遂行できるのかを評価するベンチマークです。AI が文章を作れるかどうかだけを確認するものではなく、法律的な微妙な判断や技術情報の解釈、特許業務の実務支援ができるかまでをしっかり定量的に評価します。評価は「特許実務に求められる 10 の基礎スキル」、「特許実務への応用能力」2つの軸で行われます。

1. 特許実務に求められる 10 の基礎スキル

特許業務の本質は、高度に専門化された文書の処理と理解にあります。そのため、優れた特許向けAIは、まず確かな基礎能力を備えていることが求められます。そこで、PatentBench は、特許実務に求められる能力を 10 の基礎スキルに設計することで、AIを包括的に評価することを目的としています。

特許Q&A能力

特定の特許文書、技術分野、特許法規に関する各種質問に正確に回答できるかを評価。質問の種類には、事実確認型(この特許の出願日はいつか?)、定義解釈型(「新規性猶予期間」とは何か?)、深層理解型(本特許の請求項3の技術的解決手段は、どのように主張された技術課題を解決しているか?)が含まれる。

特許解釈能力

特許文献の核心である請求項および明細書を適切に解析、発明の保護範囲を把握、主要技術構成・技術課題・解決手段を抽出できるかを評価。

特許翻訳能力

異なる言語間で特許文献を翻訳する際の正確性、専門性、構文処理能力を評価。原文の技術的意味を損なわず、かつ出願国の特許言語規範に適合した翻訳が生成できるかを確認。

情報抽出能力

膨大な特許テキストから技術課題、技術的効果、構成要素、解決手段といった重要情報を正確に抽出し、構造化データとして整理できるかを評価。

法務・実務知識

各国の特許代理資格試験や審査官試験に類似した問題を用い、特許法規、審査基準、手続要件、実務運用に関する知識をどの程度理解しているかを測定。

要約能力

長大で複雑な特許文献について、要旨、技術概要、請求項サマリーといった異なる形式の要約を生成する能力を評価。

分類能力

特許に記載された技術内容に基づき、適切なIPC等の分類に割り当てる能力を評価。

ドラフティング能力

特許出願書類、特に技術背景、課題、発明の内容、実施形態、請求項などの記載を支援できるかを評価。

マルチターン対話能力

複雑な発明内容や審査対応に関する連続対話において、モデルが文脈を保持し、ユーザからの追加質問・修正依頼に応じて回答を段階的に精緻化できるかを評価。

特許推論能力

与えられた特許Aと製品Bの技術的特徴に基づき、製品Bが特許Aの権利範囲に抵触する可能性を推論したり、特許Xと特許Yの間に引用関係、継承関係、抵触関係が存在するかを分析できるかを評価。これらは単なる表面的なスキルではなく、特許実務で求められる高度な思考そのものです。

2. 特許実務への応用能力

基礎能力が「基礎体力」だとすれば、実務への応用は「実戦」です。PatentBenchは新規性調査、FTO分析、特許翻訳などの主要実務において、AIの総合性能を検証すると計画。今後は、より多様な特許実務の応用シナリオへと拡大し、基準評価を深化させていく予定です。

新規性調査

FTO分析

特許翻訳(多言語対応)

明細書作成

意匠侵害

学術的な性能ではなく、AIが実際の特許業務で使えるかを評価します。

PatentBench の影響と今後の展望

技術発展の方向性を明確に

AI 開発者にとって、PatentBench は精緻な「能力マップ」および「タスクリスト」に相当し、特定能力の向上に向けた最適化方針を明確に示すことで、実務需要に即した特許エージェントの開発を可能にします。これにより、汎用能力における過度な競争に陥りつつ、専門領域では十分な性能を発揮できないという偏りを回避することができると考えられます。

専門家の選択に確固たる根拠を提供

特許実務者や企業が市場にあふれる「AI×特許」製品を前に判断を迫られる状況において、PatentBench は客観的かつ中立的な第三者評価の枠組みを提供し、ユーザーは自らの要件に最も適合するツールを評価結果に基づいて選択できるようになります。これにより、試行錯誤のコストが削減され、AI 技術の実務への導入と普及が加速されます。

業界全体の標準形成を後押

PatentBench の取り組みは、特許領域における AI の適用効果を評価する共通の基準を確立するきっかけとなり、健全な競争環境を醸成し、能力不足の製品を淘汰し、実効性の高い技術革新を促します。その結果、特許業界全体の知能化水準とサービス品質の向上につながります。

PatentBench の評価基準そのものも進化し続けていきます。AI 技術の発展および特許実務の高度化に伴い、今後はより広範かつ多様な特許業務シナリオを対象とした総合的な評価へと拡張していく予定です。