JP7312841B2 - 法律分析装置、及び法律分析方法 - Google Patents
法律分析装置、及び法律分析方法 Download PDFInfo
- Publication number
- JP7312841B2 JP7312841B2 JP2021545546A JP2021545546A JP7312841B2 JP 7312841 B2 JP7312841 B2 JP 7312841B2 JP 2021545546 A JP2021545546 A JP 2021545546A JP 2021545546 A JP2021545546 A JP 2021545546A JP 7312841 B2 JP7312841 B2 JP 7312841B2
- Authority
- JP
- Japan
- Prior art keywords
- law
- legal
- analysis
- word
- laws
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/205—Parsing
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/237—Lexical tools
- G06F40/247—Thesauruses; Synonyms
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
- G06Q50/10—Services
- G06Q50/18—Legal services
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Tourism & Hospitality (AREA)
- Computational Linguistics (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Artificial Intelligence (AREA)
- Economics (AREA)
- General Business, Economics & Management (AREA)
- Strategic Management (AREA)
- Primary Health Care (AREA)
- Marketing (AREA)
- Human Resources & Organizations (AREA)
- Technology Law (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Description
・「関連語」:ある単語に対する同義語、類義語、対義語、さらには上位語、下位語、などを含む。対訳語などを含めてもよい。さらに、同義語や類義語などの特定の種別への分類は難しいが、ある単語に対して関係性が深い単語は、「関係語」として、関連語の一種として位置づける。ここで「単語」は、複数の単語が組み合わさった複合語等の語句をも包含するものとする。これら「関連語」の単語意味関係の抽出が不十分であると、大規模な文書情報の中から、所望の文書を効率的に検出するための技術(文書検索技術等)においては、検出の漏れ(検索漏れ)を発生しやすくなる。
・「法律記述の特殊なルール」:次に示す「法規的解釈」や「文理解釈」を含む。
・「法規的解釈」:法律の中で置いている定義規定等の規定に注目する法解釈。
・「文理解釈」:法律の条文に固有の字義や単語間の並列関係を定義する法律固有の文法構造に注目する法解釈。
・会社計算規則第三条 この省令の用語の解釈及び規定の適用に関しては、一般に公正妥当と認められる企業会計の基準その他の企業会計の慣行をしん酌しなければならない。
この条文は会社法に出現する単語等の語義を企業会計の規定を踏まえた語義として解釈すべきことを求めている。語義解釈において法律で特殊なルールを定めている場合に相当し、関連語(同義語や類義語など)の抽出や類似条文の抽出においても留意する必要がある。
法律分析装置10は、例えば、一般的なコンピュータにより構成され、制御部であるCPU100と、主記憶装置101と、記憶部の一例としての記憶装置102と、読取装置104と、入出力装置105と、通信装置106と、これらを通信可能に接続するバス107とを備える。
図3では、分析要求として、「東京都以外に本店のある法人が、都内に初めて支店を設置する場合の手続きについて教えてください。」という質問文301が入力受付部131に入力され、入出力装置105を介して表示装置に表示された状態を示す。
図4は、図3と同様の質問文が入力されたことを前提とする。図4に示した法人税法402には、ユーザの質問文301に含まれる「支店」302という指定語の他、「事業所」403が含まれ、「支店」と「事業所」が「その他の」402という単語で結び付けられていることを示している。
検索部132は、法律情報格納部121から各法律の条文からなる法律情報等のデータと、分析関連情報格納部122から前処理のための分析ツールとを、それぞれ受け取り、法律の条文を形態素解析し、各単語の出現の有無を分析することで語句出現表260(図6参照)を生成する。また、法律対応づけ情報250(図5参照)を生成する。生成した語句出現表260や法律対応づけ情報250は記憶装置102に格納される。
語句出現表260は、各法律における単語の出現の有無を管理する表である。
単語抽出テンプレート270は、図8に示す語彙辞書を作成するためのルールを示している。単語抽出テンプレート270は、法律文脈パターン271に従って、抽出される単語272と、抽出される単語の関係273を規定したものである。例えば、法律に「A、Bその他のC」という記載があり、A、B、Cが同じ品詞である場合、抽出される単語は「A」「B」「C」である。法律文脈パターン271は、法律の記述において、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される。
図9は、実施例1に係る、法律分析装置10による分析処理のフローチャートである。
まず、入力受付部131は、入出力装置105により、ユーザから関連する法律を分析するための分析要求の入力を受け付ける(S101)。ここでは、理解を容易にするため、図3の質問文「東京都以外に本店のある法人が、都内に初めて支店を設置する場合の手続きについて教えてください。」301が入力された場合を例に説明するが、分析要求はこれに限るものではない。
ステップS105では、分析部134は、ステップS102の前処理で特定された指定語について、語句出現表260を参照して処理を行う。例えば、分析要求に基づく指定語が「支店」である場合には、分析部134は、語句出現表260の「支店」を列名に持つ列262において、「1」が設定されているレコード(行)の名称を特定する。この例では、分析部134は、レコードの名称として、S2、f2、f7の法律を特定する。つまり、「支店」という単語は、S2、f2、f7に含まれていることを意味する。
以上が、法律分析装置10の概要であるが、ステップS105の関連する単語の追加を行うための他の例について説明する。
まず、分析部134は、検索部132から分析対象となる法律名「法人税法」と指定語「支店」が入力される(S201)。つまり、語彙辞書(図8)の見出し語281の「支店」と法律名284が入力される。
照合・統合部135は、更新された語句出現表をもとに指定語や注目語を含む法律を抽出する(S301)。
法律文書においては、「その他」あるいは「その他の」でつながれた語句は、相互に関係の深い単語であることが明示されている。しかも「その他」の文言と「その他の」の文言とでは異なった意味に解釈され、 「その他」の前後は並列関係であり、「その他の」の場合は、直前の語句は直後の語句の例示にあると解釈される。上記のような法律実務に即した正しい語句の関係性を解釈し関係性の深い語句を取得することができるように、法律固有ルール記述部には例えば以下のような解析ルールが規定されている。
・法人税法第二条十二の十九 恒久的施設 次に掲げるものをいう。(中略)イ 外国法人の国内にある支店、工場その他事業を行う一定の場所で政令で定めるもの。
・見出し語: 恒久的施設
・関連語: 外国法人の国内にある支店
・タイプ: 同義語
・法律: 法人税法
・見出し語: 恒久的施設
・関連語: 支店
・タイプ: 関係語
・法律: 法人税法
これらの解析ルールに従うことにより、正しく各語句聞の関係性構造を導き、新たな関連語(同義語や類義語等)の取得を行うことができる。
Claims (12)
- 複数の法律の中から分析要求に関連する法律を抽出する法律分析装置であって、
対応関係にある法律同士を対応付けて管理する法律対応づけ情報と前記複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、
前記複数の法律を分析する法律分析部と、
前記法律分析部の分析結果を提示する提示部と、を有し、
前記法律分析部は、
法律に対する質問文と分析したい必須法律を含む分析要求を受け付ける入力受付部と、 前記入力受付部によって受け付けられた分析要求から指定語を抽出し、前記指定語を含む第1の法律を前記語句出現情報に基づいて、検索する検索部と、
前記法律対応づけ情報に基づいて、前記第1の法律と関連する関連法律を抽出し、前記第1の法律と前記関連法律を出力する法律特定部と、
前記必須法律と前記指定語に基づいて語彙辞書を参照して関連語を抽出し、前記語句出現情報の法律毎に前記関連語を追加する分析部と、
前記法律特定部から出力された前記第1の法律と前記関連法律に対し、前記分析部により追加された前記関連語を含む語彙出現情報に基づいて、法律毎に点数をつけ、点数の高い順に並べた結果を、分析対象となる法律として特定する統合部と、を有する、
ことを特徴とする法律分析装置。 - 請求項1に記載の法律分析装置において、
前記分析部は、
抽出された前記関連語を、前記語彙出現情報の法律毎に重み付けを行って追加することで、前記記憶部に記憶される前記語句出現情報を更新する、
ことを特徴とする法律分析装置。 - 請求項2に記載の法律分析装置において、
前記記憶部に記憶される法律対応づけ情報は、対応関係のある下位法律と上位法律と、前記下位法律と前記上位法律の優先順位を示す関係種別とを含む
ことを特徴とする法律分析装置。 - 請求項2に記載の法律分析装置において、
前記記憶部は、法律文脈パターンを格納し、
前記分析部は、前記指定語から前記関連語を、前記法律文脈パターンに照らして法律毎に抽出し、前記記憶部に記憶される前記語句出現情報を法律毎に更新する、
ことを特徴とする法律分析装置。 - 請求項4に記載の法律分析装置において、
前記記憶部は、前記法律文脈パターン、見出し語、前記見出し語に関連する前記関連語と法律名を対応して記憶する語彙辞書、及び、前記見出し語と前記見出し語の同義語とを格納した同義語辞書の内、少なくとも一つの辞書を格納し、
前記語彙辞書及び前記同義語辞書は、前記法律文脈パターンと、前記法律文脈パターンから抽出される少なくとも二つの単語と、前記二つの単語間の関係を対応付けて法律毎に管理するものである
ことを特徴とする法律分析装置。 - 請求項4に記載の法律分析装置において、
前記記憶部に格納される前記法律文脈パターンは、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される
ことを特徴とする法律分析装置。 - 請求項5に記載の法律分析装置において、
前記記憶部に格納される前記法律文脈パターンは、法律を対象とした文理解釈あるいは法規的解釈のうちの一つ以上に基づいて構成される
ことを特徴とする法律分析装置。 - 請求項7に記載の法律分析装置において、
前記分析部は、前記検索部から前記指定語が入力され、前記法律特定部から法律名が入力され、前記検索部から入力された指定語と前記法律特定部から入力された法律名に基づき、前記語彙辞書及び前記同義語辞書の内の少なくとも一つを参照して、前記関連語を出力する
ことを特徴とする法律分析装置。 - 請求項5に記載の法律分析装置において、
前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
ことを特徴とする法律分析装置。 - 請求項5に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
ことを特徴とする法律分析装置。 - 請求項7に記載の法律分析装置において、前記関連語は、前記見出し語との関係で同義語、類義語、対義語、上位語、下位語、あるいは対訳語である
ことを特徴とする法律分析装置。 - 対応関係にある法律同士を対応付けて管理する法律対応づけ情報と、複数の法律に含まれる単語の出現を管理する語句出現情報とを記憶する記憶部と、前記複数の法律を分析する法律分析部と、前記法律分析部の分析結果を提示する提示部とを有し、前記複数の法律の中から分析要求に関連する法律を抽出する法律分析装置における方法であって、
前記法律分析部は、
法律に対する質問文と分析したい必須法律を含む分析要求を受け付け、
前記受け付けられた分析要求から指定語を抽出し、前記指定語を含む第1の法律を前記語句出現情報に基づいて検索し、
前記法律対応づけ情報に基づいて、前記第1の法律と関連する関連法律を抽出し、前記第1の法律と前記関連法律を出力し、
前記必須法律と前記指定語に基づいて語彙辞書を参照して関連語を抽出し、前記語句出現情報の法律毎に前記関連語を追加し、
前記第1の法律と前記関連法律に対し、前記関連語が追加された語彙出現情報に基づいて、法律毎に点数をつけ、点数の高い順に並べた結果を分析対象となる法律として特定する
ことを特徴とする方法。
Applications Claiming Priority (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2019164516 | 2019-09-10 | ||
| JP2019164516 | 2019-09-10 | ||
| PCT/JP2020/033945 WO2021049485A1 (ja) | 2019-09-10 | 2020-09-08 | 法律分析装置、及び法律分析方法 |
Publications (2)
| Publication Number | Publication Date |
|---|---|
| JPWO2021049485A1 JPWO2021049485A1 (ja) | 2021-03-18 |
| JP7312841B2 true JP7312841B2 (ja) | 2023-07-21 |
Family
ID=74866140
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021545546A Active JP7312841B2 (ja) | 2019-09-10 | 2020-09-08 | 法律分析装置、及び法律分析方法 |
Country Status (2)
| Country | Link |
|---|---|
| JP (1) | JP7312841B2 (ja) |
| WO (1) | WO2021049485A1 (ja) |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025234160A1 (ja) * | 2024-05-09 | 2025-11-13 | 株式会社日立製作所 | 法令対応支援装置、法令対応支援システム及び法令対応支援方法 |
Families Citing this family (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP7664611B2 (ja) * | 2021-05-25 | 2025-04-18 | Fraim株式会社 | 情報処理装置、情報処理方法及び情報処理プログラム |
| JP7789120B2 (ja) * | 2024-05-14 | 2025-12-19 | 三菱電機株式会社 | 社規改定装置、社規改定方法、社規改定プログラム、及び記録媒体 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070088751A1 (en) | 2003-02-21 | 2007-04-19 | Rudy Defelice | Multiparameter indexing and searching for documents |
| JP2011118526A (ja) | 2009-12-01 | 2011-06-16 | Hitachi Ltd | 単語意味関係抽出装置 |
| JP5383943B1 (ja) | 2013-06-06 | 2014-01-08 | 株式会社野村総合研究所 | 契約書分析システム、プログラム及び方法 |
| JP2014238628A (ja) | 2013-06-06 | 2014-12-18 | 株式会社野村総合研究所 | 法律文書解析システム及びプログラム |
| JP2015014980A (ja) | 2013-07-08 | 2015-01-22 | 国立大学法人九州大学 | 検索システム |
| US10373268B1 (en) | 2014-10-05 | 2019-08-06 | Henry A. Orphys | Determining correct answers to tax and accounting issues arising from business transactions and generating accounting entries to record those transactions using a computerized predicate logic implementation |
Family Cites Families (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005196718A (ja) * | 2004-01-08 | 2005-07-21 | Tsunenori Takemoto | 未知概念の背景概念をたどるための方法 |
-
2020
- 2020-09-08 WO PCT/JP2020/033945 patent/WO2021049485A1/ja not_active Ceased
- 2020-09-08 JP JP2021545546A patent/JP7312841B2/ja active Active
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| US20070088751A1 (en) | 2003-02-21 | 2007-04-19 | Rudy Defelice | Multiparameter indexing and searching for documents |
| JP2011118526A (ja) | 2009-12-01 | 2011-06-16 | Hitachi Ltd | 単語意味関係抽出装置 |
| JP5383943B1 (ja) | 2013-06-06 | 2014-01-08 | 株式会社野村総合研究所 | 契約書分析システム、プログラム及び方法 |
| JP2014238628A (ja) | 2013-06-06 | 2014-12-18 | 株式会社野村総合研究所 | 法律文書解析システム及びプログラム |
| JP2015014980A (ja) | 2013-07-08 | 2015-01-22 | 国立大学法人九州大学 | 検索システム |
| US10373268B1 (en) | 2014-10-05 | 2019-08-06 | Henry A. Orphys | Determining correct answers to tax and accounting issues arising from business transactions and generating accounting entries to record those transactions using a computerized predicate logic implementation |
Cited By (1)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| WO2025234160A1 (ja) * | 2024-05-09 | 2025-11-13 | 株式会社日立製作所 | 法令対応支援装置、法令対応支援システム及び法令対応支援方法 |
Also Published As
| Publication number | Publication date |
|---|---|
| WO2021049485A1 (ja) | 2021-03-18 |
| JPWO2021049485A1 (ja) | 2021-03-18 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| US8346795B2 (en) | System and method for guiding entity-based searching | |
| US10489439B2 (en) | System and method for entity extraction from semi-structured text documents | |
| US10282468B2 (en) | Document-based requirement identification and extraction | |
| Avasthi et al. | Techniques, applications, and issues in mining large-scale text databases | |
| Mahmood et al. | Query based information retrieval and knowledge extraction using Hadith datasets | |
| RU2491622C1 (ru) | Способ классификации документов по категориям | |
| KR102661438B1 (ko) | 인터넷 기사 크롤링, 글로벌 가치 사슬에 영향을 주는 이슈 기사의 요약 서비스를 제공하는 웹크롤러 시스템 | |
| RU2579873C2 (ru) | Разрешение семантической неоднозначности при помощи семантического классификатора | |
| JP7167996B2 (ja) | 事例検索方法 | |
| Firdhous | Automating legal research through data mining | |
| JP7312841B2 (ja) | 法律分析装置、及び法律分析方法 | |
| Kwon | Reading customers’ minds through textual big data: Challenges, practical guidelines, and proposals | |
| WO2016067396A1 (ja) | 文の並び替え方法および計算機 | |
| Garg et al. | Maulik: A plagiarism detection tool for hindi documents | |
| Elbarougy et al. | A proposed natural language processing preprocessing procedures for enhancing arabic text summarization | |
| Berdyugina et al. | Setting up context-sensitive real-time contradiction matrix of a given field using unstructured texts of patent contents and natural language processing | |
| Hoshino et al. | Question answering system for legal bar examination using predicate argument structure | |
| Khalil et al. | Extracting Arabic composite names using genitive principles of Arabic grammar | |
| Revanth et al. | Nl2sql: Natural language to sql query translator | |
| Fudholi et al. | Ontology-based information extraction for knowledge enrichment and validation | |
| JP4361299B2 (ja) | 評価表現抽出装置、プログラム、及び記憶媒体 | |
| Maynard et al. | Adapting a robust multi-genre NE system for automatic content extraction | |
| Yeshambel et al. | Construction of morpheme-based Amharic stopword list for information retrieval system | |
| Reentovich et al. | The first one-million corpus for the Belarusian NooJ module | |
| Alam et al. | Comparing named entity recognition on transcriptions and written texts |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination |
Free format text: JAPANESE INTERMEDIATE CODE: A621 Effective date: 20220217 |
|
| A131 | Notification of reasons for refusal |
Free format text: JAPANESE INTERMEDIATE CODE: A131 Effective date: 20230425 |
|
| A521 | Request for written amendment filed |
Free format text: JAPANESE INTERMEDIATE CODE: A523 Effective date: 20230616 |
|
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) |
Free format text: JAPANESE INTERMEDIATE CODE: A01 Effective date: 20230704 |
|
| A61 | First payment of annual fees (during grant procedure) |
Free format text: JAPANESE INTERMEDIATE CODE: A61 Effective date: 20230710 |
|
| R150 | Certificate of patent or registration of utility model |
Ref document number: 7312841 Country of ref document: JP Free format text: JAPANESE INTERMEDIATE CODE: R150 |