JP7526316B2

JP7526316B2 - 汎用モデルに基づく標準的な医学用語管理システム及び方法

Info

Publication number: JP7526316B2
Application number: JP2023093632A
Authority: JP
Inventors: ▲勁▼松李; 紫怡 ▲兪▼; 宗峰 ▲楊▼; 雨田; 天舒周
Original assignee: 之江実験室
Priority date: 2022-08-16
Filing date: 2023-06-07
Publication date: 2024-07-31
Anticipated expiration: 2043-06-07
Also published as: CN115080751B; JP2024027087A; CN115080751A

Description

本発明は医学分野の技術分野に関し、特に汎用モデルに基づく標準的な医学用語管理システム及び方法に関する。

ビッグデータ時代の到来に伴い、医療ビッグデータの医学分野での応用価値も徐々に掘り起こして利用されるようになる。ところが、この過程において、マルチソースの医学データは統一された標準を有せず、過去に規範的な制約がないため、各業界において既存の医療データを最大限に合理的に利用できず、これも医学情報化構築及び医学研究発展の妨害要素となる。

現在、各大国内外の権威機構が発表した標準的な医学用語集は既に異なる分野に広く応用及び認可されているが、複数のニーズシーンに対応できて異なるサービスプラットフォーム間の壁を突破できる中国語の標準的な医学用語システムがまだない。このため、今の段階において、中国語の標準的な用語の現実の世界におけるカバー率が４０％よりも低いだけであり、医療人工知能の応用ニーズを満たすことができない。

既存の中国語医学用語管理方法において、第１としては、ｓｎｏｗｆｌａｋｅアルゴリズムによって同義の医学用語をマーキングし、概念を中心として統合した後、単一分類におけるツリーデータ構造医学辞書を構築し、第２としては、英語の医学用語リソース例えばＳＮＯＭＥＤＣＴに対して機械翻訳及び大量の手動補正を行う。

第１形態においては、異なるソースから取得された医学用語を分類して、異なる意味の医学用語を取得し、概念を中心として同義の集まり及び語義の分類を実現し、更に異なる意味の医学概念をｓｎｏｗｆｌａｋｅアルゴリズムによってマーキングし、異なる概念識別子に基づいて統合して医学概念リストを取得するとともに、正確な分類を満たすようにＪａｃｃａｒｄ類似度アルゴリズムによって同じソースの医学用語に対して類似度の計算を行う。このような方法によってインクリメントＩＤを実現し、ＩＤの一意性及びインデックス性能を確保する。その構築された用語システムは構造が単一で、拡張性が低く、多様なデータソース及び絶えず更新している応用シーンニーズを満たすための汎化能力及び柔軟性がない。用語内部及び用語間の関連情報を効果的に利用しないため、用語集の後続のメンテナンス及び拡張のために依然として多くの人件費を要する必要がある。１つの標準的な用語概念を追加する場合を例とし、従来の技術案は元の用語リストに同義の概念が存在するかどうかを判断することにより概念の分類又は追加を行うことができるだけである。追加した概念と元の用語リストにおける用語との間に階層関係がある場合、新たな概念を有効なノードの位置に自動的に追加できず、追加概念と既存概念との間に情報の関連がある場合、それも識別できず、従って関連情報を記憶するのであり、従来技術は用語自身の既存情報を効果的に利用して同類用語の集まりを行うことができず、手動で管理及びメンテナンスする必要があり、標準化された用語管理システム及び反復閉ループを効果的に形成することができない。

第２形態においては、大量の手動補正を行わずに機械翻訳のみを行う条件において、翻訳結果が専門概念から大きく外れることを回避できず、中国国内外言語の使用習慣の相違も無視しやすく、用語をマッピングする際に取得したリコール率が極めて低いことが多い。リコール率を向上させる必要がある場合、管理及びメンテナンスのために倍になる人件費及び資金コスト、並びに長い時間サイクルを要する。

現在、構築された用語システムは構造が単一で、拡張性が低く、多様なデータソース及び業務ニーズを満たすための汎化能力がなく、用語ライブラリを持続的且つ効率的に管理及び最適化するための柔軟性がない。主な表現は以下のとおりである。第（１）として、ソース情報を保留せず、標準的な用語と非標準的な用語とのマッピング関係を確立・記憶しない。第（２）として、用語内部及び用語間の関連関係を合理的に利用せず、標準的な用語概念の追加の場合には、元の用語リストに同義の概念が存在するかどうかを判断することにより概念の分類又は追加を行うことができるだけであり、追加する必要がある概念と元の用語リストにおける用語との間に階層関係がある場合、新たな概念を有効なノードの位置に自動的に追加できず、追加する必要がある概念は特定の応用ニーズを満たす必要があって、より高い階層に位置する場合、その中の関連情報を効果的に利用してそのサブクラスの同類用語の集まりを行い、第（３）として、用語ライブラリの後続の反復は多くの人件費を要し、効率的で標準化された用語管理システム及び反復閉ループを形成できない。

実際のニーズシーンを例とし、用語ライブラリがＤＲＧ又はＤＩＰシステムの業務ニーズを満たす必要がある場合、用語を関連する標準データベース例えばＩＣＤ－１０医療保険バージョン、ＩＣＤ－９－ＣＭ－３医療保険バージョンにマッピング又は遡及できるように確保する必要があり、１つの標準概念を例とし、臨床所見概念「下肢痛」は現在確立された標準的な用語ライブラリに存在せず且つ追加される必要がある場合、それを「四肢痛」及び「下肢臨床所見」のノードに自動的に追加して上記２つの用語概念のサブノードとする必要があるとともに、元に「四肢痛」ノードにある「下腿痛」、「足部痛」、「左下肢痛」を「下肢痛」のサブノードに一括で補正する必要があり、そして、身体部位情報「下肢」を発病部位に自動的に関連付けする必要がある。明らかに、従来技術はまだ上記用語の自動化管理プロセスを完了できない。

このために、上記技術的問題を解決するように汎用モデルに基づく標準的な医学用語管理システム及び方法を提供する。

上記技術的問題を解決するために、本発明は汎用モデルに基づく標準的な医学用語管理システム及び方法を提供する。

本発明が用いる技術案は以下のとおりである。

汎用モデルに基づく標準的な医学用語管理システムであって、オープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、用語カテゴリ及び用語カテゴリに対応する細分の属性名称を取得し、且つ構築されたシーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性名称に対応する細分の属性内容を取得することに用いられ、各種類の前記用語カテゴリがいずれも１種類の主要な細分の属性名称及び複数種類の副次的な細分の属性名称を含む用語情報処理モジュールと、前記細分の属性内容から語義類似度が最も高い標準的な語義単語を検索して標準化マッピング関係を確立して、前記標準化マッピング関係を補正及び追加し、用語関係ネットワークの設立を完了するための用語関係ネットワーク構築モジュールと、異なる前記用語カテゴリに対してインクリメント推奨を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得するための用語ライブラリ自己増幅モジュールと、前記用語ライブラリに対して可視化管理を行うための可視化管理モジュールと、を備える。

更に、前記可視化管理モジュールは、ユーザーのプレビューデータを提供し、標準的な用語の可視化クエリを行い、異なる次元の選別条件に応じて対応する用語を選別するとともに、ユーザーログインインターフェース入口及び用語管理インターフェース入口を提供し、標準的な用語のトップレベルカテゴリ、同義語、親ノード用語、サブノード用語及び／又は属性情報を含む次元の標準的な用語情報を表示し、それと同時に関連用語詳細インターフェースに入る入口を提供するための標準的な医学用語クエリユニットと、ユーザーが可視化インターフェースを介して標準的な用語の追加、削除及び／又は補正、標準的な用語の同義語の追加及び／又は削除、標準的な用語の属性情報の補正を含む用語エンティティの編集を行うための用語編集ユニットと、用語監査者が第二者監査を行い、監査者が用語監査結果の判定を行うための用語監査ユニットと、ユーザーが異なるソースの医学データに対して標準化マッピングを行い、マッピング不可能なデータに対して推奨キューを構築し、用語管理者による用語のワンクリックマッピング及び推奨キューの形成を確保するための用語マッピングユニットと、を備える。

本発明は汎用モデルに基づく標準的な医学用語管理方法を更に提供し、用語情報処理モジュールによってオープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、用語カテゴリ及び用語カテゴリに対応する細分の属性名称を取得し、且つ構築されたシーケンスラベリングモデルによって分割して前記細分の属性名称に対応する細分の属性内容を取得し、前記細分の属性内容が標準的な単語であり、各種類の前記用語カテゴリがいずれも１種類の主要な細分の属性名称及び複数種類の副次的な細分の属性名称を含むステップＳ１と、前記シーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性を取得し、用語関係ネットワーク構築モジュールによって前記標準的な単語から語義類似度が最も高い標準的な語義単語を検索して標準化マッピング関係を確立して、前記標準化マッピング関係を補正及び追加し、用語関係ネットワークの設立を完了するステップＳ２と、用語ライブラリ自己増幅モジュールによって異なる用語カテゴリに対してインクリメント推奨を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得するステップＳ３と、可視化管理モジュールによって前記用語ライブラリに対して可視化管理を行い、前記可視化管理が標準的な医学用語クエリユニット、用語編集ユニット、用語監査ユニット及び用語マッピングユニットを備えるステップＳ４と、を含む。

更に、前記ステップＳ１は具体的に、用語情報処理モジュールによってオープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、元の用語の階層関係、関連関係及び／又は符号化情報を保持してソースタグを付けて、用語カテゴリ及び用語カテゴリに対応する細分の属性名称を取得するサブステップＳ１１と、事前訓練言語モデルによってシーケンスラベリングモデルを構築して、前記シーケンスラベリングモデルによってオープンソース標準用語データを分割して細分の属性内容を取得するサブステップＳ１２と、を含む。

更に、前記サブステップＳ１２は具体的に、事前訓練言語モデルによってオープンソース標準用語データにおける各文字／単語のベクトル表現を計算するサブステップＳ１２１と、前記ベクトル表現に対して自己注意メカニズムによって各文字／単語の出力状態を計算するサブステップＳ１２２と、前記出力状態に対して完全接続ニューラルネットワークにより計算を行って各文字／単語が各種類の細分の属性カテゴリに属する確率を取得し、シーケンスラベリングモデルの構築を完了するサブステップＳ１２３と、前記オープンソース標準用語データを前記シーケンスラベリングモデルによって分割して細分の属性内容を取得し、前記細分の属性内容が標準的な単語であり、前記細分の属性内容が主要な細分の属性内容及び副次的な細分の属性内容を含むサブステップＳ１２４と、を含む。

更に、前記ステップＳ２は具体的に、前記シーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性を取得し、用語関係ネットワーク構築モジュールによって前記標準的な単語から任意の標準的な語義単語を検索し、アルゴリズムによってカルテテキストの細分の属性と前記任意の標準的な語義単語との語義類似度を取得し、語義類似度が最も高い標準的な単語を選択して標準化マッピング関係を確立するサブス
テップＳ２１と、アルゴリズムによって分割して副次的な細分の属性を取得し、現在のカルテテキストには説明タイプを定義できる親ノードが存在し、且つ分割して取得された主要な細分の属性にはタイプ情報が含まれない場合、主要な細分の属性を情報追加して情報に対応する細粒度サブノードに補正し、標準化マッピング関係の補正を完了するサブステップＳ２２と、単一の用語カテゴリが複数のタイプの副次的な細分の属性を含むことに起因して補正後の主要な細分の属性が複数ある場合、最も多く存在する主要な細分の属性のカルテテキストにおける親ノードを最後の主要な細分の属性として選択するサブステップＳ２３と、アルゴリズムによって分割して取得された結果は各次元の情報に欠損があって、データソース自身に階層構造が存在することである場合、前記用語カテゴリの親ノード分割結果によって情報補完を行い、用語関係ネットワークの設立を完了するサブステップＳ２４と、を含む。

更に、前記サブステップＳ２１は具体的に、前記カルテテキストの細分の属性及び前記標準的な単語から前記カルテテキストの細分の属性と前記標準的な単語を含む文セット、前記カルテテキストの細分の属性及び前記標準的な単語の左側に位置する文セット、並びに前記カルテテキストの細分の属性及び前記標準的な単語の右側に位置する文セットを取得するサブステップＳ２１１と、いずれか１対の文セットの平均値を計算して、最終的な平均値の組み合わせによって語義類似度を取得し、語義類似度が最も高い標準的な単語を選択して標準化マッピング関係を確立するサブステップＳ２１２と、を含む。

更に、前記ステップＳ３は具体的に、語義類似度によって標準化マッピングの有効性を判断し、標準化マッピングが有効である場合、直接にマッピング結果とし、標準化マッピングが無効である場合、前記カルテテキストの細分の属性から前記標準的な単語における他の可能な細分の属性カテゴリ及び標準的な語義単語への標準化マッピングを、アルゴリズムが推奨する、手動で監査する必要があるマッピング結果として改めて計算し、異なる用語カテゴリに対してインクリメント推奨を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得する。

更に、前記ステップＳ３は具体的に、語義類似度によって標準化マッピングの有効性を判断し、標準化マッピングが無効である場合、カルテテキストを分割して取得したカルテテキストの細分の属性と標準的な語義単語との距離を計算するサブステップＳ３１と、標準的な語義単語を距離に応じて降順で配列し、上位Ｋ個の標準的な単語を取って細分の属性との距離が最も近い標準的な単語セットを構成するサブステップＳ３２と、細分の属性カテゴリにおける標準的な語義単語の推奨スコアを計算し、すべての細分の属性カテゴリを推奨スコアに応じて降順で配列し、上位ｋ１個の細分の属性カテゴリを取ってアルゴリズムが推奨する細分の属性から標準的な用語システムにおける細分の属性カテゴリへマッピングするアルゴリズム推奨キューを構成するサブステップＳ３３と、すべての標準的な単語を語義類似度に応じて降順で配列し、上位ｋ２個の標準的な単語を取って細分の属性から細分の属性カテゴリにおける標準的な単語へマッピングするアルゴリズム推奨キューを構成するサブステップＳ３４と、すべてのアルゴリズム推奨キューを組み合わせて、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得するサブステップＳ３５と、を含む。

更に、前記ステップＳ４は具体的に、ユーザーが異なる選別条件に応じて、標準的な医学用語クエリユニットによって対応する用語を選別することと、ユーザーが用語編集ユニットによって標準的な用語の追加、削除及び／又は補正、標準的な用語の同義語の追加及び／又は削除、標準的な用語の属性情報の補正を含む用語エンティティの編集を行うことと、用語監査者が用語監査ユニットによって用語監査結果の判定を行うことと、ユーザーが用語マッピングユニットによって異なるソースの医学データに対して標準化マッピングを行い、マッピング不可能なデータに対して推奨キューを構築し、用語管理者による用語のワンクリックマッピング及び推奨キューの形成を確保することと、を含む。

本発明の有益な効果は以下のとおりである。第１として、本発明が構築した標準的な医学用語ライブラリは異なる科学研究及び業務使用シーンを満たすことができ、異なるプラットフォーム及び権威機構の標準的な医学用語と互換的であり、又はそれに遡及することができ、設計された構造体が用語の各種類の組み合わせ拡張をサポートすることができ、第２として、本発明は複数の標準的な用語の間且つ単一標準的な用語内部の関連情報を保持して利用し、アルゴリズム及び論理ルールによって標準的な用語概念の自動追加及び集まりの推奨を行い、第３として、本発明は標準的な用語ライブラリに対する一部の人件費による効率的で半自動化の管理及びメンテナンスをサポートすることができる。各権威機構が発表した標準的な医学用語及び多施設臨床データと良好なフィードバックメカニズムを形成する。

図１は本発明に係る汎用モデルに基づく標準的な医学用語管理システムの模式図である。図２は本発明の実施例に係る用語関係ネットワークの構造図である。

以下の少なくとも１つの例示的な実施例についての説明は実際に説明的なものであって、本発明及びその応用又は使用を制限するものではない。本発明の実施例に基づいて、当業者が創造的な労力を要することなく取得したすべての他の実施例は、いずれも本発明の保護範囲に属する。

図１を参照し、汎用モデルに基づく標準的な医学用語管理システムであって、オープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、用語カテゴリ及び用語カテゴリに対応する細分の属性名称を取得し、且つ構築されたシーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性名称に対応する細分の属性内容を取得することに用いられ、各種類の前記用語カテゴリがいずれも１種類の主要な細分の属性名称及び複数種類の副次的な細分の属性名称を含む用語情報処理モジュールと、前記細分の属性内容から語義類似度が最も高い標準的な語義単語を検索して標準化マッピング関係を確立して、前記標準化マッピング関係を補正及び追加し、用語関係ネットワークの設立を完了するための用語関係ネットワーク構築モジュールと、異なる前記用語カテゴリに対してインクリメント推奨を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得するための用語ライブラリ自己増幅モジュールと、前記用語ライブラリに対して可視化管理を行うための可視化管理モジュールと、を備え、前記可視化管理モジュールは、ユーザーのプレビューデータを提供し、標準的な用語の可視化クエリを行い、異なる次元の選別条件に応じて対応する用語を選別するとともに、ユーザーログインインターフェース入口及び用語管理インターフェース入口を提供し、標準的な用語のトップレベルカテゴリ、同義語、親ノード用語、サブノード用語及び／又は属性情報を含む次元の標準的な用語情報を表示し、それと同時に関連用語詳細インターフェースに入る入口を提供するための標準的な医学用語クエリユニットと、ユーザーが可視化インターフェースを介して標準的な用語の追加、削除及び／又は補正、標準的な用語の同義語の追加及び／又は削除、標準的な用語の属性情報の補正を含む用語エンティティの編集を行うための用語編集ユニットと、用語監査者が第二者監査を行い、監査者が用語監査結果の判定を行うための用語監査ユニットと、ユーザーが異なるソースの医学データに対して標準化マッピングを行い、マッピング不可能なデータに対して推奨キューを構築し、用語管理者による用語のワンクリックマッピング及び推奨キューの形成を確保するための用語マッピングユニットと、を備える。

実施例汎用モデルに基づく標準的な医学用語管理方法であって、下記ステップを含む。

ステップＳ１では、用語情報処理モジュールによってオープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、用語カテゴリ及び用語カテゴリに対応する細分の属性名称を取得し、且つ構築されたシーケンスラベリングモデルによって分割して前記細分の属性名称に対応する細分の属性内容を取得し、前記細分の属性内容が標準的な単語であり、各種類の前記用語カテゴリがいずれも１種類の主要な細分の属性名称及び複数種類の副次的な細分の属性名称を含み、ステップＳ１１では、用語情報処理モジュールによってオープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、元の用語の階層関係、関連関係及び／又は符号化情報を保持してソースタグを付けて、用語カテゴリ及び用語カテゴリに対応する細分の属性名称を取得し、オープンソース標準用語データの間に対応関係がある場合、該情報を一括で保持し、機構又は個人が異なるシーンニーズに直面する場合に依然としてデータを効果的に利用及び変換することができ、情報交換をスムーズに行うように確保する。

ステップＳ１２では、事前訓練言語モデルによってシーケンスラベリングモデルを構築して、前記シーケンスラベリングモデルによってオープンソース標準用語データを分割して細分の属性内容を取得する。

ステップＳ１２１では、事前訓練言語モデルによってオープンソース標準用語データにおける各文字／単語のベクトル表現を計算し、オープンソース標準用語データＸについては、それに含まれるすべての文字及びすべての単語を一体に接合する場合、

と示されてもよく、ここで、

がＸに含まれる合計ｍ個の文字であり、

がＸに含まれる合計ｎ個の単語である。文字／単語ｘ_ｉの医学用語Ｘにおける開始位置がｈｅａｄ［ｘ_ｉ］と記され、終了位置がｔａｉｌ［ｘ_ｉ］と記される。まず事前に訓練されたＢｅｒｔモデルによって各文字／単語のベクトル表現をｅｍｂ（ｘ_ｉ）として計算し、ステップＳ１２２では、前記ベクトル表現に対して自己注意メカニズムによって各文字／単語の出力状態を計算し、各文字／単語ｘ_ｉのｘ_ｊに対する注意重みｗ_ｉ，ｊを計算し、

ここで、

がｘ_ｉとｘ_ｊの相対位置ベクトルを示し、Ｍ_１とＭ_２がいずれも事前に訓練されたＢｅｒｔモデルによって訓練して取得した重み行列パラメータである。自己注意メカニズムによって各文字／単語ｘ_ｉの位置での出力状態ｏｕｔｐｕｔ（ｘ_ｉ）を計算し、

ステップＳ１２３では、前記出力状態に対して完全接続ニューラルネットワークにより計算を行って各文字／単語が各種類の細分の属性カテゴリに属する確率を取得し、シーケンスラベリングモデルの構築を完了し、最後に出力状態に対して１層の完全接続ニューラルネットワークによって文字／単語ｘ_ｉが各種類の細分の属性に属する確率分布ｐｒｏｂ（ｘ_ｉ）を計算し、

ここで、Ｗが行列パラメータであり、ｂがベクトルパラメータであり、それらがシーケンスラベリングモデル全体によって訓練して取得したもの
であり、Ｗの行数とｂの次元がいずれも医療用語の細分の属性のカテゴリ数に等しく、ｓｏｆｔｍａｘがベクトルのＳｏｆｔｍａｘ関数を示す。ｐｒｏｂ（ｘ_ｉ）はオープンソース標準用語データに対するシーケンスラベリングモデルの最終出力であって、確率からなるベクトルであり、次元がオープンソース標準用語データの細分の属性カテゴリの数に等しい。ｐｒｏｂ（ｘ_ｉ）のｋ番目の要素は文字／単語ｘ_ｉが第ｋ種類の細分の属性カテゴリに属する確率を示し、最も大きな要素はアルゴリズムが許可するｘ_ｉが属する細分の属性カテゴリ及び対応する確率を示す。

ステップＳ１２４では、前記オープンソース標準用語データを前記シーケンスラベリングモデルによって分割して細分の属性内容を取得し、前記細分の属性内容が標準的な単語であり、前記細分の属性内容が主要な細分の属性内容及び副次的な細分の属性内容を含む。

すべてのカテゴリの用語に対して方向性のある内部細分の属性情報構造の設計を行い、各種類の用語カテゴリにはいずれも１種類の主要な細分の属性名称及び複数種類の副次的な細分の属性名称が含まれるとともに、異なるカテゴリ用語間の関係の定義を完了する。

ステップＳ２では、前記シーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性を取得し、用語関係ネットワーク構築モジュールによって前記標準的な単語から語義類似度が最も高い標準的な語義単語を検索して標準化マッピング関係を確立して、前記標準化マッピング関係を補正及び追加し、用語関係ネットワークの設立を完了し、図２を参照し、図２における「Ａｃｕｔｅｐａｎｍｙｅｌｏｓｉｓｗｉｔｈｍｙｅｌｏｆｉｂｒｏｓｉｓ」とは「骨髄線維症を伴う急性汎骨髄症」のｓｎｏｍｅｄｃｔの用語集における対応する英語概念を指す。

カルテテキストから分割して取得されたカルテテキストの細分の属性ａについては、前記標準的な単語からカルテテキストの細分の属性ａとの語義類似度が最も高い標準的な語義単語

を検索し、カルテテキストの細分の属性ａと標準的な語義単語

との間に標準化マッピング関係を確立する。例えば、漢方製剤の名称情報におけるケイカを物質であるドケイガイ、スイダンカにマッピングすることができる。操作の名称用語における粒子放射を物理エネルギーである電離放射線及び物質である放射性同位体にマッピングすることができる。それと同時に、属性チェーン「活性成分」、「物理エネルギー」、「目標物質」によって情報の関連付けを行う。

ステップＳ２１では、前記シーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性を取得し、用語関係ネットワーク構築モジュールによって前記標準的な単語から任意の標準的な語義単語を検索し、アルゴリズムによってカルテテキストの細分の属性と前記任意の標準的な語義単語との語義類似度を取得し、語義類似度が最も高い標準的な単語を選択して標準化マッピング関係を確立し、ステップＳ２１１では、前記カルテテキストの細分の属性及び前記標準的な単語から前記カルテテキストの細分の属性と前記標準的な単語を含む文セット、前記カルテテキストの細分の属性及び前記標準的な単語の左側に位置する文セット、並びに前記カルテテキストの細分の属性及び前記標準的な単語の右側に位置する文セットを取得し、

で前記標準的な単語におけるカルテテキストの細分の属性ａと同じ細分の属性カテゴリを有する任意の標準的な単語を示す場合、カルテテキストの細分の属性ａと任意の標準的な単語

との語義類似度は２つの部分に分けられ、第１部分はそれらのベクトル表現の類似度即ち

であり、ここで、ｃｏｓが計算ベクトルのコサイン類似度を示す。第２部分はカルテテキストの細分の属性ａと任意の標準的な単語

の文脈との類似度であり、ここの文脈とは病院のカルテテキストにおけるカルテテキストの細分の属性ａと任意の標準的な単語

を含む文、並びにカルテテキストの細分の属性ａ及び任意の標準的な単語

の左側又は右側に位置する文を指す。

、

及び

でそれぞれ病院から取得された大量のカルテテキストにおけるカルテテキストの細分の属性ａを含む文セット、カルテテキストの細分の属性ａの左側に位置する文セット及びカルテテキストの細分の属性ａの右側に位置する文セットを示し、同様に

、

及び

でそれぞれ任意の標準的な単語

を含む文セット、任意の標準的な単語

の左側に位置する文セット及び任意の標準的な単語

の右側に位置する文セットを示す。

ステップＳ２１２では、いずれか１対の文セットの平均値を計算して、最終的な平均値の組み合わせによって語義類似度を取得し、語義類似度が最も高い標準的な単語を選択して標準化マッピング関係を確立する。

文セット

と

との語義類似度はこの２つのセットにおけるいずれか１対の文のベクトル表現類似度の平均値として定義され、計算方法は、以下の通りであり、

ここで、

と

がそれぞれセット

及び

における文の個数を示す。ｅｍｂ（ｕ）とｅｍｂ（ｖ）がそれぞれ文ｕ及びｖのベクトル表現を示し、事前に訓練された言語モデルにより計算して取得したものである。ｃｏｓが計算ベクトルのコサイン類似度を示す。同じ方法で計算してカルテテキストの細分の属性ａと任意の標準的な単語

の左側の文セットとの語義類似度

及び右側の文セットとの語義類似度

を取得する。最終的に上記２つの部分の結果を組み合わせてカルテテキストの細分の属性ａと任意の標準的な単語

との語義類似度

を取得し、

ここで、

が手動で設定した重みパラメータであり、本実施例においてｗ_１＝ｗ_２＝０．４、ｗ_３＝ｗ_４＝０．１を取る。オープンソース標準用語データから該細分の属性カテゴリにおける任意の標準的な単語

をトラバースし、語義類似度が最も高い標準的な単語

即ちカルテテキストの細分の属性ａの標準化マッピング結果を選択し、標準化マッピング関係の構築を完了する。

ステップＳ２２では、アルゴリズムによって分割して副次的な細分の属性を取得し、現在のカルテテキストには説明タイプを定義できる親ノードが存在し、且つ分割して取得された主要な細分の属性にはタイプ情報が含まれない場合、主要な細分の属性を情報追加して情報に対応する細粒度サブノードに補正し、標準化マッピング関係の補正を完了し、例えば、データ「喀黄膿痰」については、アルゴリズムによって分割して取得した結果は、評価対象が痰であり、一般説明＃１が黄であり、一般説明＃２が膿であるということであり、細分の属性「黄」及び「膿」がそれぞれ細分の属性「色」及び「炎症形態」のノードにあるため、評価対象「痰」を「喀痰の性状」及び「喀痰の色」に補正し、又は上記用語の同一親ノード「喀痰の外観」を評価対象として用いる必要がある。

ステップＳ２３では、単一の用語カテゴリが複数のタイプの副次的な細分の属性を含むことに起因して補正後の主要な細分の属性が複数ある場合、最も多く存在する主要な細分の属性のカルテテキストにおける親ノードを最後の主要な細分の属性として選択し、ステップＳ２４では、アルゴリズムによって分割して取得された結果は各次元の情報に欠損があって、データソース自身に階層構造が存在することである場合、前記用語カテゴリの親ノード分割結果によって情報補完を行い、用語関係ネットワークの設立を完了する。

例えば、原データ「生体外血管を介する治療」については、用語を分割してから主語を取得できない場合、その親ノード「薬物の静脈バイパス移植［誘導］圧迫療法」を分割して取得した情報で補完し、操作方法が「移植」である。データソースが階層構造を有しない場合、主語を該カテゴリにおける最も高いノード即ち「操作方法」で代替する。オープンソース標準用語データには一般的に親子階層構造の情報があるため、属性関係ネットワークを改善する必要があるだけである。取得された細分の属性が非常に完全な医学用語については、該用語と細分の属性単語とを定義された関係タイプによって関連付けする必要があるだけであり、細分の属性の完全性がない場合、上記論理に基づいて補完してから関連付けすれば、用語関係ネットワークを形成することができる。

ステップＳ３では、用語ライブラリ自己増幅モジュールによって異なる用語カテゴリに対してインクリメント推奨を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得し、前記ステップＳ３は具体的に、語義類似度によって標準化マッピングの有効性を判断し、標準化マッピングが有効である場合、直接にマッピング結果とし、標準化マッピングが無効である場合、前記カルテテキストの細分の属性から前記標準的な単語における他の可能な細分の属性カテゴリ及び標準的な語義単語への標準化マッピングを、アルゴリズムが推奨する、手動で監査する必要があるマッピング結果として改めて計算し、異なる用語カテゴリに対してインクリメント推奨を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得する。

処理する必要があるカルテテキストはタイルフォーマットであり、即ち自身に階層関係が含まれない場合、取得された細分の属性情報によって階層構造の判断を行い、先に親子関係を関連付けし、更に属性関係を関連付けする。

アルゴリズムはＨＩＳ、ＥＭＲシステムにおけるデータ記憶ルールに従って、異なる分類における用語に対応する選別ソースを特定する。例えば、症状、疾病類用語を電子カルテにおける診断、主訴、既往歴、補助検査ソースから取得し、操作類用語を試験検査、画像学的検査、手術などのソースから取得することができ、薬物の名称を医者の指示、外来処方箋などのソースから取得することができる。病院から大量のカルテテキストデータを取得し、マッピングを完了できない情報の場合には、同様に分割して取得された細分の属性単語の名称、用語カテゴリなどに基づいて、アルゴリズムが推奨する記憶及び補正対象のキューを形成する。カルテテキストから分割
して取得されたカルテテキストの細分の属性ａについては、上記方法でそれを標準的な用語システムにおける標準的な単語

にマッピングし、それらの語義類似度が条件

を満たす場合、今回の標準化マッピングが有効であると見なし、直接に今回のマッピング結果を標準的な用語システムに記憶することができ、ここで、ｃが手動で設定した閾値であり、本実施例においてｃ＝０．９を取る。上記条件を満たさない場合、カルテテキストの細分の属性ａから標準的な単語

への標準化マッピングが無効であると見なし、カルテテキストの細分の属性ａからオープンソース標準用語データにおける他の可能な細分の属性カテゴリ及び標準的な単語への標準化マッピングを、アルゴリズムが推奨する、手動で監査する必要があるマッピング結果として改めて計算する必要があり、ステップＳ３１では、語義類似度によって標準化マッピングの有効性を判断し、標準化マッピングが無効である場合、カルテテキストを分割して取得したカルテテキストの細分の属性と標準的な語義単語との距離を計算し、オープンソース標準用語データにおけるすべての標準的な単語のセットをＡとし、カルテテキストの細分の属性カテゴリＣにおけるすべての標準的な単語セットをＡ_Ｃとし、カルテテキストから分割して取得したカルテテキストの細分の属性ａ及び標準的な用語システムにおける標準的な単語

については、それらのベクトル表現に基づいてそれらの距離を

として計算し、ここで、

が計算ベクトルのモジュロを示す。

ステップＳ３２では、標準的な語義単語を距離に応じて降順で配列し、上位Ｋ個の標準的な単語を取って細分の属性との距離が最も近い標準的な単語セットを構成し、すべての標準的な単語

を

に応じて降順で配列し、上位Ｋ個の標準的な単語を取って細分の属性ａとの距離が最も近い標準的な単語セットＡ（ａ，Ｋ）を構成し、本実施例においてＫ＝１０００を取る。

ステップＳ３３では、細分の属性カテゴリにおける標準的な語義単語の推奨スコアを計算し、すべての細分の属性カテゴリを推奨スコアに応じて降順で配列し、上位ｋ１個の細分の属性カテゴリを取ってアルゴリズムが推奨する細分の属性から標準的な用語システムにおける細分の属性カテゴリへマッピングするアルゴリズム推奨キューを構成し、標準的な用語システムにおける各細分の属性カテゴリＣの細分の属性ａに対する推奨スコアｓｃｏｒｅ（ａ，Ｃ）は細分の属性カテゴリＣにおける標準的な単語がセットＡ（ａ，Ｋ）に含まれる数として定義され、計算公式は、

である。すべての細分の属性カテゴリＣをｓｃｏｒｅ（ａ，Ｃ）に応じて降順で配列し、上位ｋ_１個の細分の属性カテゴリを取ってアルゴリズムが推奨する、細分の属性ａから標準的な用語システムにおける細分の属性カテゴリへマッピングするアルゴリズム推奨キュー

を構成し、本実施例においてｋ_１＝５を取る。

ステップＳ３４では、すべての標準的な単語を語義類似度に応じて降順で配列し、上位ｋ２個の標準的な単語を取って細分の属性から細分の属性カテゴリにおける標準的な単語へマッピングするアルゴリズム推奨キューを構成し、細分の属性カテゴリ

については、上記方法で標準的な用語システムにおける細分の属性カテゴリＣ_ｉにおける任意の標準的な単語

と細分の属性ａとの語義類似度

を計算し、すべての標準的な単語

を

に応じて降順で配列し、上位ｋ_２個の標準的な単語を取って細分の属性ａから細分の属性カテゴリＣ_ｉにおける標準的な単語へマッピングするアルゴリズム推奨キュー

を構成し、本実施例においてｋ_２＝３を取る。

ステップＳ３５では、すべてのアルゴリズム推奨キューを組み合わせて、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得する。

すべてのｃａｎｄ（ａ，Ｃ_ｉ）を組み合わせて出力とすれば、細分の属性ａから標準的な用語システムへ標準化マッピングを行うアルゴリズムが推奨する、手動で監査及び記憶すべき推奨キュー

を形成する。

例えば、アルゴリズムによって臨床データ「超音波監視による子宮鏡手術をする」を分割して操作方法「超音波監視」を取得し、「子宮鏡」をそれぞれ「超音波誘導」、「顕微鏡検査」に標準化することができ、器具「子宮鏡」を直接マッピングして標準概念「子宮鏡」を取得することができる。該臨床用語が標準的な用語ライブラリ「超音波誘導による子宮鏡検査」の関係ネットワークマップに一致する場合、直接マッピングすることができ、用語の追加を行う必要がない。例えば、アルゴリズムによって臨床データ「両下肢赤腫」を分割して発病部位「両下肢」、相関形態学「赤腫」を取得するが、「赤腫」は標準的な用語ライブラリにおいて直接マッピングできる標準概念がまだない。アルゴリズムは語義に基づいて推奨キューを形成する。

表１分割・組み合わせについての推奨

表２標準概念へのマッピングについての推奨

用語管理者はアルゴリズム推奨結果に基づいて分割・組み合わせ及び標準マッピングの選択を行い、用語「両下肢赤腫」を「発病部位」＋「相関形態学」に分割し、用語「赤腫」と標準概念を正しく関連付けする。

同一用語カテゴリにおける用語については、細分の属性が重なる用語は既定の集まりの論理、標準概念の命名ルールに従って概念の追加及び対応する情報関連付けを行うことができ、一部の論理ルールの例は下記表３に示される。

表３論理ルールの例

ステップＳ４では、可視化管理モジュールによって前記用語ライブラリに対して可視化管理を行い、前記可視化管理が標準的な医学用語クエリユニット、用語編集ユニット、用語監査ユニット及び用語マッピングユニットを備える。

前記ステップＳ４は具体的に、ユーザーが異なる選別条件に応じて、標準的な医学用語クエリユニットによって対応する用語を選別することと、ユーザーが用語編集ユニットによって標準的な用語の追加、削除及び／又は補正、標準的な用語の同義語の追加及び／又は削除、標準的な用語の属性情報の補正を含む用語エンティティの編集を行うことと、用語監査者が用語監査ユニットによって用語監査結果の判定を行うことと、ユーザーが用語マッピングユニットによって異なるソースの医学データに対して標準化マッピングを行い、マッピング不可能なデータに対して推奨キューを構築し、用語管理者による用語のワンクリックマッピング及び推奨キューの形成を確保することと、を含む。

該モジュールは医学用語標準化管理プラットフォームソフトウェアを構築する。モジュールは標準的な医学用語クエリ、用語編集、用語監査、用語マッピングの４つの部分に分けられる。

用語クエリ部分は、ユーザーのプレビューデータを提供し、標準的な用語の可視化クエリを行い、ユーザーが異なる次元の選別条件に応じて対応する用語を選別することができ、それと同時にユーザーログインインターフェース入口及び用語管理インターフェース入口を提供する。該標準的な用語のトップレベルカテゴリ、同義語、親ノード用語、サブノード用語、属性情報を含むが、それらに限らない標準的な用語の多次元情報を表示するとともに、関連用語詳細インターフェースに入る入口を提供する。

用語編集部分は、ユーザーが可視化インターフェースを介して標準的な用語の追加、削除、補正、並びに標準的な用語の同義語の追加及び削除、標準的な用語の属性情報の補正を含む用語エンティティの編集を行う。

用語監査部分は、用語の更新品質を確保するように用語監査者が第二者監査を行うことに供する。それと同時に、該ページから現在の監査対象の用語をプレビューすることができる。監査詳細ページに用語の具体的な更新内容を表示し、該ページには同時に監査者が用語監査結果の判定を行う。

用語マッピング部分は、ユーザーが異なるソースの医学データに対して標準化マッピングを行い、４．３における一部の過程を可視化し、マッピング不可能なデータに対して推奨キューを構築し、用語管理者による該プラットフォームにおける用語のワンクリックマッピング及び推奨キューの形成を確保し、管理者が用語ライブラリにおける参照データを反復するものとし、用語ライブラリを更新・拡張する効率及び性能を向上させる。

以上の説明は本発明の好適な実施例であって、本発明を制限するためのものではなく、当業者であれば、本発明に対して種々の変更及び変化を行うことができる。本発明の主旨及び原則内に行われるいかなる補正、等価置換、改良などは、いずれも本発明の保護範囲内に含まれるべきである。

Claims

汎用モデルに基づく標準的な医学用語管理システムであって、用語情報処理モジュール、用語関係ネットワーク構築モジュール、用語ライブラリ自己増幅モジュール及び可視化管理モジュールを含み、
前記用語情報処理モジュールは、オープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、臨床所見、身体部位及び形態学的異常を含む用語カテゴリ及び用語カテゴリに対応する、偏側、頻度、主体症状を含む細分の属性の名称を取得し、且つ構築されたシーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性の名称に対応する細分の属性内容を取得することに用いられ、各種類の前記用語カテゴリがいずれも１種類の主要な細分の属性の名称及び複数種類の副次的な細分の属性の名称を含み、前記細分の属性内容は細分の属性に対応する具体的な表現語であり、
前記用語関係ネットワーク構築モジュールは、前記細分の属性の内容から語義類似度が最も高い標準的な語義単語を検索して標準化マッピング関係を確立して、前記標準化マッピング関係を補正及び追加し、用語関係ネットワークの設立を完了することに用いられ、
前記用語関係ネットワーク構築モジュールによる具体的な過程は、
前記シーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性を取得し、用語関係ネットワーク構築モジュールによって前記標準的な単語から任意の標準的な語義単語を検索し、アルゴリズムによってカルテテキストの細分の属性と前記任意の標準的な語義単語との語義類似度を取得し、前記カルテテキストの細分の属性の語義類似度が最も高い標準的な単語を選択して、前記カルテテキストの細分の属性と選択された前記語義類似度が最も高い標準的な単語との間に標準化マッピング関係を確立するステップと、
アルゴリズムによって前記カルテテキストを分割して副次的な細分の属性を取得し、用語ライブラリには説明タイプを定義できる親ノードが存在し、且つ分割して取得された主要な細分の属性にはタイプ情報が含まれない場合、副次的な細分の属性の用語ライブラリにおける親ノードから情報を選択して主要な細分の属性を情報追加して、情報に対応する細粒度サブノードに補正し、標準化マッピング関係の補正を完了し、前記説明タイプは細分の属性の単語を分類して定義することに用いられ、前記細粒度サブノードは情報のより細粒度のサブノードであるステップと、
単一の用語カテゴリが複数のタイプの副次的な細分の属性を含むことに起因して補正後の主要な細分の属性が複数ある場合、用語ライブラリにおける最も多く存在する主要な細分の属性の親ノードを最後の主要な細分の属性として選択するステップと、
アルゴリズムによって分割して取得された結果は各次元の情報に欠損があって、データソース自身に階層構造が存在することである場合、用語ライブラリにおける前記用語カテゴリの親ノード分割結果によって情報補完を行い、用語関係ネットワークの設立を完了するステップと、を含み、
前記用語ライブラリ自己増幅モジュールは、異なる前記用語カテゴリに対して処理を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得することに用いられ、
前記用語ライブラリ自己増幅モジュールは具体的に、語義類似度によって標準化マッピングの有効性を判断し、標準化マッピングが有効である場合、直接にマッピング結果とし、標準化マッピングが無効である場合、前記カルテテキストの細分の属性から前記標準的な単語における他の可能な細分の属性の名称及び標準的な語義単語への標準化マッピングを、アルゴリズムが推奨する、手動で監査する必要があるマッピング結果として改めて計算し、異なる用語カテゴリに対して処理を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得し、
前記可視化管理モジュールは、前記用語ライブラリに対して可視化管理を行うことに用いられる
ことを特徴とする汎用モデルに基づく標準的な医学用語管理システム。
前記可視化管理モジュールは、標準的な医学用語クエリユニット、用語編集ユニット、用語監査ユニット及び用語マッピングユニットを含み、
前記標準的な医学用語クエリユニットは、ユーザーのプレビューデータを提供し、標準的な用語の可視化クエリを行い、異なる次元の選別条件に応じて対応する用語を選別するとともに、ユーザーログインインターフェース入口及び用語管理インターフェース入口を提供し、標準的な用語のトップレベルカテゴリ、同義語、親ノード用語、サブノード用語及び／又は属性情報を含む次元の標準的な用語情報を表示し、それと同時に関連用語詳細インターフェースに入る入口を提供することに用いられ、
前記用語編集ユニットは、ユーザーが可視化インターフェースを介して標準的な用語の追加、削除及び／又は補正、標準的な用語の同義語の追加及び／又は削除、標準的な用語の属性情報の補正を含む用語エンティティの編集を行うことに用いられ、
前記用語監査ユニットは、用語監査者が第二者監査を行い、監査者が用語監査結果の判定を行うことに用いられ、
前記用語マッピングユニットは、ユーザーが異なるソースの医学データに対して標準化マッピングを行い、マッピング不可能なデータに対して推奨キューを構築し、用語管理者による用語のワンクリックマッピング及び推奨キューの形成を確保することに用いられる
ことを特徴とする請求項１に記載の汎用モデルに基づく標準的な医学用語管理システム。
汎用モデルに基づく標準的な医学用語管理方法であって、ステップＳ１～ステップＳ４を含み、
前記ステップＳ１では、用語情報処理モジュールによってオープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、臨床所見、身体部位及び形態学的異常を含む用語カテゴリ及び用語カテゴリに対応する、偏側、頻度、主体症状を含む細分の属性の名称を取得し、且つ構築されたシーケンスラベリングモデルによって分割して前記細分の属性の名称に対応する細分の属性の内容を取得し、前記細分の属性の内容が標準的な単語であり、各種類の前記用語カテゴリがいずれも１種類の主要な細分の属性の名称及び複数種類の副次的な細分の属性の名称を含み、前記細分の属性の内容は細分の属性に対応する具体的な表現語であり、
前記ステップＳ２では、前記シーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性を取得し、用語関係ネットワーク構築モジュールによって前記標準的な単語から語義類似度が最も高い標準的な語義単語を検索して標準化マッピング関係を確立して、前記標準化マッピング関係を補正及び追加し、用語関係ネットワークの設立を完了し、
前記ステップＳ２はサブステップＳ２１～サブステップＳ２４を含み、
前記サブステップＳ２１では、前記シーケンスラベリングモデルによってカルテテキストを分割してカルテテキストの細分の属性を取得し、用語関係ネットワーク構築モジュールによって前記標準的な単語から任意の標準的な語義単語を検索し、アルゴリズムによってカルテテキストの細分の属性と前記任意の標準的な語義単語との語義類似度を取得し、前記カルテテキストの細分の属性の語義類似度が最も高い標準的な単語を選択して、前記カルテテキストの細分の属性と選択された前記語義類似度が最も高い標準的な単語との間に標準化マッピング関係を確立し、
前記サブステップＳ２２では、アルゴリズムによって前記カルテテキストを分割して副次的な細分の属性を取得し、現在のカルテテキストには説明タイプを定義できる親ノードが存在し、且つ分割して取得された主要な細分の属性にはタイプ情報が含まれない場合、副次的な細分の属性の用語ライブラリにおける親ノードから情報を選択して主要な細分の属性を情報追加して、情報に対応する細粒度サブノードに補正し、標準化マッピング関係の補正を完了し、前記説明タイプは細分の属性の単語を分類して定義することに用いられ、前記細粒度サブノードは情報のより細粒度のサブノードであり、
前記サブステップＳ２３では、単一の用語カテゴリが複数のタイプの副次的な細分の属性を含むことに起因して補正後の主要な細分の属性が複数ある場合、用語ライブラリにおける最も多く存在する主要な細分の属性の親ノードを最後の主要な細分の属性として選択し、
前記サブステップＳ２４では、アルゴリズムによって分割して取得された結果は各次元の情報に欠損があって、データソース自身に階層構造が存在することである場合、用語ライブラリにおける前記用語カテゴリの親ノード分割結果によって情報補完を行い、用語関係ネットワークの設立を完了し、
前記ステップＳ３では、用語ライブラリ自己増幅モジュールによって異なる用語カテゴリに対して処理を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得し、
前記ステップＳ３は具体的に、語義類似度によって標準化マッピングの有効性を判断し、標準化マッピングが有効である場合、直接にマッピング結果とし、標準化マッピングが無効である場合、前記カルテテキストの細分の属性から前記標準的な単語における他の可能な細分の属性の名称及び標準的な語義単語への標準化マッピングを、アルゴリズムが推奨する、手動で監査する必要があるマッピング結果として改めて計算し、異なる用語カテゴリに対して処理を行い、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得し、
前記ステップＳ４では、可視化管理モジュールによって前記用語ライブラリに対して可視化管理を行い、前記可視化管理が標準的な医学用語クエリユニット、用語編集ユニット、用語監査ユニット及び用語マッピングユニットを備える
ことを特徴とする汎用モデルに基づく標準的な医学用語管理方法。
前記ステップＳ１は具体的に、サブステップＳ１１～サブステップＳ１２を含み、
前記サブステップＳ１１では、用語情報処理モジュールによってオープンソース標準用語データを整理統合し、前記オープンソース標準用語データの定義及び用語の意味に対して用語の分類を行って、元の用語の階層関係、関連関係及び／又は符号化情報を保持してソースタグを付けて、用語カテゴリ及び用語カテゴリに対応する細分の属性の名称を取得し、
前記サブステップＳ１２では、事前訓練言語モデルによってシーケンスラベリングモデルを構築して、前記シーケンスラベリングモデルによってオープンソース標準用語データを分割して細分の属性の内容を取得する
ことを特徴とする請求項３に記載の汎用モデルに基づく標準的な医学用語管理方法。
前記サブステップＳ１２は具体的に、サブステップＳ１２１～サブステップＳ１２４を含み、
前記サブステップＳ１２１では、事前訓練言語モデルによってオープンソース標準用語データにおける各文字／単語のベクトル表現を計算し、
前記サブステップＳ１２２では、前記ベクトル表現に対して自己注意メカニズムによって各文字／単語の出力状態を計算し、
前記サブステップＳ１２３では、前記出力状態に対して完全接続ニューラルネットワークにより計算を行って各文字／単語が各種類の細分の属性の名称に属する確率を取得し、シーケンスラベリングモデルの構築を完了し、
前記サブステップＳ１２４では、前記オープンソース標準用語データを前記シーケンスラベリングモデルによって分割して細分の属性の内容を取得し、前記細分の属性の内容が標準的な単語であり、前記細分の属性の内容が主要な細分の属性の内容及び副次的な細分の属性の内容を含む
ことを特徴とする請求項４に記載の汎用モデルに基づく標準的な医学用語管理方法。
前記サブステップＳ２１は具体的に、サブステップＳ２１１～サブステップＳ２１２を含み、
前記サブステップＳ２１１では、前記カルテテキストの細分の属性及び前記標準的な単語から前記カルテテキストの細分の属性と前記標準的な単語を含む文セット、前記カルテテキストの細分の属性及び前記標準的な単語の左側に位置する文セット、並びに前記カルテテキストの細分の属性及び前記標準的な単語の右側に位置する文セットを取得し、
前記サブステップＳ２１２では、いずれか１対の文セットにおけるいずれか１対の文のベクトル表現の類似度の平均値を計算して、最終的な平均値の組み合わせによって語義類似度を取得し、語義類似度が最も高い標準的な単語を選択して標準化マッピング関係を確立する
ことを特徴とする請求項３に記載の汎用モデルに基づく標準的な医学用語管理方法。
前記ステップＳ３は具体的に、サブステップＳ３１～サブステップＳ３５を含み、
前記サブステップＳ３１では、語義類似度によって標準化マッピングの有効性を判断し、標準化マッピングが無効である場合、カルテテキストを分割して取得したカルテテキストの細分の属性と標準的な語義単語との距離を計算し、
前記サブステップＳ３２では、標準的な語義単語を距離に応じて降順で配列し、上位Ｋ個の標準的な単語を取って細分の属性との距離が最も近い標準的な単語セットを構成し、
前記サブステップＳ３３では、細分の属性の名称における標準的な語義単語の推奨スコアを計算し、すべての細分の属性の名称を推奨スコアに応じて降順で配列し、上位ｋ１個の細分の属性の名称を取ってアルゴリズムが推奨する細分の属性から標準的な用語システムにおける細分の属性の名称へマッピングするアルゴリズム推奨キューを構成し、
前記サブステップＳ３４では、すべての標準的な単語を語義類似度に応じて降順で配列し、上位ｋ２個の標準的な単語を取って細分の属性から細分の属性の名称における標準的な単語へマッピングするアルゴリズム推奨キューを構成し、
前記サブステップＳ３５では、すべてのアルゴリズム推奨キューを組み合わせて、用語関係ネットワークの拡張を完了し、完全な用語ライブラリを取得する
ことを特徴とする請求項３に記載の汎用モデルに基づく標準的な医学用語管理方法。
前記ステップＳ４は具体的に、ユーザーが異なる選別条件に応じて、標準的な医学用語クエリユニットによって対応する用語を選別することと、ユーザーが用語編集ユニットによって標準的な用語の追加、削除及び／又は補正、標準的な用語の同義語の追加及び／又は削除、標準的な用語の属性情報の補正を含む用語エンティティの編集を行うことと、用語監査者が用語監査ユニットによって用語監査結果の判定を行うことと、ユーザーが用語マッピングユニットによって異なるソースの医学データに対して標準化マッピングを行い、マッピング不可能なデータに対して推奨キューを構築し、用語管理者による用語のワンクリックマッピング及び推奨キューの形成を確保することと、を含む
ことを特徴とする請求項３に記載の汎用モデルに基づく標準的な医学用語管理方法。