JP2016507828A - 機械翻訳システム及び方法 - Google Patents

機械翻訳システム及び方法 Download PDF

Info

Publication number
JP2016507828A
JP2016507828A JP2015551995A JP2015551995A JP2016507828A JP 2016507828 A JP2016507828 A JP 2016507828A JP 2015551995 A JP2015551995 A JP 2015551995A JP 2015551995 A JP2015551995 A JP 2015551995A JP 2016507828 A JP2016507828 A JP 2016507828A
Authority
JP
Japan
Prior art keywords
translation
text
language
configuration
machine translation
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
JP2015551995A
Other languages
English (en)
Inventor
ハビエル グスマン エレラ、フランシスコ
ハビエル グスマン エレラ、フランシスコ
フォーゲル、ステファン
Original Assignee
カタール・ファンデーション
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by カタール・ファンデーション filed Critical カタール・ファンデーション
Publication of JP2016507828A publication Critical patent/JP2016507828A/ja
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/58Use of machine translation, e.g. for multi-lingual retrieval, for server-side translation for client devices or for real-time translation
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/40Processing or translation of natural language
    • G06F40/42Data-driven translation
    • G06F40/44Statistical methods, e.g. probability models

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Machine Translation (AREA)

Abstract

機械翻訳システム(1)は、未知のテキスト(4)を受け取り、未知のテキスト(4)を小分けにして解析する言語解析モジュール(3)を備える。言語解析モジュール(3)は、未知のテキスト(4)における言語特徴を識別し、言語指紋を翻訳構成選択モジュール(5)に提供する。翻訳構成選択モジュール(5)は、識別された言語指紋に一致するメモリ(6)から翻訳構成(T1〜T9)を選択し、選択された言語構成(T1〜T9)を機械翻訳モジュール(7)に伝達する。機械翻訳モジュール(7)は、選択された翻訳構成(T1〜T9)を用いて、未知のテキスト(4)を異なる言語に翻訳する。【選択図】 図1

Description

本発明は機械翻訳システム及び方法に関し、特に、異なる文体で書かれたテキストを第1言語から第2言語に翻訳することが可能である機械翻訳システム及び方法に関する。
従来の統計的機械翻訳システムは、テキストを第1言語から第2言語へ翻訳するために、翻訳用モデル及び調整パラメータを含む翻訳構成又は翻訳パラメータを使用する。翻訳モデルは、第1及び第2言語の両言語におけるテキストの節(テキスト・パッセージ)を含む訓練データを解析することによって導き出される。調整パラメータは、各翻訳モデルの強度(又は重み)を設定することによって導き出されるが、これは、調整データセットと呼ばれる特定のデータセットに従って、最良の翻訳を得るためである。
統計的機械翻訳システムは、特定のドメイン(領域)に対する新しい訓練データを用いて、適切な翻訳構成を作成すること(モデル又は調整パラメータを再訓練すること)によって改善され得る。例えば、機械翻訳システムは、異なる文体で書かれたテキストの節(テキスト・パッセージ)を含む訓練データを使用することで、再構成できる。従って、機械翻訳システムは、法律用語又は俗語を含むテキストのような、異なる文体で書かれたテキストを翻訳するように構成できる。
従来の機械翻訳システムに関する問題は、特定のタイプのテキストに対して機械翻訳システムを再訓練することが難しいことと、時間がかかることの両方であるが、その理由は、2つの異なる言語で正確に書かれている長いテキストの一節に、起源を求める必要があるためである。
本発明は、改善された機械翻訳システム及び方法を提供することに努める。
本発明の実施形態では機械翻訳方法が提供され、この機械翻訳方法は、各々が少なくとも1つの言語指紋に対応する翻訳構成を複数提供すること、テキストの一節を第1言語で受け取ること、その一節からテキストの第1部分における少なくとも1つの言語指紋を識別すること、識別された言語指紋に基づいて、複数の翻訳構成から1つのグループの翻訳構成を選択すること、そして、選択されたグループの翻訳構成を用いて、その一節の第1部分を第2言語に翻訳することを特徴とする。
好ましくは、翻訳構成は、最初に所定のグループに分類される。
有利なことには、翻訳構成の各グループは、所定のテキスト・タイプに対応する。
好ましくは、翻訳構成は、2つ以上の所定のグループに属する。
都合のよいことには、本機械翻訳方法は、更に、テキストの一節からテキストの第2部分における少なくとも1つの言語指紋を識別すること、テキストの第2部分における識別された各言語指紋に対応する複数の翻訳構成から第2部グループの翻訳構成を選択すること、そして、選択された第2グループの翻訳構成を用いて、テキストの一節の第2部分を第2言語に翻訳することを特徴とする。
有利なことには、本方法は、テキストの一節における各言語指紋に一致するよう翻訳構成のグループを動的に選択する。
都合のよいことには、テキストの各部分は単独のワードである。
好ましくは、テキストの各部分は複数のワードである。
有利なことには、本方法は、更に、翻訳構成を生成すし、メモリに翻訳構成を格納することを特徴とする。
本発明の別の態様では、機械翻訳システムを提供し、この機械翻訳システムは、各々が少なくとも1つの言語指紋に対応する翻訳構成を複数格納するメモリと、テキストの一節を第1言語で受け取り、その一節からテキストの第1部分における少なくとも1つの言語指紋を識別することが可能な言語解析モジュールと、該言語解析モジュールによって識別された各言語指紋に対応する複数の翻訳構成から、1つのグループの翻訳構成を選択することが可能な構成選択モジュールと、選択されたグループの翻訳構成を用いて、テキストの一節の第1部分を第2言語に翻訳することが可能な機械翻訳モジュールと、を備える。
都合のよいことには、翻訳構成は、最初に所定のグループに分類される。
好ましくは、翻訳構成の各グループは、所定のテキスト・タイプに対応する。
有利なことには、翻訳構成は、2つ以上の所定のグループに属する。
都合のよいことには、言語解析モジュールは、テキストの一節からテキストの第2部分における少なくとも1つの言語指紋を識別することが可能であり、構成選択モジュールは、テキストの第2部分における識別された各言語指紋に対応する複数の翻訳構成から、第2グループの翻訳構成の選択することが可能であり、そして、機械翻訳モジュールは、選択された第2グループの翻訳構成を用いて、テキストの一節の第2部分を第2言語に翻訳することが可能である。
有利なことには、構成選択モジュールは、テキストの一節において各言語指紋に一致するよう翻訳構成のグループを動的に選択することが可能である。
好ましくは、テキストの各部分は単独のワードである。
都合のよいことには、テキストの各部分は複数のワードである。
有利なことには、本システムは、翻訳構成を生成し、該翻訳構成をメモリに格納することが可能である構成生成器(コンフィグレーション・ジェネレーター)を更に備える。
本発明がより容易に理解され、且つ、それによって、本発明の更なる特徴が正しく認識されるために、本発明の実施形態が、添付図面を参照しながら、例として、これから説明する。
本発明の一実施形態の機械翻訳システムを示す概略図である。 翻訳構成の4つの所定のグループを示す概略図である。 本発明の、ある実施形態の一要素を形成する翻訳構成生成器のシステムを示す概略図である。
初めに、添付の図1を参照すると、機械翻訳システム1は、処理配列2を含む。該処理配列2は言語解析モジュール3を含み、この言語解析モジュールは、未知のテキストの一節4を受け取ることが可能である。未知のテキストの一節4は、より短い未知のテキストの節を複数備えてもよい。
言語解析モジュール3は、未知のテキスト4からテキスト部分の言語を解析し、且つテキストにおいて少なくとも1つの言語特徴を識別するように構成される。各言語特徴は、以下に限定されるものではないが、例えば、言語タイプ、文体、言語特性又は複雑さのような、テキスト特性を表す。言語特徴やテキスト特性の集合体を、ここでは、テキストの言語指紋と呼ぶ。正しく認識されるべきことであるが、言語解析モジュールは、そのようなテキストに対する言語指紋を生成するために、未知のテキスト4における他の可能性のある言語特徴を識別するように構成される。
言語解析モジュール3は、未知のテキスト4における言語の結合された特徴を表す言語指紋として、識別された各言語特徴を格納する。
言語解析モジュール3は、翻訳構成選択モジュール5に接続される。言語解析モジュール3は、識別された言語指紋を、構成選択モジュール5に伝達することが可能である。
翻訳構成選択モジュール5は、複数の所定の翻訳構成T〜Tを格納する構成メモリ6と通信している。他の実施形態において、翻訳構成T〜Tは、別のモデル及び別の調整パラメータを含む。翻訳構成T〜Tの各々は、特定の言語特性を機械翻訳するためのパラメータである。正しく認識されるべきことであるが、図1には9個の翻訳構成だけが示されているが、本発明の実施形態では、翻訳構成が幾つあってもよい。実際に、本発明のある実施形態では、無数の構成があり、構成の各々は、一意的に識別できる言語指紋に対して生成される。一実施形態において、翻訳構成は統計的に選択され、短文/長文、固有表現、固有ブランド、センテンス中での動詞/名詞/形容詞の位置決め、句読点などのような、いかなる言語特性をもカバーする。
各翻訳構成T〜T又は各翻訳構成T〜Tのグループは、1つ以上の言語指紋に対応する。構成選択モジュール5は、翻訳構成T〜Tを識別するために、構成メモリ6を検索するように機能し、該翻訳構成T〜Tは、未知のテキスト4において言語解析モジュールによって識別される各言語指紋に対応している。構成選択モジュール5は、構成メモリ6に格納された複数の翻訳構成T〜Tから1つのグループの翻訳構成を選択するように機能し、該構成メモリ6は、言語解析モジュール3によって識別された言語指紋に対応している。選択されたグループの翻訳構成は、ただ1つの翻訳構成を備えてもよく、又は複数の翻訳構成を備えてもよい。構成選択モジュール5は、言語解析モジュール3によって生成される各言語指紋に対して、翻訳構成を選択することが可能である。
いったん翻訳構成選択モジュール5が1つのグループの翻訳構成を選択すると、該構成選択モジュール5は、そのグループの翻訳構成を機械翻訳モジュール7に伝達する。機械翻訳モジュール7は、その機械翻訳アルゴリズムの中で、選択されたグループの翻訳構成を使用して未知のテキスト4を異なる言語に翻訳する。機械翻訳システム1は、それ故に、テキストの言語指紋に従って、未知のテキストを解析し、且つ翻訳構成を動的に選択することが可能である。
更なる実施形態において、言語解析モジュール3は、未知のテキスト4からテキストの第1部分を解析することが可能である。構成選択モジュール5は、その後、テキストの第1部分の言語指紋に対応する翻訳構成を選択し、そして、機械翻訳モジュール7は、前述のとおり、選択された翻訳構成を使用してテキストの第1部分を翻訳する。しかしながら、この更なる実施形態では、機械翻訳システム1は、その後、未知のテキスト4からテキストの第2部分を解析し、翻訳することが可能である。未知のテキストからのテキストの第2部分は、第1部分とは別に解析され、テキストの第2部分では、テキストの第1部分とは異なる言語指紋が識別されることもある。テキストの第2部分に対する翻訳構成は、それ故に、テキストの第1部分に対する翻訳構成とは独立して選択される。従って、機械翻訳システム1は、未知のテキストにおけるテキストのさまざまな部分に対して、翻訳構成を動的に選択することが可能である。
この更なる実施形態の機械翻訳システム1は、未知のテキスト4における全てのテキスト部分に対して、解析及び機械翻訳を繰り返すことが可能である。機械翻訳システム1は、このように、テキストの各部分に対して翻訳構成が動的に選択された状態で、未知のテキスト4を小分けにして翻訳する。本発明の実施形態では、各部分は、単独のワードであってもよい。或いは、少なくとも一部分は、センテンス、段落、又はページのように複数のワードであってもよい。
さて、添付の図2を参照すると、本発明の更に別の実施形態において、翻訳構成T〜Tは構成メモリ6の中で、所定のグループに分類される。図2に示された配列において、4つの所定のグループ8〜11があるが、しかし翻訳構成の所定のグループが幾つあってもよいことは、正しく認識されるべきである。図2に示される第4グループ11によって表されるように、1つの翻訳構成が2つ以上のグループに属することもある。
一実施形態において、所定のグループ8〜11は、特定のテキスト・タイプと一致するように、各々が選択される。テキスト・タイプは、例えば、特定の言語指紋とマッチしてもよい。
本発明の更に別の実施形態において、構成メモリ6に、翻訳構成の所定のグループ・セットが複数格納される。例えば、図2に示された配列において、第1のセットは、第1及び第2のグループ8、9を備え、且つ第2のセットは、第3から第4のグループ9〜11を備える。セットは、特定のテキスト・パッセージのタイプにマッチするように選択される。例えば、セットは、法律専門用語を用いた文書に対して選択されてもよい。機械翻訳システム1は、未知のテキスト4におけるテキスト部分に一致するよう翻訳構成のグループ又は翻訳構成のグループ・セットを複数選択することが可能であるが、これは、未知のテキスト4の機械翻訳を動的に最適化するためである。
翻訳構成選択の動的性質によって、本発明の実施形態は、未知のテキストにおける全てのテキスト部分に対する機械翻訳を最適化できるようになる。本発明の実施形態は、それ故に、そのテキストに対してシステムを再訓練しなくても、未知のテキストの個々の部分を翻訳できる。
さて図3を参照すると、翻訳構成T〜Tを生成するためのシステム12は、構成生成器14に接続される言語解析モジュール13を備える。言語解析モジュール13は、第1言語15及び第2言語16における対訳テキスト(パラレルテキスト)の部分を受け取ることが可能である。言語解析モジュール13は、第1言語15における入力テキストに対して言語指紋を生成し、そして、構成作成モジュール14は、第1言語15におけるこの入力テキストに対して最適な翻訳構成を作り出し、翻訳システム1が後で使用できるように、該構成を構成メモリ6に格納する。
この明細書及び請求項で使用される場合、用語「備える(comprise)」及び「備えている(comprising)」及びこれらの変形は、明記された特徴、ステップ又は整数が含まれることを意味する。これらの用語は、他の特徴、ステップ又は要素の存在を排除すると解釈されるべきではない。

Claims (18)

  1. 機械翻訳方法であって、
    各々が少なくとも1つの言語指紋に対応する翻訳構成を複数提供すること、
    テキストの一節を第1言語で受け取ること、
    前記テキストの一節からテキストの第1部分における少なくとも1つの言語指紋を識別すること、
    識別された言語指紋に基づいて、複数の翻訳構成から1つのグループの翻訳構成を選択すること、そして
    選択されたグループの翻訳構成を用いて、前記テキストの一節の第1部分を第2言語に翻訳すること、
    を特徴とする、機械翻訳方法。
  2. 前記翻訳構成は、最初に所定のグループに分類される、請求項1に記載の機械翻訳方法。
  3. 翻訳構成の各グループは、所定のテキスト・タイプに対応する、請求項2に記載の機械翻訳方法。
  4. 翻訳構成は、2つ以上の前記所定のグループに属する、請求項2又は3に記載の機械翻訳方法。
  5. 前記方法は、更に、
    前記テキストの一節からテキストの第2部分における少なくとも1つの言語指紋を識別すること、
    テキストの第2部分における識別された各言語指紋に対応する複数の翻訳構成から第2グループの翻訳構成を選択すること、そして、
    選択された第2グループの翻訳構成を用いて、前記テキストの一節の第2部分を第2言語に翻訳すること、
    を特徴とする、請求項1から4のいずれか一項に記載の機械翻訳方法。
  6. 前記方法は、前記テキストの一節における各言語指紋に一致するよう翻訳構成のグループを動的に選択する、請求項5に記載の機械翻訳方法。
  7. テキストの各部分は単独のワードである、請求項1から6のいずれか一項に記載の機械翻訳方法。
  8. テキストの各部分は複数のワードである、請求項1から6のいずれか一項に記載の機械翻訳方法。
  9. 前記方法は、更に、
    前記翻訳構成を生成し、前記翻訳構成をメモリに格納すること、
    を特徴とする、請求項1から8のいずれか一項に記載の機械翻訳方法。
  10. 機械翻訳システムであって、
    各々が少なくとも1つの言語指紋に対応する翻訳構成を複数格納するメモリと、
    テキストの一節を第1言語で受け取り、前記テキストの一節からテキストの第1部分における少なくとも1つの言語指紋を識別することが可能な言語解析モジュールと、
    前記言語解析モジュールによって識別された各言語指紋に対応する複数の翻訳構成から、1つのグループの翻訳構成を選択することが可能な構成選択モジュールと、
    選択されたグループの翻訳構成用いて、前記テキストの一節の第1部分を第2言語に翻訳することが可能な機械翻訳モジュールと、
    を備える、機械翻訳システム。
  11. 前記翻訳構成は、最初に所定のグループに分類される、請求項10に記載の機械翻訳システム。
  12. 翻訳構成の各グループは、所定のテキスト・タイプに対応する、請求項11に記載の機械翻訳システム。
  13. 翻訳構成は、2つ以上の前記所定のグループに属する、請求項11又は12に記載の機械翻訳システム。
  14. 前記言語解析モジュールは、前記テキストの一節からテキストの第2部分における少なくとも1つの言語指紋を識別することが可能であり、前記構成選択モジュールは、テキストの第2部分における識別された各言語指紋に対応する複数の翻訳構成から、第2グループの翻訳構成を選択することが可能であり、そして、前記機械翻訳モジュールは、選択された第2グループの翻訳構成を用いて、前記テキストの一節の第2部分を第2言語に翻訳することが可能である、請求項10から13のいずれか一項に記載の機械翻訳システム。
  15. 前記構成選択モジュールは、前記テキストの一節における各言語指紋に一致するよう翻訳構成のグループを動的に選択することが可能である、請求項14に記載の機械翻訳システム。
  16. テキストの各部分は単独のワードである、請求項10から15のいずれか一項に記載の機械翻訳システム。
  17. テキストの各部分は複数のワードである、請求項10から15のいずれか一項に記載の機械翻訳システム。
  18. 前記システムは、更に、
    翻訳構成を生成し、前記翻訳構成をメモリに格納することが可能である構成生成器
    を備える、請求項10から17のいずれか一項に記載の機械翻訳システム。
JP2015551995A 2013-01-11 2013-01-11 機械翻訳システム及び方法 Pending JP2016507828A (ja)

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
PCT/EP2013/050521 WO2014108208A1 (en) 2013-01-11 2013-01-11 System and method of machine translation

Publications (1)

Publication Number Publication Date
JP2016507828A true JP2016507828A (ja) 2016-03-10

Family

ID=47561608

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2015551995A Pending JP2016507828A (ja) 2013-01-11 2013-01-11 機械翻訳システム及び方法

Country Status (3)

Country Link
US (1) US20150356076A1 (ja)
JP (1) JP2016507828A (ja)
WO (1) WO2014108208A1 (ja)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2014098640A1 (en) * 2012-12-19 2014-06-26 Abbyy Infopoisk Llc Translation and dictionary selection by context
US10331795B2 (en) * 2016-09-28 2019-06-25 Panasonic Intellectual Property Corporation Of America Method for recognizing speech sound, mobile terminal, and recording medium

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置
JP2001117921A (ja) * 1999-10-15 2001-04-27 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
JP2001222529A (ja) * 2000-02-09 2001-08-17 Nec Corp 機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体
JP2003345798A (ja) * 2002-05-23 2003-12-05 Nippon Telegr & Teleph Corp <Ntt> 翻訳制御方法,翻訳制御装置およびその処理プログラム
JP2008059440A (ja) * 2006-09-01 2008-03-13 National Institute Of Information & Communication Technology 翻訳装置、クラスタ生成装置、クラスタの製造方法、およびプログラム
US20090083023A1 (en) * 2005-06-17 2009-03-26 George Foster Means and Method for Adapted Language Translation
US20090210214A1 (en) * 2008-02-19 2009-08-20 Jiang Qian Universal Language Input
US20090228263A1 (en) * 2008-03-07 2009-09-10 Kabushiki Kaisha Toshiba Machine translating apparatus, method, and computer program product

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7912841B2 (en) * 2006-09-13 2011-03-22 I. Know Nv. Data processing based on data linking elements

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS60124782A (ja) * 1983-12-09 1985-07-03 Fujitsu Ltd 機械翻訳装置
JP2001117921A (ja) * 1999-10-15 2001-04-27 Sony Corp 翻訳装置および翻訳方法、並びに記録媒体
JP2001222529A (ja) * 2000-02-09 2001-08-17 Nec Corp 機械翻訳システム及びプログラムを記録した機械読み取り可能な記録媒体
JP2003345798A (ja) * 2002-05-23 2003-12-05 Nippon Telegr & Teleph Corp <Ntt> 翻訳制御方法,翻訳制御装置およびその処理プログラム
US20090083023A1 (en) * 2005-06-17 2009-03-26 George Foster Means and Method for Adapted Language Translation
JP2008059440A (ja) * 2006-09-01 2008-03-13 National Institute Of Information & Communication Technology 翻訳装置、クラスタ生成装置、クラスタの製造方法、およびプログラム
US20090210214A1 (en) * 2008-02-19 2009-08-20 Jiang Qian Universal Language Input
US20090228263A1 (en) * 2008-03-07 2009-09-10 Kabushiki Kaisha Toshiba Machine translating apparatus, method, and computer program product
JP2009217360A (ja) * 2008-03-07 2009-09-24 Toshiba Corp 機械翻訳する装置、方法およびプログラム

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
CONG HUI, PROCEEDINGS OF THE JOINT 5TH WORKSHOP ON STATISTICAL MACHINE TRANSLATION AND METRICS, JPN5016000963, 15 July 2010 (2010-07-15), SE, pages 67 - 71, ISSN: 0003458579 *
JIA XU 外3名: "DOMAIN DEPENDENT STATISTICAL MACHINE TRANSLATION", MACHINE TRANSLATION SUMMIT XI, JPN5016000959, 10 September 2007 (2007-09-10), pages 1 - 6, ISSN: 0003458577 *
LEMAO LIU, PROCEEDINGS OF THE 2012 JOINT CONFERENCE ON EMPIRICAL METHODS IN NATURAL LANGUAGE 以下備考, JPN5016000961, 12 July 2012 (2012-07-12), pages 402 - 411, ISSN: 0003458578 *

Also Published As

Publication number Publication date
WO2014108208A1 (en) 2014-07-17
US20150356076A1 (en) 2015-12-10

Similar Documents

Publication Publication Date Title
US12032902B2 (en) Text generation for patent applications using natural language modeling and programmable templating language
Chisholm et al. Entity disambiguation with web links
US20190377797A1 (en) Mathematical processing method, apparatus and device for text problem, and storage medium
KR101762866B1 (ko) 구문 구조 변환 모델과 어휘 변환 모델을 결합한 기계 번역 장치 및 기계 번역 방법
CN118410457B (zh) 基于大语言模型的多模态识别方法、装置、电子设备和存储介质
CN105512105B (zh) 语义解析方法和装置
US20160314394A1 (en) Method and device for constructing event knowledge base
CN103092998B (zh) 数据查询系统和数据查询方法
JP2017199363A (ja) 機械翻訳装置及び機械翻訳のためのコンピュータプログラム
US11664010B2 (en) Natural language domain corpus data set creation based on enhanced root utterances
US20230124402A1 (en) Inference Methods For Word Or Wordpiece Tokenization
WO2012079257A1 (zh) 机器翻译装置和方法
KR20170122755A (ko) 함의 페어 확장 장치, 그것을 위한 컴퓨터 프로그램, 및 질문 응답 시스템
US20190129948A1 (en) Generating method, generating device, and recording medium
CN110309214B (zh) 一种指令执行方法及其设备、存储介质、服务器
CN113869057A (zh) 文本数据增强方法、系统和计算机设备和存储介质
JP2016507828A (ja) 機械翻訳システム及び方法
JP2021135839A (ja) 情報処理システム、文生成方法およびプログラム
JP2017059216A (ja) クエリ校正システムおよび方法
CN113723096B (zh) 文本识别方法及装置、计算机可读存储介质和电子设备
Aceves-Pérez et al. Enhancing cross-language question answering by combining multiple question translations
JP4940251B2 (ja) 文書処理プログラム及び文書処理装置
US12591739B2 (en) Method and system for diacritizing Arabic text
JP5700833B2 (ja) 並替モデル生成装置、語順並替装置、方法及びプログラム
JP2014164575A (ja) 文書処理装置およびプログラム

Legal Events

Date Code Title Description
A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20151202

A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20151203

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161205

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161220

A601 Written request for extension of time

Free format text: JAPANESE INTERMEDIATE CODE: A601

Effective date: 20170302

A02 Decision of refusal

Free format text: JAPANESE INTERMEDIATE CODE: A02

Effective date: 20170815