EA007776B1

EA007776B1 - Content conversion method and apparatus

Info

Publication number: EA007776B1
Application number: EA200400856A
Authority: EA
Inventors: Эли Абир
Original assignee: Эли Абир
Priority date: 2001-12-21
Filing date: 2002-09-18
Publication date: 2007-02-27
Also published as: EA200400856A1

Abstract

A method and apparatus for analyzing documents and thereby determining the association between words in a language. The method includes providing a collection of documents, selecting a first word or word strings, and a second word or word string occurring in the documents. The method further involves associating first word or word strings and second word or word strings with common word or word string based on frequency of occurrence of the common word or word strings within the ranges.

Description

Родственные заявкиRelated Applications

Настоящая заявка является частичным продолжением заявки № 10/024473 на патент США, поданной 21 декабря 2001г., и по ней испрашивается приоритет на основе предварительной заявки № 60/276107 на патент США, поданной 16 марта 2001г., и предварительной заявки № 60/299472 на патент США, поданной 21 июня 2001г., каждая из которых включена в настоящую заявку путем ссылки.This application is a partial continuation of US Patent Application No. 10/024473, filed December 21, 2001, and claims priority on the basis of US Provisional Application No. 60/276107, filed March 16, 2001, and provisional application No. 60/299472 US patent filed June 21, 2001, each of which is incorporated into this application by reference.

Приложение листингов компьютерных программComputer Program Listing Application

Настоящая заявка содержит в приложении листингов компьютерных программ на ДИСКЕ 1 следующие листинги компьютерных программ: Ргодгат1 в файле ргодгат 1.1x1, созданном 28 мая 2002г. и содержащем 12 кбайт; Ргодгат2 в файле ргодгат2.1х1, созданном 28 мая 2002 г. и содержащем 2 кбайт, РгодгатЗ в файле ргодгат3.1х1, созданном 28 мая 2002г. и содержащем 17 кбайт, и Ргодгат4 в файле ргодгат4.1х1, созданном 31 мая 2002г. и содержащем 8 кбайт.This application contains the following computer program listings in the computer program listing application on DISC 1: Rgodgat1 in the rgodgat 1.1x1 file created on May 28, 2002. and containing 12 kB; Rgodgat2 in the rgodgat2.1x1 file created on May 28, 2002 and containing 2 kbytes, Rgodgat3 in the rgodgat3.1x1 file created on May 28, 2002. and containing 17 kbytes, and Rgodgat4 in the file rgodgat4.1x1, created on May 31, 2002. and containing 8 kb.

Область техники, к которой относится изобретениеFIELD OF THE INVENTION

Настоящее изобретение относится к способу и устройству для создания базы данных, предназначенной для использования при преобразовании языка из одного состояния в другое состояние.The present invention relates to a method and apparatus for creating a database for use in converting a language from one state to another state.

Предпосылки к созданию изобретенияBACKGROUND OF THE INVENTION

Известны устройства и способы для автоматического перевода документов с одного языка на другой язык. Однако данные устройства и способы часто дают неточный перевод документов с одного языка на другой язык, работают медленно и могут быть неудобными для применения. Кроме средств перевода, работающих с участием человека, другие известные устройства содержат широкодоступное программное обеспечение для машинного перевода. У указанных известных систем имеются недостатки, из-за которых данные системы чувствительны к ошибкам, имеют низкую скорость и неудобны. Известные устройства и способы перевода не способны постоянно выдавать точные переводы входных текстов и поэтому часто требуют от пользователя интенсивного участия в проверочном считывании и редактировании. Точный машинный перевод сложнее, чем выдаваемый устройствами и способами, выполняющими подстрочные переводы документов. Упомянутые системы подстрочного перевода часто дают переводы, мало понятные читателям переведенного документа, поскольку способ подстрочного перевода не обеспечивает правильный выбор слов и приводит к получению бессмысленных грамматических единиц.Known devices and methods for automatically translating documents from one language to another language. However, these devices and methods often give inaccurate translation of documents from one language into another language, work slowly and may be inconvenient for use. In addition to human-assisted translation tools, other known devices include widely available machine translation software. These known systems have disadvantages due to which these systems are error-sensitive, have a low speed and are inconvenient. Known devices and methods of translation are not able to constantly produce accurate translations of input texts and therefore often require the user to actively participate in verification reading and editing. Accurate machine translation is more complicated than that produced by devices and methods that perform interlinear translation of documents. The mentioned systems of interlinear translation often give translations that are not well understood by readers of the translated document, since the method of interlinear translation does not provide the correct choice of words and leads to meaningless grammatical units.

Чтобы избавиться от описанных недостатков, известные устройства перевода десятилетиями нацеливали на выбор переводов слов в контексте предложения на основании сочетания или набора лексических, морфологических, синтаксических и семантических правил. Указанные системы, известные в технике как системы машинного перевода (МП, МТ), «основывающиеся на правилах», обладают существенным недостатком, поскольку существует так много исключений из правил, что данные системы не в состоянии постоянно выдавать точный перевод.To get rid of the described shortcomings, the known translation devices for decades aimed at the choice of word translations in the context of sentences based on a combination or set of lexical, morphological, syntactic and semantic rules. These systems, known in the art as machine translation systems (MT, MT), “rule-based”, have a significant drawback, since there are so many exceptions to the rules that these systems are not able to constantly produce accurate translations.

Кроме основывающихся на правилах систем МП, в последнее десятилетие разработан новый способ МП, известный под названием МП, «основывающегося на примерах» (ЕВМТ, ЕВМТ). Способ ЕВМТ основан на использовании предложений (или, может быть, частей предложений), сохраняемых на двух разных языках в межъязыковой базе данных. Если запрос перевода соответствует предложению в базе данных, то перевод предложения на язык, на который делается перевод (выходной язык), выполняется базой данных, выдающей точный перевод на другом языке. Если часть запроса перевода соответствует части предложения в базе данных, то упомянутые устройства делают попытку точно определить, какая часть предложения, преобразованного в предложение на входном языке, является переводом запроса.In addition to the MP-based systems of rules, in the last decade a new MP method, known as MP, "based on examples" (ЕВМТ, ЕВМТ) has been developed. The EUMT method is based on the use of sentences (or, possibly, parts of sentences) stored in two different languages in a multilingual database. If the translation request matches the sentence in the database, then the translation of the sentence into the language into which the translation is done (output language) is performed by the database issuing the exact translation in another language. If the part of the translation request corresponds to the part of the sentence in the database, then the mentioned devices try to determine exactly which part of the sentence converted to the sentence in the input language is the translation of the request.

Системы ЕВМТ не способны дать точный перевод с языка без ограничений, поскольку базы данных межъязыковых предложений создаются вручную и потому всегда будут, как правило, «неполными». Другой недостаток систем ЕВМТ заключается в том, что переводы вариантов частичного совпадения ненадежны. Предпринимались попытки автоматизировать создание межъязыковых баз данных по парам переведенных документов для использования в системах ЕВМТ. Однако данные усилия не привели к созданию полезных точных межъязыковых баз данных сколько-нибудь существенного размера. Ни одна из упомянутых попыток не связана с применением алгоритма, который бы надежно и точно выдавал переводы значимого числа слов или словосочетаний из пары переведенных документов.ЕВМТ systems are not able to give an accurate translation from a language without restrictions, since databases of interlanguage sentences are created manually and therefore will always be, as a rule, "incomplete". Another drawback of EUMT systems is that translations of partial match options are unreliable. Attempts have been made to automate the creation of multilingual databases of pairs of translated documents for use in EBMT systems. However, these efforts have not led to the creation of useful, accurate multilingual databases of any substantial size. None of the mentioned attempts is associated with the use of an algorithm that reliably and accurately produces translations of a significant number of words or phrases from a pair of translated documents.

Некоторые устройства перевода сочетают оба механизма МП, а именно МП, основывающийся на правилах, и МП, основывающийся на примерах (ЕВМТ). Хотя указанное сочетание приемов и позволяет повысить степень точности по сравнению со случаем применения любой одной системы из указанных систем, результаты остаются неполноценными без серьезной поддержки со стороны пользователя и выполнения им редактирования.Some translation devices combine both MP mechanisms, namely MP based on rules and MP based on examples (EBMT). Although this combination of techniques can improve the degree of accuracy compared with the case of using any one system from these systems, the results remain incomplete without serious support from the user and performing editing.

Проблемы, возникающие при переводе документов с одного языка на другой язык, можно отнести к более общей проблеме преобразования данных, выражающих понятия или информацию в одном состоянии, например текстовом, в данные, выражающих понятия в другом состоянии, например в виде математических символов. В указанных случаях следует производить поиск в межпонятийных ассоциативных базах данных, которые ассоциативно связывают данные, находящиеся в одном состоянии, с эквивалентными данными в другом состоянии. Поэтому существует потребность в усовершенствованном и более эффективном способе и устройстве для создания словарей или баз данных, которые ассоциативно связывают эквивалентные понятия на разных языках или в разных состояниях (например, в виде слов, словоThe problems that arise when translating documents from one language into another language can be attributed to the more general problem of converting data expressing concepts or information in one state, for example, text, into data expressing concepts in another state, for example, in the form of mathematical symbols. In these cases, a search should be made in inter-conceptual associative databases that associatively associate data in one state with equivalent data in another state. Therefore, there is a need for an improved and more efficient method and apparatus for creating dictionaries or databases that associate equivalent concepts in different languages or in different states (for example, in the form of words, a word

- 1 007776 сочетаний, звуков, движений и т.п.), и для перевода или преобразования понятий, передаваемых документами на одном языке или в одном состоянии, в такие же или подобные понятия, представленные документами на другом языке или в другом состоянии.- 1 007776 combinations, sounds, movements, etc.), and for translating or converting concepts transmitted by documents in one language or in one state into the same or similar concepts presented by documents in another language or in another state.

Изобретение относится к обработке контента (информационного значимого содержимого) с использованием межпонятийной ассоциативной базы данных. В частности, в соответствии с настоящим изобретением предлагаются способ и устройство для создания базы данных ассоциированных понятий, а также способ и устройство для использования упомянутой базы данных с тем, чтобы преобразовывать понятия из одного состояния в другие состояния.The invention relates to the processing of content (meaningful information content) using an inter-conceptual associative database. In particular, in accordance with the present invention, there is provided a method and apparatus for creating a database of associated concepts, as well as a method and apparatus for using said database in order to transform concepts from one state to other states.

В соответствии с одним из вариантов осуществления настоящего изобретения предлагаются, например, способ и устройство для создания базы данных для перевода с одного языка на другой, при этом два языка составляют базу данных ассоциированных понятий. В соответствии с настоящим изобретением предлагаются также способ и устройство для использования упомянутой языковой базы данных с тем, чтобы преобразовывать документы (отражающие понятия) из одной языковой формы в другую языковую форму (или, в более общем смысле, из одного состояния в другое состояние). Тем не менее, настоящее изобретение не ограничено переводами с одного языка на другой язык, несмотря на то, что ниже представлено описание данного предпочтительного варианта осуществления. Аспект настоящего изобретения, заключающийся в создании базы данных, можно применить к любым понятиям, которые как-либо связаны, но выражаются в разных состояниях, а аспект настоящего изобретения, заключающийся в преобразовании, можно применить к точному преобразованию понятий из одного состояния в другое состояние.In accordance with one embodiments of the present invention, there is provided, for example, a method and apparatus for creating a database for translation from one language to another, wherein two languages constitute a database of associated concepts. The present invention also provides a method and apparatus for using said language database in order to convert documents (reflecting concepts) from one language form to another language form (or, more generally, from one state to another state). However, the present invention is not limited to translations from one language to another language, although the description of this preferred embodiment is provided below. The aspect of the present invention, which consists in creating a database, can be applied to any concepts that are somehow related, but expressed in different states, and the aspect of the present invention, which consists in conversion, can be applied to the exact transformation of concepts from one state to another state.

В соответствии с другим вариантом осуществления настоящего изобретения аспект настоящего изобретения, заключающийся в создании базы данных, можно применить для создания таких ассоциаций между понятиями в пределах одного языка и их отношения друг с другом, которые используются в приложениях искусственного интеллекта.In accordance with another embodiment of the present invention, the aspect of the present invention, which consists in creating a database, can be used to create such associations between concepts within the same language and their relationships with each other, which are used in artificial intelligence applications.

Ниже приведено описание применения настоящего изобретения в варианте осуществления перевода с одного языка на другой язык. В контексте настоящего описания, термины, относящиеся к преобразованию, переводу и обработке, применяются как равнозначные, причем в их наиболее широком смысле.The following is a description of the application of the present invention in an embodiment of translation from one language into another language. In the context of the present description, the terms related to conversion, translation and processing are used as equivalent, and in their broadest sense.

Краткая формулировка сущности изобретенияSUMMARY OF THE INVENTION

Задача настоящего изобретения заключается в обеспечении эффективного перевода документов с одного языка или из одного состояния на другой язык или в другое состояние посредством разработки способа и устройства для создания и сопровождения межпонятийных ассоциативных баз данных. Упомянутые базы данных, в общем случае, ассоциативно связывают представленные в первом формате или состоянии данные, которые отражают конкретные понятия или порции информации, с представленными во втором формате или состоянии данными, которые отражают те же самые конкретные понятия или порции информации.The objective of the present invention is to provide an efficient translation of documents from one language or from one state to another language or to another state by developing a method and apparatus for creating and maintaining inter-conceptual associative databases. Said databases, in the general case, associate data presented in the first format or state that reflect specific concepts or pieces of information with data presented in a second format or state that reflect the same specific concepts or pieces of information.

Другая задача настоящего изобретения заключается в обеспечении перевода документов с одного языка или из одного состояния на другой язык или в другое состояние посредством разработки способа и устройства для создания второго документа, содержащего данные во втором состоянии, формате или на втором языке, из первого документа, содержащего данные в первом состоянии, формате или на первом языке, при этом первый и второй документы отражают, по существу, одни и те же понятия или информацию.Another objective of the present invention is to provide translation of documents from one language or from one state to another language or to another state by developing a method and apparatus for creating a second document containing data in a second state, format or in a second language, from the first document containing data in the first state, format, or in the first language, with the first and second documents reflecting essentially the same concepts or information.

Еще одна задача настоящего изобретения заключается в обеспечении перевода документов с одного языка или из одного состояния на другой язык или в другое состояние посредством разработки способа и устройства для создания второго документа, содержащего данные во втором состоянии, формате или на втором языке, из первого документа, содержащего данные в первом состоянии, формате или на первом языке, при этом первый и второй документы отражают, по существу, одни и те же понятия или информацию, а способ и устройство включают в себя использования межпонятийной ассоциативной базы данных.Another objective of the present invention is to provide translation of documents from one language or from one state to another language or to another state by developing a method and apparatus for creating a second document containing data in a second state, format or in a second language, from the first document, containing data in the first state, format or in the first language, the first and second documents reflect essentially the same concepts or information, and the method and apparatus include using ezhponyatiynoy associative database.

Еще одна задача настоящего изобретения заключается в создании перевода документов (в широком смысле, в преобразовании понятий из одного состояния в другое состояние) в реальном времени.Another objective of the present invention is to create a translation of documents (in the broad sense, in the conversion of concepts from one state to another state) in real time.

Указанные и другие задачи настоящего изобретения решаются с помощью способа и устройства для создания межпонятийной базы данных. Способ и устройство для создания межпонятийной базы данных могут включать в себя создание, по меньшей мере, двух документов, при этом каждый документ составлен на отличающемся от других языке, но отражает, по существу, одни и те же понятия. Документы могут представлять собой точные переводы одного и того же текста, т. е. являться параллельными текстовыми документами, или могут быть переводами, содержащими тексты, связанные в общем смысле, т.е. сопоставимые текстовые документы. В соответствии с настоящим изобретением выбирают, по меньшей мере, первое и второе появление всех слов и словосочетаний, которые характеризуются большим числом появлений в первом языке в имеющихся межъязыковых документах. Затем выбирают, по меньшей мере, один интервал первого слова и один интервал второго слова в документах на втором языке, при этом интервалы первого и второго слов соответствуют первому и второму появлениям выбранного слова или словосочетания в документах на первом языке. Затем сравнивают слова и словосочетания,These and other objectives of the present invention are solved using the method and device for creating an inter-conceptual database. A method and apparatus for creating an inter-conceptual database may include the creation of at least two documents, each document being written in a language different from the others, but reflecting essentially the same concepts. Documents can be exact translations of the same text, that is, they can be parallel text documents, or they can be translations containing texts related in a general sense, i.e. comparable text documents. In accordance with the present invention, at least the first and second occurrences of all words and phrases are selected, which are characterized by a large number of occurrences in the first language in existing multilingual documents. Then, at least one interval of the first word and one interval of the second word in documents in the second language are selected, while the intervals of the first and second words correspond to the first and second occurrences of the selected word or phrase in documents in the first language. Then the words and phrases are compared,

- 2 007776 найденные в интервале первого слова, со словами и словосочетаниями, найденными в интервале второго слова, находят слова и словосочетания, общие для интервалов обоих слов, и вводят данные найденные общие слова и словосочетания в межпонятийную базу данных. Затем в соответствии с настоящим изобретением в упомянутой межпонятийной базе данных ассоциируют общие слова или словосочетания, найденные в двух интервалах во втором языке, с выбранными словом или словосочетанием в первом языке, с упорядочиванием по частоте их ассоциации (числу повторных появлений), после корректирования исправления частот ассоциаций согласно настоящему описанию. Число ассоциаций, выделяемых базой данных по результатам анализа параллельных или сравнимых текстов на предмет общих слов или словосочетаний в разных языках, будет возрастать с увеличением числа доступных параллельных или сопоставимых текстов на многих разных языках.- 2 007776 found in the interval of the first word, with words and phrases found in the interval of the second word, find the words and phrases common to the intervals of both words, and enter the data found common words and phrases into the inter-database. Then, in accordance with the present invention, common words or phrases found in two intervals in the second language are associated with the selected word or phrase in the first language in the said inter-conceptual database, ordered by the frequency of their association (the number of repeated occurrences), after correcting the correction of frequencies associations as described herein. The number of associations highlighted by the database based on the analysis of parallel or comparable texts for common words or phrases in different languages will increase with the number of available parallel or comparable texts in many different languages.

Кроме того, указанные и другие задачи настоящего изобретения достигаются с помощью способа и устройства для преобразования документа из одного состояния в другое состояние. В соответствии с настоящим изобретением создается база данных, содержащая сегменты данных на первом языке, ассоциированные с сегментами данных на втором языке (созданными вышеописанными способами или вручную). В соответствии с настоящим изобретением текст переводят посредством обращения к вышеупомянутой базе данных и идентификации самого длинного по числу слов словосочетания в переводимом документе, начиная с первого слова документа, которое существует в базе данных. Затем система извлекает из базы данных словосочетание на втором языке, ассоциированное с найденным словосочетанием из документа на первом языке. Далее система выбирает второе словосочетание в документе, которое существует в базе данных и содержит перекрывающееся слово (или, по альтернативному варианту, словосочетание) с ранее идентифицированным словосочетанием в документе, и извлекает из базы данных словосочетание на втором языке, ассоциированное со вторым словосочетанием на первом языке. Если ассоциированные словосочетания на втором языке содержат перекрывающееся слово (или, по альтернативному варианту, слова), то ассоциированные словосочетания на втором языке сочетаются (с исключением избыточности по перекрытию) для создания перевода; а в противном случае, извлекают другие ассоциации на втором языке к словосочетаниям на первом языке и проверяют на возможность сочетания по перекрытию слов вплоть до положительного результата. Следующее словосочетание в документе на первом языке выбирают распознаванием самого длинного словосочетания в базе данных, которое содержит перекрывающееся слово (или, по другому варианту, слова) с ранее распознанным словосочетанием на первом языке, и продолжают вышеописанную процедуру, пока весь документ на первом языке не будет преобразован в документ на втором языке.In addition, these and other objectives of the present invention are achieved using the method and device for converting a document from one state to another state. In accordance with the present invention, a database is created containing data segments in the first language associated with data segments in the second language (created by the above methods or manually). In accordance with the present invention, the text is translated by referring to the aforementioned database and identifying the longest word combination in the translated document, starting with the first word of the document that exists in the database. The system then retrieves the second language phrase from the database associated with the found phrase from the document in the first language. The system then selects the second phrase in the document that exists in the database and contains an overlapping word (or, alternatively, the phrase) with the previously identified phrase in the document, and extracts the second language phrase associated with the second phrase in the first language from the database . If the associated phrases in the second language contain an overlapping word (or, alternatively, words), then the associated phrases in the second language are combined (with the exception of redundancy in overlapping) to create a translation; otherwise, other associations in the second language are extracted to phrases in the first language and they are checked for the possibility of combining word overlap up to a positive result. The next collocation in the document in the first language is selected by recognizing the longest collocation in the database, which contains an overlapping word (or, in another variant, words) with the previously recognized collocation in the first language, and continue the above procedure until the entire document in the first language is converted to a second language document.

Кроме того, в соответствии с настоящим изобретением создают частотные таблицы для определения ассоциации, по меньшей мере, между двумя словами или словосочетаниями, чтобы можно было использовать эти частотные таблицы в других вариантах применения, включая варианты применения, связанные с преобразованием контента из одного состояния в другое состояние. Частотные таблицы создают посредством анализа документов в заданном состоянии (например, на заданном языке) и определения частоты, с которой два слова и/или словосочетания связаны на основе близости к слову или словосочетанию в тексте. Следовательно, например, по результатам анализа текстов на английском языке можно установить частотные таблицы для слов или словосочетаний, относящихся к фразе «пик Эверест» (Моии! Еуетей), например «гора» (тоип1аш), «самое высокое место в мире» (11ф11С51 р1асе ίη 111е \\όγ16). «снег» (5по\у). «восхождение» (сБтЬ), «погибшие» (реор1е б1еб) и «холод» (со1б). Упомянутые частотные таблицы можно затем использовать любыми способами в любых интеллектуальных приложениях для ответа на вопросы путем распознавания общих ассоциаций, по меньшей мере, по двум частотным таблицам. Базы данных, создаваемые для интеллектуальных приложений, можно строить по документам на одном языке (или, по другому варианту, с использованием межъязыкового текста).In addition, in accordance with the present invention, frequency tables are created to determine the association between at least two words or phrases so that these frequency tables can be used in other applications, including applications related to the conversion of content from one state to another state. Frequency tables are created by analyzing documents in a given state (for example, in a given language) and determining the frequency with which two words and / or phrases are related based on proximity to a word or phrase in the text. Therefore, for example, according to the results of the analysis of texts in English, frequency tables can be set for words or phrases related to the phrase “Everest peak” (Moi! Eyetey), for example, “mountain” (toip1ash), “the highest place in the world” (11f11C51 p1ase ίη 111е \\ όγ16). "Snow" (5po \ y). "Ascent" (sbtb), "dead" (Reb1e b1eb) and "cold" (sbb). Mentioned frequency tables can then be used by any means in any intelligent applications to answer questions by recognizing common associations from at least two frequency tables. Databases created for intelligent applications can be built on documents in one language (or, alternatively, using interlanguage text).

Перечень фигур чертежейList of drawings

Фиг. 1 - вариант осуществления межпонятийной базы данных в соответствии с настоящим изобретением.FIG. 1 is an embodiment of an inter-concept database in accordance with the present invention.

Фиг. 2 - вариант осуществления компьютерной системы в соответствии с настоящим изобретением с целью реализации способов по настоящему изобретению.FIG. 2 is an embodiment of a computer system in accordance with the present invention in order to implement the methods of the present invention.

Фиг. 3 - запоминающее устройство (ЗУ) компьютерной системы в соответствии с настоящим изобретением для хранения программ, реализующих способы по настоящему изобретению.FIG. 3 is a memory device (memory) of a computer system in accordance with the present invention for storing programs that implement the methods of the present invention.

Подробное описание изобретенияDETAILED DESCRIPTION OF THE INVENTION

В соответствии с настоящим изобретением предлагаются способ и устройство для создания и сопровождения межпонятийной базы данных и для перевода документов с первого языка или из первого состояния на второй язык или во второе состояние с использованием межпонятийной базы данных. Рассматриваемые в настоящем описании документы являются фондом такой информации, как понятия, представленные символами и буквами, зафиксированными на некотором носителе. Например, документы могут быть электронными документами, записанными на магнитном или оптическом носителе, или бумажными документами, например книгами. Символы и буквы, содержащиеся в документах, представляют понятия и сведения, выраженные с использованием одной или нескольких систем отображения, относительно которых предполагается, что они понятны пользователям документов. В соответствии сIn accordance with the present invention, there is provided a method and apparatus for creating and maintaining an inter-conceptual database and for translating documents from a first language or from a first state to a second language or into a second state using an inter-conceptual database. The documents considered in the present description are the foundation of such information as concepts represented by symbols and letters fixed on some medium. For example, the documents may be electronic documents recorded on magnetic or optical media, or paper documents, such as books. Symbols and letters contained in documents represent concepts and information expressed using one or more display systems, with respect to which it is assumed that they are understandable to document users. In accordance with

- 3 007776 настоящим изобретением документы, находящиеся в первом состоянии, т.е. содержащие информацию, выраженную в одной системе отображения, обрабатывают с целью получения документов, находящихся во втором состоянии, т.е. содержащих, по существу, ту же самую информацию, выраженную с использованием второй системы отображения. Следовательно, настоящее изобретение дает возможность обрабатывать или переводить документы из одних систем отображения в другие системы отображения, например письменные документы или устную речь с таких языков, как английский, иврит и кантонский, на другие языки.- 3 007776 of the present invention, documents in the first state, i.e. containing information expressed in one display system is processed in order to obtain documents in the second state, i.e. containing essentially the same information expressed using a second display system. Therefore, the present invention makes it possible to process or translate documents from one display system into another display system, for example, written documents or spoken language from languages such as English, Hebrew and Cantonese, into other languages.

Система или устройство для осуществления преобразования контента или способ обработки контента в соответствии с настоящим изобретением могут, соответственно, представлять собой компьютерную систему 200, показанную на фиг. 2, или реализоваться на базе данной системы. Компьютерная система 200 содержит процессор 202, связанный через шину 214 с памятью 208, устройством ввода 210 и устройством вывода 212. Компьютерная система 200 может также содержать запоминающее устройство (ЗУ) 204 и сетевой интерфейс 206. Процессор 202 осуществляет доступ к данным и программам, хранящимся в памяти 208. Посредством исполнения программ в памяти 208 процессор может управлять компьютерной системой 200 и выполнять этапы обработки данных и управления устройствами, например устройством ввода 210, устройством вывода 212, ЗУ 204, сетевым интерфейсом 206 и памятью 208. Программы, хранящиеся в памяти 208, могут содержать этапы, реализующие способ в соответствии с настоящим изобретением, например преобразование контента, ассоциирование слов и словосочетаний и создание базы данных, и способы сопровождения.The system or apparatus for implementing the content conversion or the content processing method in accordance with the present invention may, respectively, be a computer system 200 shown in FIG. 2, or implemented on the basis of this system. The computer system 200 comprises a processor 202 connected through a bus 214 to a memory 208, an input device 210, and an output device 212. The computer system 200 may also include a memory device 204 and a network interface 206. The processor 202 accesses data and programs stored in memory 208. By executing programs in memory 208, a processor can control a computer system 200 and perform data processing and device management steps, such as input device 210, output device 212, memory 204, and network interface 206 and memory 208. Programs stored in memory 208 may include steps implementing the method in accordance with the present invention, for example, converting content, associating words and phrases and creating a database, and tracking methods.

ЗУ 204 записывает и хранит информацию для последующего извлечения в память 208 процессором 202 и может содержать известные ЗУ, как, например, энергонезависимые ЗУ, накопители на магнитных дисках, накопители на магнитных лентах и оптические ЗУ. ЗУ 204 может хранить программы и данные, в том числе базы данных, которые могут передаваться в память 208 для использования процессором 202. Базы данных в полном объеме или блоки баз данных могут передаваться в память 208 для доступа и обработки процессором 202. Сетевой интерфейс 206 обеспечивает обмен данными между компьютерной системой 200 и сетью 216, например сетью 1п1сгпс1. и преобразует сигналы, поступающие из компьютерной системы 200, в формат, допускающий передачу по сети 216, и наоборот. Устройство ввода 210 может содержать, например, клавиатуру и сканер для ввода данных в память 208 и в ЗУ 204. Входные данные могут содержать текст документов, подлежащих записи в документальную базу данных для анализа и преобразования контента. Устройство вывода 212 содержит устройства для представления информации пользователю компьютерной системы и может содержать, например, экран монитора и принтер.The memory 204 records and stores information for subsequent retrieval in the memory 208 by the processor 202 and may contain known memory devices, such as non-volatile memory, magnetic disk drives, magnetic tape drives and optical memory. The memory 204 can store programs and data, including databases, which can be transferred to the memory 208 for use by the processor 202. The entire database or database blocks can be transferred to the memory 208 for access and processing by the processor 202. The network interface 206 provides data exchange between the computer system 200 and the network 216, for example, the network 1p1sgps1. and converts the signals coming from the computer system 200 into a format that can be transmitted over the network 216, and vice versa. Input device 210 may comprise, for example, a keyboard and a scanner for inputting data into memory 208 and into memory 204. Input data may comprise text of documents to be written to a document database for analysis and conversion of content. An output device 212 includes devices for presenting information to a user of a computer system and may include, for example, a monitor screen and a printer.

Ниже приведено подробное описание настоящего изобретения, включая способ и устройство для создания базы данных и способ и устройство для преобразования.The following is a detailed description of the present invention, including a method and apparatus for creating a database and a method and apparatus for converting.

Способ и устройство для создания базы данныхMethod and device for creating a database

В соответствии со способом по настоящему изобретению для обработки контента документа используют межпонятийную базу данных. На фиг. 1 приведен вариант осуществления межпонятийной базы данных. Данный вариант осуществления содержит листинг сегментов ассоциированных данных в графах 1 и 2. Сегменты данных представляют собой символы или группировки знаков, которые представляют конкретное понятие или порцию информации в системе отображения. Если система отображения в документе является, например, естественным языком, то сегментом может быть слово или словосочетание. Следовательно, сегменты системы А в графе 1 являются сегментами данных, которые представляют различные понятия и сочетание понятий, Эа1, Эа2, Эа3 и Эа4 в гипотетической системе отображения А. Сегментами системы В в графе 2 являются ЭЫ, ЭЬ3, ЭЬ4, ЭЬ5, ЭЬ7, ЭЬ9, ΌΜ0 и ΌΜ2, которые представляют различные понятия и некоторые сочетания таких понятий в гипотетической системе отображения В, которые упорядочены по частоте ассоциаций с сегментами данных в системе отображения А. В графе 3 указана непосредственная частота ассоциаций, которая представляет собой количество случаев, когда сегмент или сегменты на языке В были ассоциированы с приведенным сегментом (или сегментами) на языке А. В графе 4 представлены частоты ассоциаций после вычитания, которые представляют собой количество случаев, когда сегмент (или сегменты) данных на языке В были ассоциированы с сегментом (или сегментами) на языке А после вычитания количества случаев, когда сегмент (или сегменты) были ассоциированы в составе более крупного сегмента, в соответствии с нижеприведенным более полным описанием.In accordance with the method of the present invention, an inter-database database is used to process document content. In FIG. 1 shows an embodiment of an inter-concept database. This embodiment comprises listing segments of associated data in columns 1 and 2. Data segments are characters or groupings of characters that represent a particular concept or piece of information in a display system. If the display system in a document is, for example, a natural language, then the segment may be a word or phrase. Therefore, the segments of system A in column 1 are data segments that represent different concepts and a combination of concepts, Ea1, Ea2, Ea3 and Ea4 in the hypothetical mapping system A. The segments of system B in column 2 are EI, E3, E4, E5, E7, E9, ΌΜ0 and ΌΜ2, which represent various concepts and some combinations of such concepts in a hypothetical mapping system B, which are ordered by the frequency of associations with data segments in mapping system A. Column 3 indicates the direct frequency of associations, which represents th number of cases when a segment or segments in language B were associated with a given segment (or segments) in language A. Column 4 presents the frequencies of associations after subtraction, which are the number of cases when a segment (or segments) of data in language B were associated with a segment (or segments) in language A after subtracting the number of cases where a segment (or segments) were associated with a larger segment, as described below.

Как видно из фиг. 1, возможна ситуация, в которой единственный сегмент, например Эа1, наиболее целесообразно ассоциировать с несколькими сегментами, ЭЬ1 вместе с ЭЬ3 и ЭЬ4. Чем выше частоты ассоциаций после вычитания (в соответствии с настоящим описанием) у сегментов данных, тем выше вероятность того, что сегмент системы А является эквивалентом сегмента системы В. Кроме измерения скорректированных частот по общему числу появлений, скорректированные частоты можно также измерять, например, посредством вычисления процентной доли количества раз, когда конкретные сегменты системы А соответствовали конкретным сегментам системы В. Если базу данных используют для перевода документа, то в соответствии с процедурой ассоциированный сегмент наиболее высокого ранга будет извлекаться из базы данных первым. Однако часто способ, применяемый с целью проверки сочетания ассоциированных сегментов для перевода (см. ниже), приводит к решению, что необходимо провеAs can be seen from FIG. 1, a situation is possible in which a single segment, for example Ea1, is most appropriate to associate with several segments, E1 together with E3 and E4. The higher the association frequencies after subtraction (in accordance with the present description) of the data segments, the higher the likelihood that the segment of system A is equivalent to the segment of system B. In addition to measuring the adjusted frequencies by the total number of occurrences, the corrected frequencies can also be measured, for example, by calculating the percentage of the number of times when specific segments of system A corresponded to specific segments of system B. If the database is used to translate a document, then in accordance with the procedures th associated segment of the highest rank will be retrieved from the database first. However, often the method used to verify the combination of associated segments for translation (see below) leads to the decision that

- 4 007776 рить другую ассоциацию ниже рангом, поскольку проверенную ассоциацию более высокого ранга применить нельзя. Например, если в базу данных поступает запрос на ассоциацию для Эа1. база данных даст ответ ΌΜ+Ό63+Ό64; но если ассоциацию ΌΜ+Ό63+Ό64 применить нельзя в соответствии с решением процедуры. которая правильно сочетает сегменты данных для перевода. то тогда база данных выдаст ЭЬ9+ЭЫ0 для проверки на правильность сочетания с другим ассоциированным сегментом для перевода.- 4 007776 Take another association with a lower rank, since a verified association of a higher rank cannot be applied. For example, if the database receives an association request for Ea1. the database will give the answer ΌΜ + Ό63 + Ό64; but if the association ΌΜ + Ό63 + Ό64 cannot be applied in accordance with the decision of the procedure. which correctly combines data segments for translation. then the database will give E9 + E0 to check for the correct combination with the other associated segment for the translation.

Как правило. способ создания межпонятийной базы данных в соответствии с настоящим изобретением содержит этапы анализа параллельного или сопоставимого текста и работы с ним. Способ и устройство в соответствии с настоящим изобретением используются таким образом. чтобы создавать базу данных. содержащую ассоциации по двум состояниям - точные преобразования или. конкретнее. ассоциации между понятиями. выраженными в одном состоянии. и понятиями. выраженными в другом состоянии. Ассоциации перевода и другие важные ассоциации между двумя состояниями усиливаются. т.е. становятся более частыми. с увеличением числа документов. которые подвергают анализу и обработке в соответствии с настоящим изобретением. поэтому в результате работы с достаточно большим числом «образцовых» документов выявляются наиболее общие (и. в единственном смысле. точные) ассоциации. а способ и устройство можно использовать для преобразования.Usually. A method for creating an inter-conceptual database in accordance with the present invention comprises the steps of analyzing and working with parallel or comparable text. The method and device in accordance with the present invention are used in this way. to create a database. containing associations of two states - exact transformations or. more specifically. associations between concepts. expressed in one condition. and concepts. expressed in a different state. Translation associations and other important associations between the two states are amplified. those. become more frequent. with an increase in the number of documents. which are subjected to analysis and processing in accordance with the present invention. therefore, as a result of working with a sufficiently large number of “model” documents, the most general (and, in the only sense, accurate) associations are revealed. and the method and device can be used for conversion.

В одном из вариантов осуществления настоящего изобретения два состояния представляют собой естественные языки (например. английский. иврит. китайский и т.д.). и поэтому в соответствии с настоящим изобретением создается межъязыковая база данных. приводящая слова и словосочетания на одном языке в соответствие их переводным эквивалентам на другом языке. Словосочетания можно определить как группы последовательно расположенных смежных слов. часто со знаками препинания и любыми другими знаками. применяемыми для выражения мысли в языке. В данном варианте в соответствии с настоящим изобретением создают базу данных посредством анализа документов на двух языках и создания базы данных переводов для каждого повторяющегося слова или словосочетания на обоих языках. Однако настоящее изобретение не ограничивается переводом с одного языка на другой язык. Настоящее изобретение дает пользователю возможность создавать базу данных понятий и ассоциировать данные понятия с другими понятиями. с иерархическим различением понятий. Следовательно. понятия ассоциируют с другими понятиями и классифицируют по частоте появления. Удельный вес. придаваемый частоте появления. и область применения базы данных. созданной вышеописанным способом. могут изменяться в зависимости от потребностей пользователя.In one embodiment of the present invention, the two conditions are natural languages (e.g., English, Hebrew, Chinese, etc.). and therefore, in accordance with the present invention, a multilingual database is created. bringing words and phrases in one language into line with their translated equivalents in another language. Phrases can be defined as groups of consecutive adjacent words. often with punctuation marks and any other characters. used to express thoughts in language. In this embodiment, in accordance with the present invention, a database is created by analyzing documents in two languages and creating a translation database for each repeating word or phrase in both languages. However, the present invention is not limited to translation from one language into another language. The present invention enables the user to create a database of concepts and associate these concepts with other concepts. with hierarchical distinction of concepts. Consequently. concepts are associated with other concepts and classified by frequency of occurrence. Specific gravity. attached to the frequency of occurrence. and the scope of the database. created by the above method. may vary depending on the needs of the user.

Например. применительно к переводу текста с одного языка на другой язык действие настоящего изобретения будет заключаться в создании языковых переводов слов и словосочетаний с английского языка на китайский язык и наоборот. В соответствии с настоящим изобретением будут выдаваться оценки ранга ассоциаций между словами и словосочетаниями в двух языках. Если образец достаточно велик. то встречающееся слово или словосочетание. чаще всего. будет одним из китайских эквивалентов английского слова или словосочетания. Однако настоящее изобретение будет также выдавать другие ассоциации на китайском языке для английских слов или словосочетаний. и пользователь сможет работать с этими ассоциациями по своему усмотрению. Например. в ответ на слово «гора» (тоип(шп) при обработке в соответствии с настоящим изобретением может быть выдан список китайских слов и словосочетаний на анализируемом языке. Китайским языковым эквивалентам слова «гора» (тоип!ат). вероятнее всего. будет присвоен самый высокий ранг; однако. в соответствии с настоящим изобретением будут выданы и другие слова или словосочетания на иностранном языке. ассоциированные со словом «гора» (тоип(ат). например «снег» (кпоте). «лыжи» (кк1). «опасный спорт» (а баидетоик крой). «высочайшая точка на земле» ((Не Ыдйек! рош( щ (Не \\όγ16) или «гора Эверест» (Μΐ. Еуетей). Пользователь сможет по своему усмотрению работать с этими словами и словосочетаниями. которые. вероятно. будут классифицированы ниже рангом. чем переводы слова «гора» (тоип(аш). В соответствии с вышеизложенным настоящее изобретение представляет собой автоматизированный создатель ассоциативной базы данных. Наиболее сильные ассоциации соответствуют «переводам» или «преобразованиям» в единственном смысле. а другие частые (но менее сильные) ассоциации отражают понятия. которые тесно связаны с анализируемым понятием. Поэтому базы данных могут. например. применяться широко известными в технике системами. использующими методы искусственного интеллекта. В настоящее время указанные системы используют неполные. созданные вручную базы данных понятий или онтологии в качестве «нейронных сетей» для решения прикладных задач. Упомянутые базы данных ассоциированных понятий для использования в приложениях искусственного интеллекта можно построить с использованием любого заданного пользователем интервала в документе на одном языке.For example. with regard to the translation of text from one language to another language, the effect of the present invention will be to create language translations of words and phrases from English into Chinese and vice versa. In accordance with the present invention, rank ratings of associations between words and phrases in two languages will be issued. If the sample is large enough. that is a word or phrase. often. will be one of the Chinese equivalents of an English word or phrase. However, the present invention will also produce other associations in Chinese for English words or phrases. and the user will be able to work with these associations as he sees fit. For example. in response to the word “mountain” (toyp (shp)), when processed in accordance with the present invention, a list of Chinese words and phrases in the analyzed language can be given. Chinese language equivalents of the word “mountain” (toyp! at). Most likely, the most high rank; however, in accordance with the present invention, other words or phrases in a foreign language will be issued associated with the word "mountain" (toyp (at). For example, "snow" (kpote). "skiing" (kk1). "dangerous sport "(and baidetoik cut)." the highest point on earth "((Not Ydyek! rosh (u (Not \\ όγ16) or “Mount Everest” (Μΐ. Euovey). The user will be able to discretely work with these words and phrases that are likely to be ranked lower than translations of the word “mountain” (toip ( a) In accordance with the foregoing, the present invention is an automated creator of an associative database, the most powerful associations being “translations” or “transformations” in a single sense. and other frequent (but less powerful) associations reflect concepts. which are closely related to the analyzed concept. Therefore, databases can. eg. used by systems well known in the art. using artificial intelligence methods. Currently, these systems use incomplete. manually created databases of concepts or ontologies as "neural networks" for solving applied problems. Mentioned databases of associated concepts for use in artificial intelligence applications can be constructed using any user-defined interval in a document in one language.

В соответствии с другим вариантом осуществления настоящего изобретения применяется вычислительное устройство. например компьютерная система на базе широкодоступного персонального компьютера известного типа. Хотя вычислительное устройство обычно представляет собой обычный персональный компьютер (автономный или работающий в сетевой среде). предполагается также возможность применения других вычислительных устройств. например персональных цифровых информационных устройств (ΡΌΑ). беспроводных устройств. серверов. больших ЭВМ и т.п. Однако способ и устройство в соответствии с настоящим изобретением не нуждаются в применении упомянутых вычислительных устройств и допускают возможность простой реализации другими средствами. в том числе созданием вручIn accordance with another embodiment of the present invention, a computing device is used. for example, a computer system based on a widely available personal computer of a known type. Although the computing device is usually a regular personal computer (stand-alone or working in a network environment). the possibility of using other computing devices is also contemplated. e.g. personal digital information devices (ΡΌΑ). wireless devices. servers. large computers, etc. However, the method and device in accordance with the present invention do not need to use the mentioned computing devices and allow the possibility of simple implementation by other means. including the creation of hand

- 5 007776 ную перекрестных ассоциаций. Способ, в соответствии с которым осуществляют анализ последовательных документов с целью расширения фонда «образцовых» документов и создают перекрестноассоциативную базу данных, характеризуется разнообразием, а именно, документы можно вводить для анализа и обработки вручную, с использованием автоматической подачи (например, известными в технике автоматическими загрузчиками бумаги) или с использованием поисковых «агентов» сети 1Щегпек, например ШеЬ СгаМегз, для автоматического выбора соответствующих документов.- 5 007776 cross-associations. The method according to which the analysis of sequential documents is carried out in order to expand the collection of “model” documents and creates a cross-associative database is characterized by a variety, namely, documents can be entered for analysis and processing manually, using automatic feeding (for example, automatic paper loaders) or using the search "agents" of the 1Schegpek network, for example, Shel SgaMegs, to automatically select the appropriate documents.

Следует отметить, что настоящее изобретение допускает создание ассоциативной базы данных посредством анализа сопоставимого текста, помимо (или даже вместо) параллельного текста. Далее, способ предусматривает совместный просмотр всех доступных документов при поиске повторяющегося слова или словосочетания в языке.It should be noted that the present invention allows the creation of an associative database by analyzing comparable text, in addition to (or even instead of) parallel text. Further, the method provides for a joint viewing of all available documents when searching for a repeating word or phrase in a language.

Построение базы данныхBuilding a database

В соответствии с настоящим изобретением анализируют документы с целью построения базы данных. После ввода документа (опять же, пары документов, представляющих один и тот же текст на двух разных языках) начинается процедура создания, использующая способы и/или устройства, указанные в настоящем описании.In accordance with the present invention, documents are analyzed to build a database. After entering the document (again, a pair of documents representing the same text in two different languages), the creation procedure begins using the methods and / or devices specified in the present description.

Предположим для иллюстрации, что документы имеют идентичный контент (или, в общем смысле, понятия) на двух разных языках.For illustration, suppose documents have identical content (or, in a general sense, concepts) in two different languages.

Документ А составлен на языке А, документ В составлен на языке В. Документы имеют следующий текст:Document A is written in language A, document B is written in language B. Documents have the following text:

Документ А (язык А) Document A (language A) Документ В (язык В) Document B (language B) ΧΥΖΧΜνΥΖΧΖ ΧΥΖΧΜνΥΖΧΖ АА ВВ СС АА ЕЕ ЕЕ 6С СС AA BB SS AA EE EE 6C SS

Первый этап по настоящему изобретению заключается в том, что вычисляют интервал слова, чтобы определить приближенное местоположение возможных ассоциаций к любому заданному слову или словосочетанию. Поскольку один лишь межъязыковый дословный анализ не обеспечит получение полезного результата (например, слово 1 в документе А часто не существует как буквальный перевод слова 1 в документе В), а предложение на одном языке, по своей структуре, может содержать эквивалентное понятие в другом месте (или в последовательности) предложения по отношению к предложению на другом языке, то процедура создания базы данных по настоящему изобретению состоит в том, что ассоциируют каждое слово или словосочетание на первом языке со всеми словами и словосочетаниями, найденными в выбранном интервале документа на втором языке. Указанный подход важен также по той причине, что в одном языке понятия часто выражаются с использованием более или менее длинных словосочетаний, чем в другом языке. Интервал определяют посредством анализа двух документов и используют для сравнения слов и словосочетаний второго документа со словами и словосочетаниями первого документа. А именно, интервал слов или словосочетаний во втором документе анализируют как возможные ассоциации к каждому слову или словосочетанию в первом документе. При проверке по интервалу в соответствии с процедурой создания базы данных определяют количество слов или словосочетаний второго языка, которые могут отождествляться и переводиться словами или словосочетаниями первого языка.The first step of the present invention is that the word spacing is calculated to determine the approximate location of possible associations to any given word or phrase. Since interlanguage literal analysis alone will not provide a useful result (for example, word 1 in document A often does not exist as a literal translation of word 1 in document B), and a sentence in one language, by its structure, may contain an equivalent concept in another place ( or in the sequence of sentences in relation to a sentence in another language, the procedure for creating a database of the present invention is that each word or phrase in the first language is associated with all words and a word readings found in the selected interval of the document in the second language. This approach is also important for the reason that in one language, concepts are often expressed using more or less long phrases than in another language. The interval is determined by analyzing two documents and is used to compare the words and phrases of the second document with the words and phrases of the first document. Namely, the spacing of words or phrases in the second document is analyzed as possible associations to each word or phrase in the first document. When checking by interval in accordance with the procedure for creating a database, the number of words or phrases of the second language is determined, which can be identified and translated by words or phrases of the first language.

Существуют две характеристики, которые необходимо определить, чтобы задать в документе на втором языке интервал, в котором следует искать ассоциации к любому заданному слову или словосочетанию из документа на первом языке. Первой характеристикой является величина или размер интервала во втором документе, при этом упомянутая величина или размер измеряется числом слов в интервале. Второй характеристикой является местоположение интервала во втором документе, при этом упомянутое местоположение измеряется положением средней точки интервала. Обе характеристики задаются пользователем, однако, ниже предложены примеры предпочтительных вариантов осуществления. При определении размера и местоположения интервала необходимо добиваться высокой вероятности того, что интервал будет содержать перевод на второй язык слова или словосочетания из анализируемого сегмента на первом языке.There are two characteristics that must be defined in order to specify in the second language document the interval in which to search for associations to any given word or phrase from the first language document. The first characteristic is the size or size of the interval in the second document, wherein said value or size is measured by the number of words in the interval. The second characteristic is the location of the interval in the second document, wherein said location is measured by the position of the midpoint of the interval. Both characteristics are user defined, however, examples of preferred embodiments are provided below. When determining the size and location of the interval, it is necessary to achieve a high probability that the interval will contain a translation into the second language of the word or phrase from the analyzed segment in the first language.

Для определения размера или величины интервала можно применить разные методы, включая общеизвестные статистические методы, например расчет графика нормального распределения по числу слов в документе. При использовании статистических методов, например графика нормального распределения, интервал в начале и конце документа будет меньше, чем интервал в середине документа. Колоколообразный частотный график, характеризующий интервал, позволяет выполнять допустимую экстраполяцию перевода, независимо от того, получен ли он, исходя из абсолютного числа слов в документе или из определенного процента слов в документе. Существуют другие способы вычисления интервала, например «ступенчатый» метод, в соответствии с которым существует интервал одного уровня для определенной процентной части слов, второго более высокого уровня для другой процентной части слов и третьего уровня, равного первому уровню, для последней процентной части слов. И вновь, пользователь может задавать или устанавливать все характеристики интервала в зависимости от других возможных параметров с целью выявления полезных ассоциаций к анализируемому слову или словосочетанию наVarious methods can be used to determine the size or size of the interval, including well-known statistical methods, for example, calculating a graph of the normal distribution by the number of words in a document. When using statistical methods, such as a normal distribution graph, the interval at the beginning and end of the document will be less than the interval in the middle of the document. The bell-shaped frequency graph characterizing the interval allows an acceptable extrapolation of the translation, regardless of whether it is obtained on the basis of the absolute number of words in the document or from a certain percentage of words in the document. There are other methods for calculating the interval, for example, a “stepwise” method, according to which there is an interval of one level for a certain percentage of words, a second higher level for another percentage of words and a third level equal to the first level for the last percentage of words. And again, the user can set or set all the characteristics of the interval depending on other possible parameters in order to identify useful associations to the analyzed word or phrase on

- 6 007776 первом языке.- 6 007776 first language.

Местоположение интервала в документе на втором языке может зависеть от результата сравнения количеств слов в двух документах. Что следует квалифицировать как документ, предназначенный для определения местоположения интервала, задается пользователем, например таким документом могут быть новые статьи, книжные главы и любые другие дискретно идентифицируемые элементы контента, состоящие из нескольких сегментов данных. Если количества слов в двух документах приблизительно равны, то местоположение интервала в документе на втором языке будет приблизительно совпадать с местоположением анализируемого слова или словосочетания в документе на первом языке. Если количества слов в двух документов не равны, то точное местоположение интервала можно определить из соотношения. Например, если документ А содержит 50 слов, а документ В содержит 100 слов, то соотношение между двумя документами равно 1:2. Серединой документа А является позиция слова 25. Если в документе А анализируют слово 25, то использование данной средней точки (позиция слова 25) в качестве местоположения середины интервала в документе В будет неэффективным решением, поскольку данная позиция (позиция слова 25) не является серединой документа В. Вместо этого, середину интервала в документе В для анализа слова 25 в документе А можно определить из отношения между количествами слов в двух документах (т.е. 25х2/1=50), размещением вручную в середине документа В или другими методами.The location of an interval in a document in a second language may depend on the result of comparing the number of words in the two documents. What should be qualified as a document intended for determining the location of an interval is set by the user, for example, such a document may be new articles, book chapters, and any other discretely identifiable content elements consisting of several data segments. If the number of words in two documents is approximately equal, then the location of the interval in the document in the second language will approximately coincide with the location of the analyzed word or phrase in the document in the first language. If the number of words in the two documents is not equal, then the exact location of the interval can be determined from the ratio. For example, if document A contains 50 words and document B contains 100 words, then the ratio between the two documents is 1: 2. The middle of document A is the position of word 25. If word 25 is analyzed in document A, then using this midpoint (position of word 25) as the location of the middle of the interval in document B will be an ineffective solution, since this position (position of word 25) is not the middle of the document B. Instead, the middle of the interval in document B for analyzing the word 25 in document A can be determined from the relationship between the number of words in the two documents (i.e. 25x2 / 1 = 50), manual placement in the middle of document B, or other methods.

При рассмотрении позиций слов или словосочетаний в документе и выявлении всех слов или словосочетаний, которые попадают в вышеуказанный интервал, процедура создания базы данных в соответствии с настоящим изобретением выдает возможный набор слов или словосочетаний в документе на втором языке, которые могут переводиться каждым словом или словосочетанием в анализируемом первом документе. Когда применяют способ создания базы данных в соответствии с настоящим изобретением, набор слов и словосочетаний, которые соответствуют условиям пригодности в качестве возможных переводов, будет сужаться по мере роста частот ассоциаций. Следовательно, после анализа пары документов по настоящему изобретению будут формироваться частоты ассоциаций слов и словосочетаний на одном языке со словами или словосочетаниями на втором языке. После того как в соответствии с настоящим изобретением будет проанализировано несколько пар документов (и, следовательно, создан большой образец), процедура создания межъязыковой ассоциативной базы данных будет выдавать все более высокие частоты ассоциаций к любому слову или словосочетанию. После получения достаточно большого образца ассоциации с самыми высокими частотами дают вероятные переводы; при этом, конечно, предельное значение, при достижении которого частотой ассоциации полагают, что перевод является точным, задается пользователем и зависит от других способов перевода (например, способов, описанных в предварительной заявке № 60/276107 на патент США, поданной 16 марта 2001г., озаглавленной Ме11юб апб Аррата1и8 ίοτ Сои1еи1 Машри1а1юи и включенной в настоящее описание путем ссылки).When considering the positions of words or phrases in a document and identifying all words or phrases that fall within the above interval, the database creation procedure in accordance with the present invention provides a possible set of words or phrases in a second language document that can be translated by each word or phrase into analyzed first document. When applying the method of creating a database in accordance with the present invention, the set of words and phrases that meet the conditions of suitability as possible translations will narrow as the frequencies of associations increase. Therefore, after analyzing a pair of documents of the present invention, the frequencies of associations of words and phrases in one language with words or phrases in a second language will be formed. After several pairs of documents have been analyzed in accordance with the present invention (and therefore a large sample has been created), the procedure for creating an interlanguage associative database will produce ever higher association frequencies for any word or phrase. After obtaining a sufficiently large sample, associations with the highest frequencies give probable translations; while, of course, the limit value, upon reaching which the association frequency is believed to be accurate, is set by the user and depends on other translation methods (for example, the methods described in provisional application No. 60/276107 for US patent filed March 16, 2001 entitled Me11yub apb Arrata1i8 ίοτ Soi1ei1 Mashri1a1yui and incorporated herein by reference).

Согласно вышеприведенному описанию в соответствии с настоящим изобретением проверяются не только слова, но и словосочетания (множества слов). Ранее упоминалось, что словосочетания содержат все знаки пунктуации и знаки в порядке их появления. После окончания анализа одного слова в первом языке в соответствии с процедурой создания базы данных по настоящему изобретению выполняется анализ двухсловного словосочетания, затем трехсловного словосочетания и т. д. с пошаговым наращиванием. Указанная процедура дает возможность выполнять перевод слов или словосочетаний одного языка, которые переводятся в более короткие или длинные словосочетания (или слова) другого языка, что часто имеет место. Если слово или словосочетание появляется только 1 раз во всех имеющихся документах на первом языке, то процедура немедленно переходит к анализу следующего слова или словосочетания, на котором снова выполняется цикл анализа. Анализ прекращается после того, как выполняется анализ всех слов или словосочетаний, которые появляются в первом языке несколько раз во всем имеющемся параллельном и сопоставимом тексте.According to the above description, in accordance with the present invention, not only words are checked, but also phrases (multiple words). It was previously mentioned that phrases contain all punctuation marks and signs in the order in which they appear. After the analysis of one word in the first language is completed, in accordance with the procedure for creating the database of the present invention, an analysis of a two-word collocation is performed, then a three-word collocation, etc. with incremental building-up. This procedure makes it possible to translate words or phrases in one language, which are translated into shorter or longer phrases (or words) in another language, which often takes place. If a word or phrase appears only 1 time in all available documents in the first language, the procedure immediately proceeds to the analysis of the next word or phrase, in which the analysis cycle is performed again. The analysis stops after the analysis of all words or phrases that appear in the first language several times in all available parallel and comparable text is performed.

В определенном смысле, можно объединить любое число документов и обрабатывать их как один документ с целью поиска повторяющихся слов или словосочетаний. По существу, чтобы слово или словосочетание не повторялось, оно должно появляться только 1 раз во всем имеющемся параллельном или сопоставимом тексте. Кроме того, возможен еще один вариант осуществления, по которому можно анализировать интервал, соответствующий каждому слову и словосочетанию, независимо от того, появляется ли оно или нет более 1 раза во всем сопоставимом и параллельном тексте. В соответствии с другим вариантом осуществления базу данных можно строить путем выделения конкретных слов и словосочетаний, которые входят в запрос. Когда для перевода вводят слова и словосочетания, то в соответствии с настоящим изобретением поиск неоднократно появляющихся слов или словосочетаний может выполняться в межъязыковых документах, хранящихся в памяти и еще не анализированных, поиском межъязыкового текста в сети 1и1етие1 с использованием «агентов» поиска в \УеЬ и других поисковых механизмов и, в конечном счете, обращением к пользователю с запросом вставить недостающую ассоциацию на основании результатов анализа запроса и из-за отсутствия достаточного межъязыкового материала.In a certain sense, you can combine any number of documents and process them as one document in order to find duplicate words or phrases. Essentially, so that a word or phrase does not repeat itself, it should appear only 1 time in all available parallel or comparable text. In addition, another embodiment is possible, according to which it is possible to analyze the interval corresponding to each word and phrase, regardless of whether it appears or not more than 1 time in all comparable and parallel text. In accordance with another embodiment, the database can be built by highlighting specific words and phrases that are included in the query. When words and phrases are entered for translation, in accordance with the present invention, the search for repeatedly appearing words or phrases can be performed in interlanguage documents stored in memory and not yet analyzed, by searching for interlanguage text in the network 1 and 1 through 1 using the “agents” of the search in other search engines and, ultimately, by asking the user to insert the missing association based on the results of the analysis of the query and due to the lack of a sufficient cross-language mother la.

В соответствии с вышеизложенным настоящее изобретение работает таким образом, чтобы анализировать словосочетания в зависимости от правильности размещения слов (в данном словосочетании), и может работать так, чтобы учитывать контекст выбираемого слова, а также такие грамматические осоIn accordance with the foregoing, the present invention works in such a way as to analyze phrases depending on the correct placement of words (in this phrase), and can work so as to take into account the context of the selected word, as well as such grammatical features

- 7 007776 бенности, как построение фраз, стиль или сокращения. Эти ассоциации к словосочетаниям полезны также при использовании способа перевода с двойным перекрытием, которому соответствует нижеописанная процедура перевода.- 7 007776 of disability, like the construction of phrases, style or abbreviations. These associations to phrases are also useful when using the double overlap translation method, which corresponds to the translation procedure described below.

Следует отметить, что настоящее изобретение способно работать, когда поднабор слов или словосочетаний, принадлежащий более длинному словосочетанию, постоянно выдается как ассоциация к более длинному словосочетанию. В соответствии с настоящим изобретением такие конфигурации учитываются посредством обработки частот выдачи. Например, имена собственные иногда приводят полностью (например, «Джон Доу» ('ЭоНп Эое)), но с использованием в полном имени сокращения имени или фамилии («Джон» (ΙοΗη) или «Доу» (Эое)) либо с другим сокращением («г-н Доу» (Мг. Эое)). Поскольку настоящее изобретение, вероятнее всего, будет выдавать отдельные слова, а не словосочетания (т.е. будет чаще выдавать имя или фамилию, чем словосочетание «Джон Доу» (1ойп Эое) полного имени), потому что слова, которые составляют словосочетание, неизбежно будут подсчитываться отдельно, а также как часть фразы, то будет применяться механизм изменения ранга. Например, в любом документе словосочетание «Джон Доу» (1ойп Эое) может появиться 100 раз, имя «Джон» (1ойп) само по себе или в составе словосочетания «Джон Доу» (1ойп Эое) может появиться 120 раз, а фамилия «Доу» (Эое) само по себе или в составе словосочетания «Джон Доу» (1ойп Эое) может появиться 110 раз. В нормальном режиме выдачи перевода (в соответствии с настоящим изобретением) «Джон» (1ойп) будет иметь ранг выше, чем «Доу» (Эое), а оба данных слова будут иметь ранг выше, чем словосочетание «Джон Доу» (1ойп Эое), при осуществлении всех попыток анализа словосочетания «Джон Доу» (1ойп Эое). Вычитание числа появлений более длинного словосочетания из числа появлений поднабора (или отдельных выдаваемых результатов) позволяет добиться надлежащего упорядочивания (хотя для получения аналогичного результата, конечно, можно применить другие способы). Следовательно, вычитание 1 сотни (числа появлений словосочетания «Джон Доу» (1ойп Эое)) из 120 (число появлений слова «Джон» (1ойп)) дает точный результат для слова «Джон» (1ойп), равный 20. Применение данного анализа дает число появлений, равное 100, для словосочетания «Джон Доу» (1ойп Эое) (при анализе и попытке перевести данное словосочетание), 20 для слова «Джон» (1ойп) и 10 для словосочетания «Доу» (Эое), и таким образом обеспечивает создание правильных ассоциаций.It should be noted that the present invention is able to work when a subset of words or phrases belonging to a longer collocation is constantly issued as an association to a longer collocation. In accordance with the present invention, such configurations are taken into account by processing output frequencies. For example, proper names sometimes give in full (for example, “John Doe” ('EoNp Eoe)), but using the full name of the abbreviation of the first or last name (“John” (ΙοΗη) or “Dow” (Eoe)) or with another abbreviation (“Mr. Dow” (Mg. Eoe)). Since the present invention is more likely to produce single words rather than phrases (that is, it will more often give out a first or last name than the phrase “John Doe” (1oyp Eoe) of the full name), because the words that make up the phrase are inevitable If they are counted separately, and also as part of the phrase, then the mechanism of changing the rank will be applied. For example, in any document, the phrase “John Doe” (1oyp Eoe) may appear 100 times, the name “John” (1oyp) by itself or in the phrase “John Doe” (1oyp Eoe) can appear 120 times, and the last name “Dow "(Eoe) by itself or as part of the phrase" John Doe "(1st Eoe) can appear 110 times. In the normal mode of issuing a translation (in accordance with the present invention), “John” (1oyp) will have a rank higher than “Dow” (Eoe), and both of these words will have a rank higher than the phrase “John Dow” (1oyp Eoe) , in the implementation of all attempts to analyze the phrase "John Doe" (1oyp Eoe). Subtracting the number of occurrences of a longer phrase from the number of occurrences of a subset (or individual output results) allows for proper ordering (although, of course, other methods can be used to obtain a similar result). Therefore, subtracting 1 hundred (the number of occurrences of the phrase “John Doe” (1oip Eoe)) from 120 (the number of occurrences of the word “John” (1oip)) gives an accurate result for the word “John” (1oip), equal to 20. Using this analysis gives the number of appearances equal to 100 for the phrase “John Doe” (1oyp Eoe) (when analyzing and trying to translate this phrase), 20 for the word “John” (1oyp) and 10 for the phrase “Dow” (Eoe), and thus provides creating the right associations.

Следует также отметить, что упомянутая проблема не ограничена именами собственными и часто возникает в общих фразах и многих разных контекстах. Например, каждый раз при переводе словосочетания «Я люблю Вас» (I 1оуе уои) в качестве наиболее часто ассоциируемого с ним словосочетания на другом языке возможно независимое ассоциирование слова к слову «любить» (1оуе) в упомянутом другом языке. Кроме того, когда словосочетание переводят по другому в другом анализируемом тексте, то вновь возможно ассоциирование слова «любить» (1оуе). Это будет искажать анализ и приводить к выдаче слова «любить» (1оуе) на втором языке вместо словосочетания «Я люблю Вас» (I 1оуе уои) на втором языке в качестве перевода словосочетания I 1оуе уои с первого языка. Поэтому система вновь вычитает число появлений ассоциаций к более длинному словосочетанию из частоты ассоциаций ко всем остальным поднаборам при определении ранга ассоциаций к более длинному словосочетанию. Данные принципы отражены также на фиг. 1.It should also be noted that the problem mentioned is not limited to proper names and often arises in common phrases and many different contexts. For example, each time you translate the phrase “I love you” (I 1st uey) as the most often associated phrase in another language, it is possible to independently associate the word with the word “love” (1ye) in the said other language. In addition, when the phrase is translated differently in another text to be analyzed, then again the association of the word “love” is possible (1ye). This will distort the analysis and lead to the output of the word “love” (1oue) in the second language instead of the phrase “I love you” (I 1oue uoy) in the second language as a translation of the phrase I 1oue uoy from the first language. Therefore, the system again subtracts the number of occurrences of associations to a longer collocation from the frequency of associations to all other subsets when determining the rank of associations to a longer collocation. These principles are also reflected in FIG. one.

Кроме того, в базу данных можно заложить инструкцию игнорировать общие слова типа личного местоимения ίΐ, неопределенных артиклей ап и а, предлога о£, наречия аз, предлога ш и т.п. или любых общих слов при подсчете частот ассоциаций к словам или словосочетаниям. Такой подход обеспечит более точное отражение истинных численных значений частот ассоциаций, которые в другом случае будут искажаться из-за множества общих слов, появляющихся в составе любого данного интервала. Данное решение позволяет процедуре создания ассоциативной базы данных по настоящему изобретению не допускать искажения анализа из-за общих слов, причем без излишних вычислений необходимых вычитаний. Следует отметить, что, если данные или любые другие общие слова не «вычитать» из ассоциативной базы данных, они в конечном итоге, все равно, не будут приняты для перевода, если не будут уместными, потому что их отвергнет процедура с двойным перекрытием, подробное описание которой приведено ниже.In addition, you can put instructions in the database to ignore common words such as the personal pronoun ίΐ, the indefinite articles ap and a, the preposition о £, the adverb az, the preposition w, etc. or any common words when counting the frequencies of associations to words or phrases. This approach will provide a more accurate reflection of the true numerical values of the frequencies of associations, which in another case will be distorted due to the set of common words that appear in any given interval. This solution allows the procedure for creating an associative database of the present invention to prevent distortion of the analysis due to common words, and without unnecessary calculations of the necessary subtractions. It should be noted that if the data or any other common words are not “subtracted” from the associative database, they ultimately will not be accepted for translation anyway unless they are appropriate because they will be rejected by the double-overlap procedure, detailed the description of which is given below.

Следует отметить возможность выполнения других вычислений с целью корректировки частот ассоциаций с тем, чтобы обеспечить точное отражение числа совместных появлений слов или словосочетаний. Например, ввод поправки, исключающей двойной подсчет, возможно, был бы целесообразен в ситуации перекрытия интервалов анализируемых слов. Ввод поправок желателен в данных случаях для того, чтобы составить более точные частоты ассоциаций. Ниже рассмотрен типичный вариант осуществления способа и устройства для создания и дополнения межпонятийной базы данных в соответствии с настоящим изобретением на основе двух документов, ранее использованных в качестве примера; причем далее восстановлена таблица, содержащая упомянутые документы.It should be noted that other calculations can be performed to adjust the frequencies of associations in order to accurately reflect the number of joint occurrences of words or phrases. For example, the introduction of an amendment excluding double counting, perhaps, would be appropriate in a situation of overlapping intervals of the analyzed words. The introduction of corrections is desirable in these cases in order to make more accurate association frequencies. The following is a typical embodiment of a method and apparatus for creating and supplementing an inter-conceptual database in accordance with the present invention based on two documents previously used as an example; and further restored the table containing the above documents.

Таблица 1Table 1

Документ А (язык А) Document A (language A) Документ В (язык В) Document B (language B) ΧΥΖΧΝνΥΖΧΖ ΧΥΖΧΝνΥΖΧΖ АА ВВ СС АА ЕЕ ГЕ ОС СС AA BB SS AA EE GE OS SS

- 8 007776- 8 007776

Следует еще раз отметить, что, хотя в соответствии с настоящим вариантом осуществления изобретения поиск повторяющихся слов и словосочетаний осуществляется только в одном документе, данная процедура представлена лишь для иллюстрации. Анализ повторяющихся слов и словосочетаний будет выполняться с использованием всей совокупности параллельных и сопоставимых текстов.It should be noted once again that, although in accordance with the present embodiment of the invention, the search for duplicate words and phrases is carried out in only one document, this procedure is presented only for illustration. An analysis of repeated words and phrases will be performed using the entire set of parallel and comparable texts.

При использовании двух вышеуказанных документов (документа А на первом языке и документа В на втором языке) процедура создания базы данных содержит следующие этапы.When using the two above documents (document A in the first language and document B in the second language), the procedure for creating a database contains the following steps.

Этап 1.Stage 1

Во-первых, определяются размер и местоположение интервала. Выше указано, что размер и местоположение могут быть заданы пользователем или приближенно определены разными способами. Количества слов в обоих документах приблизительно равны (10 слов в документе А, 8 слов в документе В), поэтому середину интервала целесообразно поместить в позицию, совпадающую с местоположением слова или словосочетания в документе А. (Примечание: поскольку соотношение количеств слов в документах равно 80%, то в соответствии с другим вариантом местоположение интервала можно задать на основе отношения 4/5.) В данном примере размер или значение 3 для интервала может обеспечить наилучшие результаты для аппроксимации графика нормального распределения; тогда интервал в начале и конце документа будет равен (+/-)1, а в середине документа - (+/-)2. Однако в соответствии с вышеизложенным интервал (или способ, используемый для определения интервала) может быть задан только пользователем.Firstly, the size and location of the interval are determined. It is indicated above that the size and location can be set by the user or approximately determined in different ways. The number of words in both documents is approximately equal (10 words in document A, 8 words in document B), so it is advisable to place the middle of the interval in a position that matches the location of a word or phrase in document A. (Note: since the ratio of the number of words in documents is 80 %, then, in another embodiment, the location of the interval can be set based on a 4/5 ratio.) In this example, the size or value of 3 for the interval can provide the best results for approximating the normal distribution graph laziness; then the interval at the beginning and end of the document will be (+/-) 1, and in the middle of the document - (+/-) 2. However, in accordance with the foregoing, the interval (or the method used to determine the interval) can only be set by the user.

Этап 2.Stage 2.

Далее, осуществляются анализ первого слова в документе А и просмотр документа А с целью определения числа появлений данного слова в документе. В настоящем примере первым словом в документе А является X: X повторяется 3 раза в документе А, в позициях 1, 4 и 9. Номера позиций слова или словосочетания являются просто местоположением данного слова или словосочетания в документе относительно других слов. Следовательно, номера позиций соответствуют номерам слов в документе, но без учета пунктуации; например, если документ содержит 10 слов, а слово «король» (кшд) появляется дважды, то номера позиций слова «король» (кшд) являются всего лишь местами (в последовательности из 10 слов), на которых появляется данное слово.Next, the analysis of the first word in document A and viewing of document A are carried out in order to determine the number of occurrences of this word in the document. In the present example, the first word in document A is X: X is repeated 3 times in document A, at positions 1, 4, and 9. The position numbers of the word or phrase are simply the location of the word or phrase in the document relative to other words. Therefore, the position numbers correspond to the word numbers in the document, but excluding punctuation; for example, if a document contains 10 words, and the word “king” (cshd) appears twice, then the position numbers of the word “king” (cshd) are just the places (in a sequence of 10 words) on which the word appears.

Поскольку слово X появляется в документе больше 1 раза, процедура переходит к следующему этапу. Если бы слово X появилось только 1 раз, то данное слово было бы пропущено, продолжением процедуры был бы переход к следующему слову и процедура создания продолжалась бы.Since the word X appears in the document more than 1 time, the procedure proceeds to the next step. If the word X appeared only 1 time, then this word would be skipped, the continuation of the procedure would be the transition to the next word and the creation procedure would continue.

Этап 3.Stage 3.

Выдаются возможные переводы на второй язык для первого слова X в позиции 1: интервальная обработка документа В дает слова в позициях 1 и 2 (1 +/-1) в документе В: АА и ВВ (расположенные в позициях 1 и 2 документа В). Выдаются все возможные комбинации как потенциальные переводы или подходящие ассоциации к X: АА, ВВ и АА ВВ (как объединение в словосочетание). Следовательно, в ответ на X1 (первое появление слова X) выдаются АА, ВВ и АА ВВ в качестве ассоциаций.Possible translations into the second language are given for the first word X at position 1: the interval processing of document B gives the words at positions 1 and 2 (1 +/- 1) in document B: AA and BB (located at positions 1 and 2 of document B). All possible combinations are given out as potential translations or suitable associations to X: AA, BB and AA BB (as a combination into a phrase). Therefore, in response to X1 (the first occurrence of the word X), AA, BB and AA BB are issued as associations.

Этап 4.Stage 4.

Выполняется анализ следующей позиции слова X. Данное слово (Х2) появляется в позиции 4. Поскольку позиция 4 находится вблизи центра документа, интервал (установленный вышеописанным способом) будет представлен 2 словами с каждой стороны от позиции 4. Возможные ассоциации выдаются при рассмотрении слова 4 в документе В и использовании интервала (+/-)2, т. е. в результат выдаются 2 слова, находящиеся перед словом 4, и 2 слова, находящиеся после слова 4. Следовательно, в результате выдаются слова в позициях 2, 3, 4, 5 и 6. Данные позиции соответствуют словам ВВ, СС, АА, ЕЕ и ЕЕ в документе В. Учитываются все прямые перестановки из данных слов (и словосочетания, полученные их объединением). В соответствии с вышеизложенным в ответ на Х2 выдаются ВВ, СС, АА, ЕЕ, ЕЕ, ВВ СС, ВВ СС АА, ВВ СС АА ЕЕ, ВВ СС АА ЕЕ ЕЕ, СС АА, СС АА ЕЕ, СС АА ЕЕ ЕЕ, АА ЕЕ, АА ЕЕ ЕЕ и ЕЕ ЕЕ как возможные ассоциации.An analysis is made of the next position of the word X. This word (X2) appears at position 4. Since position 4 is near the center of the document, the interval (set as described above) will be represented by 2 words on each side of position 4. Possible associations are given when considering word 4 in document B and the use of the interval (+/-) 2, i.e., the result is 2 words before the word 4, and 2 words after the word 4. Therefore, the result is the words in positions 2, 3, 4, 5 and 6. These positions correspond to the words B , CC, AA, EE and EE in document B. Taking into account all direct permutation of data words (or phrases obtained by combining them). In accordance with the foregoing, in response to X2, BB, SS, AA, EE, EE, BB SS, BB SS AA, BB SS AA EE, BB SS AA EE EE, SS AA, SS AA EE, SS AA EE EE, AA are issued EE, AA EE EE and EE EE as possible associations.

Этап 5.Stage 5.

Результаты, выданные в ответ на первое появление X (в позиции 1), сличаются с результатами, выданными в ответ на второе появление X (в позиции 4), и определяются совпадения. Следует указать, что выданные результаты, которые содержат одинаковое слово или словосочетание, появляющееся в месте перекрытия двух интервалов, следует сократить до одного появления. Например, в настоящем примере в позиции 2 находится слово ВВ; данное слово выдается в ответ как на первое появление X (при интервальной обработке), так и на второе появление X (при интервальной обработке). Поскольку данная неизменная позиция слова выдается в ответ как на X1, так и на Х2, то считается, что слово появляется 1 раз. Однако если одно и то же слово выдается на участке перекрытия интервала, но с двух разных позиций слова, тогда слово подсчитывается дважды и регистрируется частота ассоциации. В данном случае результатом, выданным в ответ на слово X, является АА, поскольку данное слово (АА) появляется в обеих ассоциациях, выданных в ответ на X1 и Х2. Следует отметить, что другим словом, которое появляется в обеих выданных ассоциациях, является ВВ; но согласно вышеизложенному, поскольку данное слово является одной и той же позицией (и потому является одним и тем же словом), достигаемой в процессе интервальных обработок при первом и втором появлениях X, данное слово можно отбросить.Results issued in response to the first occurrence of X (at position 1) are compared with results issued in response to the second occurrence of X (at position 4), and matches are determined. It should be noted that the results that contain the same word or phrase appearing at the intersection of two intervals should be reduced to one occurrence. For example, in the present example, position 2 is the word BB; this word is issued in response to both the first appearance of X (during interval processing) and the second appearance of X (during interval processing). Since this constant position of the word is issued in response to both X1 and X2, it is believed that the word appears 1 time. However, if the same word is issued on the interval overlapping section, but from two different positions of the word, then the word is counted twice and the association frequency is recorded. In this case, the result issued in response to the word X is AA, since this word (AA) appears in both associations issued in response to X1 and X2. It should be noted that the other word that appears in both issued associations is BB; but according to the foregoing, since a given word is one and the same position (and therefore is one and the same word), achieved in the process of interval processing at the first and second occurrences of X, this word can be discarded.

- 9 007776- 9 007776

Этап 6.Stage 6.

Анализируется следующая позиция слова X (позиция 9) (Х3). Применение интервала (+/-)1 (вблизи конца документа) дает ассоциации в позициях 8, 9 и 10 документа В. Поскольку документ В содержит только 8 позиций, результаты усекаются и в качестве возможных значений для X выдается только слово в позиции 8: СС. (Примечание: в альтернативном варианте заданные пользователем параметры могли бы потребовать, по меньшей мере, 2 знака согласно условиям анализа, что привело бы к выдаче позиции 8 и следующей ближайшей позиции (которой является СС в позиции 7)).The following position of the word X (position 9) (X3) is analyzed. The use of the interval (+/-) 1 (near the end of the document) gives associations at positions 8, 9 and 10 of document B. Since document B contains only 8 positions, the results are truncated and only the word at position 8 is output as possible values for X: CC . (Note: in an alternative embodiment, the parameters set by the user could require at least 2 characters according to the analysis conditions, which would lead to the issuance of position 8 and the next nearest position (which is the SS in position 7)).

Сличение выданных ассоциаций к Х3 с выданными ассоциациями к XI обнаруживает отсутствие совпадений и, следовательно, отсутствие ассоциаций.Comparison of issued associations to X3 with issued associations to XI reveals the absence of matches and, consequently, the absence of associations.

Этап 7.Stage 7.

Анализируется следующее положение слова X; однако, слово X больше не появляется в документе А. С этого момента, слову X в языке А назначается частота ассоциации один (1) к слову АА в языке В.The following position of the word X is analyzed; however, the word X no longer appears in document A. From now on, the word X in language A is assigned an association frequency of one (1) to the word AA in language B.

Этап 8.Stage 8.

Поскольку слово X больше не появляется, то процедура предусматривает добавление 1 слова, после чего осуществляется проверка словосочетания. В данном случае анализируется словосочетание X Υ, т.е. первые 2 слова в документе А. Метод обработки данной фразы идентичен методу, описанному на этапах 2-7.Since the word X no longer appears, the procedure involves adding 1 word, after which the phrase is checked. In this case, the phrase X Υ is analyzed, i.e. the first 2 words in document A. The method for processing this phrase is identical to the method described in steps 2-7.

Этап 9.Stage 9.

При просмотре документа А очевидно, что словосочетание X Υ появляется в нем только 1 раз. С этого момента процедура добавления прекращается, и создания базы данных не происходит. Поскольку достигнута конечная точка процедуры, то выполняется анализ следующего слова (указанная процедура выполняется всякий раз, когда не появляются совпадения для словосочетания); в данном случае словом в позиции 2 документа А является Υ.When viewing document A, it is obvious that the phrase X Υ appears in it only 1 time. From this moment, the adding procedure is terminated and the creation of the database does not occur. Since the end point of the procedure is reached, the analysis of the next word is performed (the specified procedure is performed whenever there are no matches for the phrase); in this case, the word in position 2 of document A is Υ.

Этап 10.Stage 10.

Применение процедуры, состоящей из этапов 2-7, для обработки слова Υ дает следующий результат:Applying the procedure consisting of steps 2-7 to process the word Υ gives the following result:

слово Υ появляется дважды (в позициях 2 и 7), и потому процедура создания базы данных продолжается (и здесь, если бы Υ появилось в документе А только 1 раз, то анализ для Υ не выполнялся бы);the word Υ appears twice (at positions 2 and 7), and therefore the procedure for creating the database continues (and here, if Υ appeared in document A only 1 time, then the analysis for Υ would not be performed);

размер интервала в позиции 2 равен (+/-)1 слову;the size of the interval at position 2 is (+/-) 1 word;

интервальная обработка документа В (для позиции 2, являющейся местоположением первого появления слова Υ) выдает в результат позиции 1, 2 и 3 в документе В;interval processing of document B (for position 2, which is the location of the first occurrence of the word Υ) yields positions 1, 2 and 3 in document B as a result;

соответствующими словами на иностранном языке в указанных выданных позициях оказываются АА, ВВ и СС;corresponding words in a foreign language in the indicated issued positions are AA, BB and SS;

применение прямых перестановок дает для Υ1 следующие возможности: АА, ВВ, СС, АА ВВ, АА ВВ СС и ВВ СС;the use of direct permutations gives for Υ1 the following possibilities: AA, BB, SS, AA BB, AA BB SS and BB SS;

анализируется следующая позиция слова Υ (позиция 7);analyzes the next position of the word Υ (position 7);

размер интервала в позиции 7 равен (+/-)2 слова;the size of the interval at position 7 is (+/-) 2 words;

обработка данным интервалом документа В (в позиции 7) выдает позиции 5, 6, 7 и 8, а именно: ЕЕ ЕЕ СС и СС;processing at a given interval of document B (at position 7) gives out positions 5, 6, 7 and 8, namely: EE EE SS and SS;

все перестановки дают следующие возможности для Υ2: ЕЕ, ЕЕ, СС, СС, ЕЕ ЕЕ, ЕЕ ЕЕ СС, ЕЕ ЕЕ СС СС, ЕЕ СС, ЕЕ СС СС и СС СС;all permutations give the following possibilities for Υ2: EE, EE, SS, SS, EE Her, Her Her SS, Her Her SS SS, Her SS, Her SS SS and SS SS;

подбор совпадающих результатов из множества для Υ1 дает только одно совпадение: СС; объединение совпадений для Υ1 и Υ2 дает СС как частоту ассоциаций для Υ.the selection of matching results from the set for Υ1 gives only one coincidence: SS; combining matches for Υ1 and и2 gives the SS as the frequency of associations for для.

Этап 11.Stage 11.

Добавление в конце интервала: поскольку единственное возможное совпадение для слова Υ (слово СС) появляется в конце интервала, соответствующего первому появлению Υ (СС появилось в позиции 3 документа В), то интервал, соответствующий первому появлению, наращивается на 1, и в результате выдаются позиции 1, 2, 3 и 4: АА, ВВ, СС и АА; или следующие прямые перестановки: АА, ВВ, СС, АА ВВ, АА ВВ СС, АА ВВ СС АА, ВВ СС, ВВ СС АА и СС АА. Применение данного результата все также дает СС как возможный перевод для Υ. Следует отметить, что добавление к интервалу выполняется потому, что выданное совпадение находилось в конце интервала, соответствующего первому появлению (основному появлению для слова Υ); т.е. каждый раз, когда будет возникать данная картина, то, чтобы обеспечить полноту, будет выполняться подэтап (или альтернативный этап) добавления в конце интервала.Adding at the end of the interval: since the only possible match for the word Υ (word CC) appears at the end of the interval corresponding to the first occurrence of Υ (CC appeared at position 3 of document B), the interval corresponding to the first appearance is incremented by 1, and as a result, positions 1, 2, 3, and 4: AA, BB, SS, and AA; or the following direct permutations: AA, BB, SS, AA BB, AA BB SS, AA BB SS AA, BB SS, BB SS AA and SS AA. Applying this result also gives SS as a possible translation for Υ. It should be noted that the addition to the interval is performed because the issued match was at the end of the interval corresponding to the first occurrence (the main occurrence for the word Υ); those. each time this picture occurs, in order to ensure completeness, a sub-step (or alternative step) of addition at the end of the interval will be performed.

Этап 12.Stage 12.

Поскольку Υ больше не появляется в документе А, то в соответствии с процедурой анализа в документе А добавляется 1 слово и анализируется словосочетание Υ Ζ (добавляется следующее слово за словом Υ). Добавление следующего слова до словосочетания (Υ Ζ) и повторение процедуры дают следующий результат: словосочетание Υ Ζ дважды появляется в документе А: в позициях 2 и 7. Возможностями для Υ Ζ при первом появлении (Υ Ζ1) являются АА, ВВ, СС, АА ВВ, АА ВВ СС, ВВ СС (следует отметить, что в альтернативном варианте параметры интервала могли быть заданы таким образом, чтобы предусматривать расширение размера интервала по мере того, как словосочетания, анализируемые наSince Υ no longer appears in document A, in accordance with the analysis procedure in document A, 1 word is added and the phrase Υ Ζ is analyzed (the next word after the word Υ is added). Adding the next word to the phrase (Υ Ζ) and repeating the procedure gives the following result: the phrase Υ Ζ appears twice in document A: at positions 2 and 7. The options for Υ Ζ at the first appearance (Υ Ζ1) are AA, BB, CC, AA VV, AA VV SS, VV SS (it should be noted that in an alternative embodiment, the interval parameters could be set in such a way as to provide for an extension of the interval size as the phrases analyzed on

- 10 007776 языке А, становятся длиннее).- 10 007776 language A, become longer).

Возможностями для Υ Ζ при втором появлении (Υ Ζ2) являются ЕЕ, ЕЕ, СС, СС, ЕЕ ЕЕ, ЕЕ ЕЕ СС, ЕЕ ЕЕ СС СС, ЕЕ СС ЕЕ СС СС и СС СС.Opportunities for Υ Ζ in the second appearance (Υ Ζ2) are EE, EE, SS, SS, EE EE, ITS ITS SS, ITS ITS SS SS, ITS SS ITS SS SS and SS SS.

Поиск совпадений дает СС как возможную ассоциацию к словосочетанию Υ Ζ.Matching gives CC as a possible association to the phrase Υ Ζ.

Расширение интервала (добавление в конце интервала) дает для Υ Ζ следующие результаты: АА, ВВ, СС, АА ВВ, АА ВВ СС, АА ВВ СС АА, ВВ СС, ВВ СС АА и СС АА.Expanding the interval (adding at the end of the interval) gives the following results for Υ Ζ: AA, BB, SS, AA BB, AA BB SS, AA BB SS AA, BB SS, BB SS AA and SS AA.

Применение данных результатов все также дает СС как частоту ассоциации для словосочетания Υ Ζ. Этап 13.The application of these results also gives the SS as the association frequency for the phrase Υ Ζ. Stage 13.

Поскольку Υ Ζ больше не появляется в документе А, то в соответствии с процедурой анализа в документе А добавляется 1 слово и анализируется словосочетание Υ Ζ X (добавляется следующее слово за словом Ζ в позиции 3 в документе А). Добавление следующего слова до словосочетания (Υ Ζ X) и повторение процедуры (Υ Ζ X дважды появляется в документе А) дает следующий результат:Since Υ Ζ no longer appears in document A, in accordance with the analysis procedure in document A, 1 word is added and the phrase Υ Ζ X is analyzed (the next word is added after the word Ζ at position 3 in document A). Adding the next word to the phrase (Υ Ζ X) and repeating the procedure (Υ Ζ X appears twice in document A) gives the following result:

первому появлению Υ Ζ X соответствуют выдаваемые позиции 2, 3, 4 и 5;the first appearance of Υ Ζ X corresponds to the issued items 2, 3, 4 and 5;

перестановки имеют вид: ВВ, СС, АА, ЕЕ, ВВ СС, ВВ СС АА, ВВ СС АА ЕЕ, СС АА, СС АА ЕЕ и АА ЕЕ;permutations are of the form: BB, SS, AA, EE, BB SS, BB SS AA, BB SS AA EE, SS AA, SS AA EE and AA EE;

второму появлению Υ Ζ X соответствуют выдаваемые позиции 5, 6, 7 и 8;the second appearance of Υ Ζ X corresponds to the issued items 5, 6, 7 and 8;

перестановки имеют вид: ЕЕ, ЕЕ, СС, СС, ЕЕ ЕЕ, ЕЕ ЕЕ СС, ЕЕ ЕЕ СС СС, ЕЕ СС, ЕЕ СС СС и СС СС. сличение двух данных результатов дает СС как частоту ассоциаций для словосочетания Υ Ζ X; и вновь следует отметить, что слово ЕЕ, выданное в качестве возможной ассоциации, отбрасывается, поскольку оно в обоих случаях появляется как одно и то же слово (т. е. на той же самой позиции).permutations are of the form: EE, EE, SS, SS, EE EE, EE EE SS, EE EE SS SS, EE SS, EE SS SS and SS SS. comparing the two given results gives SS as the frequency of associations for the phrase Υ Ζ X; and again it should be noted that the word EE, issued as a possible association, is discarded, since in both cases it appears as one and the same word (i.e., in the same position).

Этап 14.Step 14

Добавление следующего слова до словосочетания (Υ Ζ X А) дает только одно появление; поэтому создание базы данных словосочетаний завершается и анализируется следующее слово: Ζ (позиция 3 в документе А).Adding the next word to the phrase (Υ Ζ X A) gives only one appearance; therefore, the creation of the database of collocations is completed and the following word is analyzed: Ζ (position 3 in document A).

Этап 15.Stage 15.

Применение вышеописанных этапов для обработки слова Ζ, которое появляется 3 раза в документе А, дает следующее:Using the above steps to process the word Ζ, which appears 3 times in document A, gives the following:

для Ζ1 выдаются следующие результаты: АА, ВВ, СС, АА, ЕЕ, АА ВВ, АА ВВ СС, АА ВВ СС АА, АА ВВ СС АА ЕЕ, ВВ СС, ВВ СС АА, ВВ СС АА ЕЕ, СС АА, СС АА ЕЕ и АА ЕЕ;for Ζ1 the following results are given: AA, BB, SS, AA, EE, AA BB, AA BB SS, AA BB SS AA, AA BB SS AA EE, BB SS, BB SS AA, BB SS AA EE, SS AA, SS AA EE and AA EE;

для Ζ2 выдаются следующие результаты: ЕЕ, СС, СС, ЕЕ СС, ЕЕ СС СС и СС СС;for Ζ2 the following results are issued: EE, SS, SS, EE SS, EE SS SS and SS SS;

сличение результатов для Ζ1 и Ζ2 дает СС как частоту ассоциаций для Ζ;comparison of the results for Ζ1 and Ζ2 gives the SS as the frequency of associations for Ζ;

для слова Ζ3 (позиция 10) нет результатов в заданном интервале. Однако, если в параметры внести дополнение, что должно существовать, по меньшей мере, одно соответствие для каждого слова или словосочетания в языке А, то в ответ на Ζ будет выдано СС;for the word Ζ3 (position 10) there are no results in the given interval. However, if an addition is made to the parameters that there must be at least one correspondence for each word or phrase in language A, then an SS will be issued in response to;;

сличение результатов для Ζ3 с результатами для Ζ1 дает СС в качестве частоты ассоциации к слову Ζ. Однако данная ассоциация не подсчитывается, так как СС в позиции 8 слова уже учтено в вышеприведенной ассоциации к Ζ2. Если перекрытие интервала потребует от процедуры дважды подсчитать появления, система может уменьшить частоту ассоциаций, чтобы точнее отразить число истинных появлений.comparing the results for Ζ3 with the results for Ζ1 gives the SS as the frequency of association to the word Ζ. However, this association is not counted, since the SS in position 8 of the word is already taken into account in the above association to Ζ2. If the overlap of the interval requires the procedure to count occurrences twice, the system can reduce the frequency of associations to more accurately reflect the number of true occurrences.

Этап 16.Stage 16.

Добавление следующего слова до словосочетания дает словосочетание Ζ X, которое дважды появляется в документе А. Обработка словосочетания Ζ X согласно вышеописанным этапам дает следующее:Adding the next word to the phrase gives the phrase Ζ X, which appears twice in document A. Processing the phrase Ζ X according to the above steps gives the following:

для Ζ X1 выдаются следующие результаты: ВВ, СС, АА, ЕЕ, ЕЕ, ВВ СС, ВВ СС АА, ВВ СС АА ЕЕ, ВВ СС АА ЕЕ ЕЕ, СС АА, СС АА ЕЕ, СС АА ЕЕ ЕЕ, АА ЕЕ, АА ЕЕ ЕЕ и ЕЕ ЕЕ;for Ζ X1 the following results are given: BB, SS, AA, EE, EE, BB SS, BB SS AA, BB SS AA EE, BB SS AA EE EE, SS AA, SS AA EE, SS AA EE EE, AA EE, AA EE EE and EE EE;

для Ζ X2 выдаются следующие результаты: ЕЕ, СС, СС, ЕЕ СС, ЕЕ СС СС и СС СС;for Ζ X2 the following results are issued: EE, SS, SS, EE SS, EE SS SS and SS SS;

сличение результатов дает ассоциацию между словосочетанием Ζ X и СС.comparison of the results gives an association between the phrase Ζ X and CC.

Этап 17.Stage 17.

Добавление следующего слова дает фразу Ζ X А. Данная фраза появляется только 1 раз, поэтому в документе А выполняется анализ следующего слова (X).Adding the next word gives the phrase Ζ X A. This phrase appears only 1 time, therefore, in document A, the analysis of the next word (X) is performed.

Этап 18.Stage 18.

Анализ слова X уже выполнялся в первой позиции. Однако вторая позиция слова X, связанная с другим документом, еще не подвергалась анализу на предмет выдачи возможных результатов для слова X. Следовательно, в данном случае, т.е. при продвижении вперед по документу, слово X (во второй позиции) обрабатывается как при первом появлении слова X:The analysis of the word X was already performed in the first position. However, the second position of the word X, associated with another document, has not yet been analyzed for possible results for the word X. Therefore, in this case, i.e. when moving forward in a document, the word X (in the second position) is processed as when the first occurrence of the word X:

для X в позиции 4 выдаются следующие результаты: ВВ, СС, АА, ЕЕ, ЕЕ, ВВ СС, ВВ СС АА, ВВ СС АА ЕЕ, ВВ СС АА ЕЕ ЕЕ, СС АА, СС АА ЕЕ, СС АА ЕЕ ЕЕ, АА ЕЕ, АА ЕЕ ЕЕ и ЕЕ ЕЕ.for X in position 4 the following results are given: BB, SS, AA, EE, EE, BB SS, BB SS AA, BB SS AA EE, BB SS AA EE EE, SS AA, SS AA EE, SS AA EE EE, AA HER, AA HER HER and HER HER.

для X в позиции 9 выдаются следующие результаты: СС.for X at position 9 the following results are returned: CC.

сличение результатов позиции 9 с результатами позиции 4 дает СС как возможное совпадение для слова X, и ему задана частота ассоциации.comparing the results of position 9 with the results of position 4 gives SS as a possible match for the word X, and it is given the frequency of association.

Этап 19.Stage 19.

Добавление следующего слова до словосочетания (поскольку при просмотре документа в прямом направлении больше не обнаруживаются появления X для сравнения со вторым появлением X) дает слоAdding the next word to the phrase (since when viewing a document in the forward direction, X appearances are no longer detected for comparison with the second occurrence of X) gives a layer

- 11 007776 восочетание X А. Однако данное словосочетание не появляется больше 1 раза в документе А, поэтому процедура переходит к анализу следующего слова (А). Слово А появляется в документе А лишь 1 раз, поэтому происходит переход на шаг, но не к следующему словосочетанию, ведь слово А появилось только однажды, а к следующему слову в документе А, слову V. Слово V появляется в документе А лишь 1 раз, поэтому выполняется анализ следующего слова (Υ). Слово Υ не появляется ни в одной другой позиции с порядковым номером больше позиции 7 в документе А, поэтому выполняется анализ следующего слова (Ζ). Слово Ζ появляется еще раз после позиции 8, а именно в позиции 10.- 11 007776 sentence X A. However, this phrase does not appear more than 1 time in document A, so the procedure proceeds to the analysis of the next word (A). The word A appears in document A only 1 time, so there is a transition to a step, but not to the next phrase, because the word A appeared only once, and to the next word in document A, the word V. The word V appears in document A only 1 time, therefore, the analysis of the next word (Υ) is performed. The word Υ does not appear in any other position with a sequence number greater than position 7 in document A, so the next word (Ζ) is analyzed. The word Ζ appears again after position 8, namely at position 10.

Этап 20.Stage 20.

Применение вышеописанной процедуры для обработки слова Ζ при втором появлении дает следующие результаты:Application of the above procedure for processing the word Ζ with the second appearance gives the following results:

для Ζ в позиции 8 выдаются следующие результаты: ОС, СС и ОС СС;for Ζ in position 8 the following results are output: OS, SS and OS SS;

для Ζ в позиции 10 выдаются следующие результаты: СС;for Ζ at position 10 the following results are output: SS;

сличение результатов в позиции 10 с результатами в позиции 8 не дает ассоциаций к слову Ζ.comparing the results in position 10 with the results in position 8 does not give associations to the word Ζ.

И вновь слово СС выдается как возможная ассоциация; но поскольку СС представляет одну и ту же позицию слова, которая достигается при анализе слова Ζ в позиции 8 и слова Ζ в позиции 10, то данная ассоциация отбрасывается.Again, the word SS is issued as a possible association; but since the SS represents the same position of the word, which is achieved by analyzing the word Ζ in position 8 and the word Ζ in position 10, this association is discarded.

Этап 21.Step 21

Добавление одного слова дает словосочетание Ζ X; но данное словосочетание больше не появляется ни в одной (в прямом направлении) позиции в документе А, поэтому процедура начинается заново на следующем слове в документе А, слове X. Слово X не появляется больше ни в одной другой (в прямом направлении) позиции документа А, поэтому процедура начинается заново. Однако достигнут конец документа А, поэтому анализ прекращается.Adding one word gives the phrase Ζ X; but this phrase no longer appears in any (forward) position in document A, so the procedure starts anew on the next word in document A, word X. The word X does not appear more in any other (forward) position of document A , so the procedure starts again. However, the end of document A has been reached, so the analysis stops.

Этап 22.Step 22

Окончательная частота ассоциации вносится в таблицу, сочетающую все результаты вышеописанной процедуры и вычитающую дублированные результаты в соответствии с описанием.The final association frequency is entered into a table combining all the results of the above procedure and subtracting the duplicate results as described.

Очевидно, объем данных не достаточен для того, чтобы выдать заключительные результаты для слов и словосочетаний в документе А. По мере того, как будет увеличиваться число пар анализируемых документов, содержащих слова и словосочетания вместе с вышепроанализированными ассоциациями, частоты ассоциаций будут становится статистически более надежными, так что взаимосвязанные слова или словосочетания в языках А и В построят сильные ассоциации для возможных переводов слов и словосочетаний.Obviously, the amount of data is not sufficient to produce final results for words and phrases in document A. As the number of pairs of analyzed documents containing words and phrases increases along with the associations analyzed above, the frequencies of the associations will become statistically more reliable. so that related words or phrases in languages A and B will build strong associations for possible translations of words and phrases.

Программа 1 (Ргодгат1), приведенная в прилагаемом листинге компьютерных программ, является примером программы, предназначенной для осуществления варианта способа создания базы данных. Программа 1 (Ргодгат1) может исполняться компьютерной системой известного в технике типа.Program 1 (Rgodgat1), given in the attached listing of computer programs, is an example of a program designed to implement a variant of the method of creating a database. Program 1 (Rgodgat1) can be executed by a computer system of a type known in the art.

Как показано, данный вариант осуществления является характерным для способа, используемого с целью создания ассоциаций. Методики в соответствии с настоящим изобретением не обязательно ограничиваются только языковым переводом. В широком смысле, данные методики будут применимы к любым двум выражениям одного и того же понятия, которые можно ассоциировать, поскольку, по своей сути, перевод на иностранный язык или с него существует просто как парная ассоциация одного и того же понятия, представленного разными словами или словосочетаниями. В соответствии с вышеизложенным настоящее изобретение может применяться для ассоциирования данных, звуков, музыки, видеоданных или любого общего представления, которое существует в форме понятия, в том числе понятий, которые могут представлять сенсорные (слуховые, визуальные, обонятельные и т.д.) ощущения. В соответствии с настоящим изобретением требуется только выполнять два варианта реализации (в языковом переводе вариантами реализации являются документы; в музыке вариантами реализации могут быть цифровые представления музыкальных партитур и звуковых частот, обозначающих одно и то же сочинение, и т. п.).As shown, this embodiment is characteristic of the method used to create associations. The methods in accordance with the present invention are not necessarily limited only to language translation. In a broad sense, these techniques will be applicable to any two expressions of the same concept that can be associated, because, in essence, a translation into or from a foreign language exists simply as a pair association of the same concept represented by different words or collocations. In accordance with the foregoing, the present invention can be used to associate data, sounds, music, video, or any general representation that exists in the form of a concept, including concepts that can represent sensory (auditory, visual, olfactory, etc.) sensations . In accordance with the present invention, it is only necessary to carry out two implementation options (in a language translation, the implementation options are documents; in music, the implementation options may be digital representations of musical scores and sound frequencies denoting the same composition, etc.).

В соответствии с другим вариантом осуществления некоторые широко известные в технике алгоритмы, основанные на правилах, можно включать в межъязыковую ассоциацию, самообучающуюся обработке определенных классов текстов, которые по контексту и смыслу являются взаимозаменяемыми (и иногда могут иметь потенциально неограниченное число производных), например имен, чисел и дат.According to another embodiment, some rule-based algorithms well known in the art can be included in an inter-lingual association learning how to process certain classes of texts that are interchangeable in context and meaning (and sometimes can have a potentially unlimited number of derivatives), such as names, numbers and dates.

Кроме того, если доступные межъязыковые документы не обеспечивают статистически значимых результатов для перевода, то пользователи могут анализировать возможные альтернативы для переводов и других ассоциаций и одобрять и классифицировать по рангам соответствующие варианты выбора.In addition, if the available interlanguage documents do not provide statistically significant results for the translation, then users can analyze possible alternatives for translations and other associations and approve and rank the corresponding selection options.

В соответствии с вышеизложенным частоты ассоциаций между словами и словосочетаниями становятся строже, по мере того, как все больше документов в форме переведенных пар подвергаются анализу с целью оценки частот ассоциаций. С увеличением числа языковых пар документов, подвергаемых анализу, способ и устройство в соответствии с настоящим изобретением начнут наполнение «выведенными ассоциациями» между языковыми парами, состоящими из таких языков, которые имеют общую ассоциацию с третьим языком, но не имеют ассоциации непосредственно между собой. Кроме того, когда переведенные документы существуют на нескольких языках, общие выданные ассоциации можно анализировать в нескольких языках, до нахождения только одной общей ассоциации между всеми языками, котоIn accordance with the foregoing, the frequencies of associations between words and phrases become stricter as more and more documents in the form of translated pairs are analyzed in order to estimate the frequencies of associations. With the increase in the number of language pairs of documents to be analyzed, the method and device in accordance with the present invention will begin filling out “derived associations” between language pairs consisting of such languages that have a common association with a third language, but do not have an association directly with each other. In addition, when translated documents exist in several languages, common issued associations can be analyzed in several languages, until only one common association is found between all languages that

- 12 007776 рая является переводом. Программа Ртодтат2, приведенная в приложении листинга компьютерных программ, является примером компьютерной программы, которая, при исполнении на компьютерной системе известного в технике типа, представляет способ, в соответствии с которым данные на упомянутых языках применяются в варианте осуществления настоящего изобретения.- 12 007776 paradise is a translation. The Rtodtat2 program shown in the computer program listing application is an example of a computer program that, when executed on a computer system of a type known in the art, represents a method in which data in the said languages are used in an embodiment of the present invention.

Кроме того, если отображениям в существующих состояниях искусственно присваивать конкретные ассоциации с частными значениями в другом состоянии и включать данные отображения в каталог базы данных, то можно производить преобразования между двумя состояниями. Например, если каждому «понятию», представленному в какой-то форме, состоянии или на каком-то языке, присваивать ассоциацию с электромагнитной волной (тоном), то будет создано «электромагнитное представление» понятия. Когда заданное число понятий закодировано соответствующими электромагнитными представлениями, данные (в форме понятия) можно преобразовывать в электромагнитные волны и мгновенно передавать с использованием обычной телекоммуникационной инфраструктуры. Когда электромагнитные волны достигают устройства, для которого они предназначены, это устройство будет синтезировать из электромагнитных волн отдельные компоненты и, с учетом ассоциаций (вместе с инструкциями по упорядочиванию, использованием метода двойного перекрытия, изложенного в настоящем описании, и/или других возможных способов), будет представлять отдельные понятия, которые были представлены в виде электромагнитных волн.In addition, if the mappings in existing states are artificially assigned specific associations with particular values in a different state and the mapping data is included in the database directory, then transformations between the two states can be performed. For example, if each “concept” represented in some form, state, or in some language is assigned an association with an electromagnetic wave (tone), then an “electromagnetic representation” of the concept will be created. When a given number of concepts is encoded with the corresponding electromagnetic representations, the data (in the form of a concept) can be converted into electromagnetic waves and transmitted instantly using conventional telecommunications infrastructure. When electromagnetic waves reach the device for which they are intended, this device will synthesize individual components from electromagnetic waves and, taking into account the associations (together with the ordering instructions, using the double overlap method described in the present description, and / or other possible methods), will represent individual concepts that were presented in the form of electromagnetic waves.

Способ и устройство для преобразования понятийMethod and device for transforming concepts

Другой аспект настоящего изобретения заключается в предложении способа и устройства для создания второго документа, содержащего данные во втором состоянии, форме или на втором языке, из первого документа, содержащего данные в первом состоянии, форме или на первом языке, и получения конечного результата, состоящего в том, что первый и второй документы отражают, по существу, те же самые понятия или информацию; при этом способ и устройство содержат межпонятийную ассоциативную базу данных. Чтобы обеспечить точное преобразование понятий из одного состояния в другое состояние, все варианты осуществления способа перевода используют метод двойного перекрытия. Напротив, известные устройства перевода работают на основе перевода отдельных слов или используют специальные, основанные на правилах коды для облегчения перевода с первого языка на второй язык. В соответствии с настоящим изобретением использование метода перекрытия позволило бы органично связывать между собой слова и словосочетания на втором языке так, чтобы они становились точным переводом с обеспечением для них правильного контекста и точного стиля, в которых данные слова и фразы записывались бы на втором языке.Another aspect of the present invention is to provide a method and apparatus for creating a second document containing data in a second state, form or in a second language, from a first document containing data in a first state, form or in a first language, and obtain an end result consisting in the fact that the first and second documents reflect essentially the same concepts or information; wherein the method and apparatus comprise an inter-conceptual associative database. To ensure the exact conversion of concepts from one state to another state, all variants of the implementation of the translation method use the double overlap method. Conversely, known translation devices operate on the basis of the translation of individual words or use special, rule-based codes to facilitate translation from the first language into the second language. In accordance with the present invention, the use of the overlap method would allow organically linking words and phrases in a second language so that they become an accurate translation, ensuring that they have the right context and exact style in which these words and phrases are written in a second language.

В соответствии с вариантом осуществления настоящего изобретения, чтобы обеспечить точный языковый перевод, сочетают способ создания базы данных и метод перекрытия. Языки могут представлять собой любой вид преобразования и не обязательно ограничиваются разговорными и письменными языками. Например, преобразование может относиться к компьютерным языкам, специальным кодовым наборам типа Л8СП и т.п. База данных является динамической; т.е. база данных расширяется по мере того, как контент вводят в систему перевода, с использованием системой перевода в процессе последовательных итераций ранее введенной информации. В соответствии с предпочтительным вариантом осуществления настоящего изобретения применяется вычислительное устройство, например компьютерная система на базе персонального компьютера известного в технике и широкодоступного типа. Однако система не нуждается в использовании упомянутого вычислительного устройства и может быть легко реализована другими средствами, включая ручное создание базы данных и способы перевода.According to an embodiment of the present invention, in order to provide accurate language translation, a database creation method and an overlap method are combined. Languages can be any kind of translation and are not necessarily limited to spoken and written languages. For example, the conversion may relate to computer languages, special code sets such as L8SP, etc. The database is dynamic; those. the database expands as content is introduced into the translation system, using the translation system in the process of successive iterations of previously entered information. According to a preferred embodiment of the present invention, a computing device is used, for example, a personal computer computer system of a type known in the art and widely available. However, the system does not need to use the aforementioned computing device and can be easily implemented by other means, including manually creating a database and translation methods.

Настоящее изобретение можно использовать с обычной компьютерной системой, содержащей, по меньшей мере, средство отображения, способ ввода и вывода и процессор. Средство отображения может представлять собой любое из широкодоступных в технике средств, например терминалы на базе электроннолучевых трубок, жидкокристаллические дисплеи, плоские индикаторные панели и т. п. Процессорное средство также может представлять собой любое из широкодоступных устройств, используемых в составе компьютерного оборудования, с условием, чтобы примененное средство позволяло компьютеру в процессе работы реализовать настоящее изобретение. И, наконец, используемый способ ввода должен допускать ввод документов с целью построения перекрестно-ассоциативной базы данных; при этом в соответствии с вышеизложенным конкретный способ ввода, предназначенный для преобразования в цифровую форму, может изменяться в зависимости от потребностей пользователя.The present invention can be used with a conventional computer system comprising at least a display means, an input and output method, and a processor. The display means may be any of the means widely available in the art, for example, cathode ray tube terminals, liquid crystal displays, flat panel displays, etc. The processor means may also be any of the widely available devices used in computer equipment, provided that so that the applied tool allows the computer in the process to implement the present invention. And finally, the input method used must allow the input of documents in order to build a cross-associative database; however, in accordance with the foregoing, a specific input method for converting to digital form may vary depending on the needs of the user.

Ручное создание базы данных и перевод с использованием метода двойного перекрытияManual database creation and translation using the double overlap method

Ниже приведено описание типичного варианта осуществления таких способа и устройства для перевода документа с первого языка на второй язык в соответствии с настоящим изобретением, в которых межъязыковая база данных создается посредством обращения к пользователю с запросами на перевод слов и словосочетаний, а также автоматического формирования переводов сегментов с использованием метода двойного перекрытия.The following is a description of a typical embodiment of such a method and apparatus for translating a document from a first language into a second language in accordance with the present invention, in which a multilingual database is created by contacting the user with requests for translating words and phrases, as well as automatically generating segment translations from using the double overlap method.

В целях описания предпочтительного варианта осуществления изобретения ниже использован пример, в котором данные на английском языке переводят в данные на иврите. Данные условия выбраны исключительно в описательных целях и не предполагают возможность ограничения выбора первого и второго языков.In order to describe a preferred embodiment of the invention, an example is used below in which data in English is translated into data in Hebrew. These conditions are selected for descriptive purposes only and do not imply the possibility of limiting the choice of the first and second languages.

- 13 007776- 13 007776

В соответствии с предпочтительным вариантом осуществления настоящего изобретения компьютерная система действует так, чтобы создавать базу данных ассоциаций между переводами с английского языка на иврит. Способ перевода содержит, по меньшей мере, следующие этапы.In accordance with a preferred embodiment of the present invention, the computer system operates to create a database of associations between translations from English into Hebrew. The translation method comprises at least the following steps.

Во-первых, данные на английском языке вводят в компьютерную систему.First, data in English is entered into a computer system.

Во-вторых, все введенные слова на английском языке сначала анализируются пословно. База данных выдаст известные переводы слов на иврит. Если перевод не содержится в базе данных, то компьютерная система будет действовать таким образом, чтобы запрашивать пользователя о вводе соответствующего перевода. Следовательно, если базе данных не известен эквивалент на иврите введенному английскому слову, то компьютер запросит пользователя предоставить соответствующий эквивалент на иврите. Тогда пользователь выдаст перевод и введет упомянутый перевод в базу данных. При последующем использовании компьютерная система будет работать с базой данных таким образом, чтобы перевод был известен в силу его ввода пользователем в предыдущий момент времени. Следовательно, на втором этапе выполняется анализ входных данных в синтаксически разобранном состоянии, например пословно, и соответствующие переводы либо выдаются (благодаря работе с базой данных), либо вводятся в базу данных.Secondly, all entered words in English are first analyzed word by word. The database will produce famous translations of words in Hebrew. If the translation is not contained in the database, the computer system will act in such a way as to prompt the user to enter the corresponding translation. Therefore, if the Hebrew equivalent of the entered English word is not known to the database, the computer will ask the user to provide the corresponding Hebrew equivalent. Then the user will issue a translation and enter the translation into the database. For subsequent use, the computer system will work with the database in such a way that the translation is known by virtue of its input by the user at a previous point in time. Therefore, at the second stage, the input data is analyzed in a syntactically parsed state, for example, word by word, and the corresponding translations are either issued (thanks to working with the database) or entered into the database.

В-третьих, выполняется анализ входных данных таким образом, чтобы дополнить синтаксически разобранные сегменты. Например, если данные сначала прошли пословный синтаксический анализ, то далее способ перевода в соответствии с настоящим изобретением анализирует входные данные посредством оценки двухсловных словосочетаний. И вновь, в соответствии с вышеописанной процедурой база данных выдает переводы двухсловных словосочетаний, если они известны; если же указанные переводы не известны, то компьютерная система действует так, чтобы запрашивать пользователя о вводе соответствующего перевода для всех возможных двухсловных словосочетаний. Затем все перекрывающиеся двухсловные сегменты записываются в базу данных. Например, если словосочетание содержит 4 слова, то база данных удостоверяется в том, записаны ли в память базы следующие сочетания: 1,2, 2,3 и 3,4. Если нет, то база данных обращается с запросом к пользователю. Следует отметить, что только специально кодированные переводы двухсловных сочетаний будут выдаваться как точные переводы, даже несмотря на то, что база данных будет обязательно содержать определение для каждого слова в силу выполнения вышеописанного второго этапа.Thirdly, the analysis of the input data is performed in such a way as to complement the syntactically parsed segments. For example, if the data first passed word-by-word parsing, then the translation method in accordance with the present invention further analyzes the input data by evaluating two-word phrases. And again, in accordance with the above procedure, the database provides translations of two-word phrases, if known; if these translations are not known, then the computer system operates in such a way as to prompt the user to enter the appropriate translation for all possible two-word phrases. Then all overlapping two-word segments are written to the database. For example, if the phrase contains 4 words, then the database makes sure that the following combinations are stored in the database: 1,2, 2,3, and 3.4. If not, the database requests the user. It should be noted that only specially encoded translations of two-word combinations will be issued as accurate translations, even though the database will necessarily contain a definition for each word due to the implementation of the second stage described above.

В-четвертых, если переводы на иврит двух перекрывающихся двухсловных английских словосочетаний содержат перекрывающееся слово (или слова), то система действует таким образом, чтобы сочетать перекрывающиеся сегменты. Избыточные сегменты на иврите в области перекрытия исключаются, чтобы сформировать осмысленный перевод английских трехсловных словосочетаний, которые создаются сочетанием двух перекрывающихся словосочетаний на английском языке (и исключением избыточных слов в области перекрытия на английском языке). Вышеописанные этапы повторяются от 1 раза до бесконечного множества раз (п), чтобы обеспечить подходящий перевод. Способ перевода работает автоматически посредством проверки непротиворечивых словосочетаний, которые соединяют кодированные группы слов на обоих языках по зонам перекрытия. Указанные автоматически выполняемые одобрения связок, которые заполняют зоны перекрытия и непротиворечивы в обоих языках, обеспечивают создание языковой сети, которая преобразуется из одного языка в другой язык с идеальной точностью после того, как база данных достигает критической массы.Fourth, if the Hebrew translations of two overlapping two-word English phrases contain an overlapping word (or words), then the system acts in such a way as to combine overlapping segments. Redundant Hebrew segments in the overlapping region are excluded to form a meaningful translation of the English three-word phrases that are created by combining two overlapping phrases in English (and excluding redundant words in the overlapping region in English). The above steps are repeated from 1 time to an infinite number of times (n) to provide a suitable translation. The translation method works automatically by checking consistent phrases that connect coded groups of words in both languages over overlapping zones. The indicated automatically-executed approvals of the connectives, which fill the overlapping zones and are consistent in both languages, ensure the creation of a language network that is converted from one language to another language with perfect accuracy after the database reaches a critical mass.

Рассмотрим, например, английскую фразу I \ναηΙ ίο Ьиу а саг («Я хочу купить автомобиль»). После обработки способом в соответствии с настоящим изобретением данная фраза будет введена в управляемую компьютером базу данных. Компьютер будет действовать таким образом, чтобы определить, содержит ли база данных эквиваленты на иврите к следующим словам: I, \\шИ. ίο, Ьиу, а и саг. Если данные эквиваленты известны, то компьютер выдаст эквиваленты на иврите. Если данные эквиваленты не известны, то компьютер обратится с запросом к пользователю предоставить соответствующие переводы на иврит и введет в память полученные переводы для будущего использования. Затем компьютер лексически разберет предложение на двухсловные сегменты с перекрытием: I ναηΐ, \гап1 ίο, ίο Ьиу, Ьиу а и а саг. Компьютер будет действовать так, чтобы выдать эквиваленты на иврите к приведенным сегментам (т.е. эквиваленты на иврите к I \\шИ и т.д.); если данные эквиваленты на иврите не известны, тогда компьютер запросит пользователя предоставить соответствующие переводы на иврит и введет данные переводы в память для будущего использования.Consider, for example, the English phrase I \ ναηΙ ίο Liu a sag ("I want to buy a car"). After processing by the method in accordance with the present invention, this phrase will be entered into a computer-controlled database. The computer will act in such a way as to determine whether the database contains Hebrew equivalents to the following words: I, \\ шИ. ίο, Liu, and sag. If these equivalents are known, then the computer will give out equivalents in Hebrew. If these equivalents are not known, then the computer will ask the user to provide the appropriate translations in Hebrew and enter the received translations into the memory for future use. Then the computer will lexically analyze the sentence into two-word segments with overlapping: I ναηΐ, \ Гап1 ίο, ,ο Liu, Liu a and a sag. The computer will act in such a way as to give equivalents in Hebrew to the given segments (i.e. equivalents in Hebrew to I \\ WI, etc.); if these equivalents in Hebrew are not known, then the computer will ask the user to provide appropriate translations in Hebrew and enter these translations into memory for future use.

Затем в соответствии с настоящим изобретением будут проанализированы трехсловные сегменты I \\щИ ίο, \\шИ ίο Ьиу, ίο Ьиу а и Ьиу а саг. В данной точке процедуры в соответствии с настоящим изобретением делается попытка сочетать каждую из пар переводов на иврит, у которых двухсловные английские переводы перекрываются и сочетаются, чтобы запросить перевод трехсловных английских словосочетаний (например, I \\шИ и \\шИ ίο сочетаются с образованием I \\шИ ίο). Если сегменты на иврите содержат общую зону перекрытия, которая также связывает их, то способ перевода автоматически утверждает преобразование трехсловного английского словосочетания на иврит как перевод без вмешательства пользователя. Если сегменты на иврите не перекрываются и не сочетаются, то пользователю направляется запрос на точный перевод. После попыток подходящего перевода трехсловных английских словосочетаний процедура переходит к четырехсловным словосочетаниям и т.д. и делает поThen, in accordance with the present invention, three-word segments I \\ SHI ίο, \\ SHI ίο Liu, ίο Liu a and Liu a sag will be analyzed. At this point in the procedure in accordance with the present invention, an attempt is made to combine each of the Hebrew translation pairs in which two-word English translations overlap and combine to request a translation of three-word English phrases (for example, I \\ WI and \\ WI ίο are combined with the formation of I \\ SHI ίο). If the Hebrew segments contain a common overlapping zone, which also connects them, the translation method automatically approves the conversion of a three-word English phrase into Hebrew as a translation without user intervention. If the Hebrew segments do not overlap or combine, then the user is sent a request for an accurate translation. After trying an appropriate translation of three-word English phrases, the procedure proceeds to four-word phrases, etc. and does

- 14 007776 пытку посредством межъязыкового перекрытия автоматически выделить сочетания переводов, пока не закончится анализируемый сегмент (в рассматриваемом случае вся фраза I \ν;·ιηΙ ίο Ьиу а саг). В соответствии со способом по настоящему изобретению после выполнения описанного лексического анализа производится сличение выданных переводных эквивалентов, исключаются избыточность в местах перекрытия сегментов и переведенная фраза выводится для пользователя.- 14 007776 torture by means of interlanguage overlapping automatically select combinations of translations until the analyzed segment ends (in this case, the whole phrase I \ ν; · ιηΙ ίο Liu a sag). In accordance with the method of the present invention, after performing the described lexical analysis, the translated equivalents are compared, the redundancy in the areas of overlapping segments is eliminated, and the translated phrase is displayed to the user.

Перевод документов с использованием базы данных и метода двойного перекрытияTranslation of documents using a database and double overlap method

В соответствии с другим предпочтительным вариантом осуществления настоящего изобретения документ, составленный на первом языке, можно преобразовать в документ на втором языке с использованием вышеописанной межъязыковой базы данных, чтобы обеспечить в виде словосочетаний переводы слов и словосочетаний, содержащихся в документе, а затем сочетать перекрывающиеся словосочетания на втором языке для создания перевода документа с использованием вышеописанного метода межъязыкового двойного перекрытия. Например, рассмотрим базу данных с доступом к достаточному числу межъязыковых документов, чтобы выделить компоненты нижеследующего предложения, введенного на английском языке и предназначенного для перевода на иврит: Ιη аббйюп ίο ту оееб ίο Ье 1отсб Ьу а11 !йс дйк ίη ίονη, I а1\тау5 теаЫеб ίο Ье Κηονη а§ !йс ЬеЛ р1ауег ίο еуег р1ау οη !йс №\ν Уотк 51а1е Ьа^кеЛаП ίеат.In accordance with another preferred embodiment of the present invention, a document in a first language can be converted into a document in a second language using the above-described multilingual database to provide phrases for translations of words and phrases contained in the document, and then combine overlapping phrases into a second language to create a translation of the document using the aforementioned method of interlingual double overlap. For example, consider a database with access to a sufficient number of multilingual documents in order to highlight the components of the following sentence, introduced in English and intended for translation into Hebrew: Ιη abbyyup туο оеί 1ο ο отο отο д11 ί11 ίη ίονη, I a1 \ tau5 teaeb ίο е Κηονη а! с Л Л р р р № № № е е ат ат ат ат ат ат ат ат ат ат.

Посредством выполнения вышеописанной процедуры способ обработки может определить, что фраза Ιη абб^^ ίο ту оееб ίο Ье 1ο\ό6 Ьу а11 !йс дйк является самым длинным словосочетанием в исходном документе, начинающимся с первого слова исходного документа и существующим в базе данных. Данная фраза ассоциирована в базе данных со словосочетанием на иврите ЬегюхаГ 1ίζοΐΌΗι кйей 1ΐΗϊοί айиу а1 уебау М йаЬайшЫ. Затем процедура определит следующие переводы с использованием вышеописанного способа, т.е. самое большое английское словосочетание из подлежащего переводу текста (и существующее в базе данных) с одним словом (или, в соответствии с другим вариантом, несколькими словами), которое(ые) перекрывается(ются) с ранее выявленным английским словосочетанием, и два перевода на иврит для этих перекрывающихся английских словосочетаний, также с перекрывающимися сегментами: 1ο\ό6 Ьу а11 !йс дйк ίη ίονη переводится как айиу а1 уебау Ш йаЬайшЫ Ьшг; 1йе дйй ίη ίονη, I а1\тау5 \\'агИеб ίο Ье 1<ηο\νη переводится как НаЬайшЫ Ьшг, 1аннб πιίζίίν 1^й^οί уайиа; I а1\\ау5 \\'аг11еб ίο Ье 1<ηο\νη а§ 1йе ЬеЩ р1ауег переводится как (аплб πιίζίίν 1ί1ιίοί уайиа Ье1Юг йакайкал йасЫ ίον; и 1йе ЬеЩ р1ауег ίο еует р1ау οη Фе №\ν Υο6< 51а1е Ьа5ке1йа11 ίеат переводится как йакайкал йасЫ ίον §й йау раат ыйек Ьекνиίζаί йакабиг§а1 §йе1 тебта! пс\у νο6<.By performing the above procedure, the processing method can determine that the phrase Ιη abb ^^ туο that ебί Ь 1 1ίοοοόοο 1111111111111111 is the longest phrase in the source document, starting with the first word of the source document and existing in the database. This phrase is associated in the database with the Hebrew phrase Leghuha 1ίζοΐΌΗι кйей 1ΐΗϊοί ayyu a1 uebau M yaishy. The procedure will then determine the following translations using the method described above, i.e. the largest English phrase from the text to be translated (and existing in the database) with one word (or, in accordance with another option, several words), which (s) overlap (s) with the previously identified English phrase, and two translations into Hebrew for these overlapping English phrases, also with overlapping segments: 1ο \ ό6 b y a11! ys dyk ίη ίονη translates as aiu a1 uebau й baaishy bshg; 1ye dyy ίη ίονη, I a1 \ tau5 \\ 'agIeb ίο Ье 1 <ηο \ νη translates as НайайЫЫшгг, 1ннб πιίζίίν 1 ^ й ^ οί уайия; I a1 \\ ay5 \\ 'ar11eb ίο bе 1 <ηο \ νη а§ 1ее Бе-РЩРуРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРνРν of a translates as yakaykal yasY ίον й й у ра ра ра ра ί ν ν ν § § § § 1 1 пс пс пс пс пс пс пс пс <.

При наличии приведенных результатов, выданных базой данных, обработка будет выполняться таким образом, чтобы сличить перекрывающиеся слова и словосочетания и исключить избыточные компоненты. В соответствии с этим 'Ίη аббйюп ίο ту пееб ίο Ье Ыуеб Ьу а11 1йе дик переводится как Ьегю^аГ 1ίζοΐΌΗι кйей 1ίΗίοί айиу а1 уебау Ш йаЬайшЫ; а Ыуеб Ьу а11 1йе дйк ίη ίονη переводится как айиу а1 уебау М йаЬайшЫ Ьшг. При использовании способа по настоящему изобретению система примет сегменты на английском языке 'Ίη аббйюг1 ίο ту псс6 ίο Ье Ыуеб Ьу а11 !йс дик и Ыуеб Ьу а11 !йс дик ίη ίο\νη и выдаст сегменты на иврите Ьегю^аГ 1ίζοιυΗι вйей 1ίΗίοί айиу а1 уебау Ш йаЬайшЫ и айиу а1 уебау М йаЬайшЫ Ьшг, а также определит перекрытие.Given the above results issued by the database, processing will be performed in such a way as to compare overlapping words and phrases and eliminate redundant components. In accordance with this, 'Ίη abbyup ίο tu peeb ο е у еб еб а а 1 1 1 1 1 дик 1 1 ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί;;;;;; and Yueb LU a11 1ye dyke ίη ίονη is translated as ayu a1 uebau M yaayshy bshg. Using the method of the present invention, the system will receive segments in English 'Ίη abbyyug1 туο tu pss6 ίο е еб еб 11 11 11 11 ί ί и и ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ί ο ο ο ο ο ο ο ί ο ο ο ο ο ο ο ο ο ο ο ο uebau й Ь Ь ш Ы и and и у а 1 у еб еб еб Ь Ь ш Ы г г г,, and also determines the overlap.

На английском языке фразы имеют вид: 'Ίη аббйюг1 ίο ту псс6 ίο Ье Ыуеб Ьу а11 !йс дик и Ыуеб Ьу а11 !йс дик ίη ίο\νη. Удаление перекрытия дает: 'Ίη аббйюг1 ίο ту псс6 ίο Ье Ыуеб Ьу а11 !йс дик ίη ίο\νη.In English, the phrases are: 'Ίη abbyyug1 ίο tu pss6 ίο е ί ί \ \ \ \ \ νη. Removing the overlap yields: 'Ίη abbyyug1 ίο tu pss6 ίο е у еб еб а 11 11 11 11!

На иврите фразы имеют вид: Ьегю^аГ 1ίζοΐΌΗι вйей 1ίΗίοί айиу а1 уебау Ш йаЬайшЫ и айиу а1 уебау Ш йаЬайшЫ Ьшг. Удаление перекрытия дает: Ьегю^аГ 1ίζοΐΌ^ι вйей 1ίΗίοί айиу а1 уебау Ш йаЬайшЫ Ьшг.In Hebrew, the phrases are: ег ег ^ ^ Г ί 1 ί ί ΐΌΗ ΐΌΗ ίΗί ей ίΗί ίΗί у у и и и и и и и и.. Г г г г г г г г г г г г г г г г г г г г г г.... Г.......... Г.... Removing the overlap yields: ег ю ^ ^ Г ί 1 ί ΐΌ ΐΌ ΐΌ ι й й ίΗί 1 ίΗί ίΗί ай у у а у. Г г г г г г г г г г

Затем в соответствии с настоящим изобретением обрабатывается следующий синтаксически разобранный сегмент, и тем самым процедура продолжается. В настоящем примере процедура обработки применяется к фразе 'Чйе дик ίη ίο\νη. I а1\тау5 теаЫеб ίο Ье 1<ηο\νη. Система выделяет английский сегмент 'Ίη аббйюг1 ίο ту псс6 ίο Ье ктеб Ьу а11 !йс дик ίη ίο\νη и новый набор английских слов !йс дик ίη ίονη, I а1\тау5 \\шиеб ίο Ье 1<ηο\νη. Соответствующими наборами слов на иврите являются Ьегю^аГ 1ίζοΐΌ^ι вйей 1ίΗίοί айиу а1 уебау М йаЬайшЫ Ьшг и новый соответствующий набор слов на иврите йаЬайшЫ Ьшг, 1ат1б Γπίζίίν 1ίΗίοί уайиа. Удаление перекрытия на английском языке превращает две фразы: 'Ίη аббйюг1 ίο ту оееб ίο Ье Ыуеб Ьу а11 !йс дик ίη ίονη и !йс дик ίη ίονη, I а1^ау§ теаЫеб ίο Ье 1<ηο\νη в одну фразу 'Ίη аббйюг1 ίο ту оееб ίο Ье Ыуеб Ьу а11 !йс дик ίη ίονη, I а1^ау§ \\шиеб ίο Ье 1<ηο\νη.Then, in accordance with the present invention, the next syntactically parsed segment is processed, and thus the procedure continues. In the present example, the processing procedure is applied to the phrase 'Cheye dik ίη ίο \ νη. I a1 \ tau5 teaEb ίο Ье 1 <ηο \ νη. The system selects the English segment 'Ίη abbyug1 ίο tu pss6 ίο е е б б а а \ \!! И and a new set of English words! Corresponding Hebrew word sets are ю ю ^ Г ί ί ί ΐΌ ΐΌ ΐΌ ΐΌ г г г и и и и г и и г г и г и и и и и и и и и и и и и и и и и,,,,,,,, и,,,, и, 1, 1 и, и и и и и 1 и и 1 1 и 1 и 1 и 1 и и 1 1 1 1 1 и и и и и и 1 и и и 1 и и и и и и и и и и и и и и и. Removal of overlap in English makes two phrases: '! Ίη abbyyug1 ίο the oeeb ίο Le Ly Yueb a11 wild ίη ίονη dc and dc wild ίη ίονη, I a1 ^ au§ teaYeb ίο Le 1 <ηο \ νη in one phrase!' Ίη abbyug1 туο tu ебеб Ь еб еб 11 11 \ \ \ \ \ \ \ \ \ \ \ \ 1 § § 1 <1 <ηο \ νη.

На иврите процедура перекрытия работает следующим образом. Две фразы: Ьегю^аГ 1ίζοΐΌΗι вйей 1ίΗίοί айиу а1 уебау Ш йаЬайшЫ Ьшг и йаЬайшЫ Ьшг, ίат^б ^аίζ^ίу 1ίΗίοί уайиа превращаются в Ьегю^аГ 1ίζοΐΌΗι вйей 1ίΗίοί айиу а1 уебау Ш йаЬайшЫ Ьшг, ίат^б πιίζίίν 1ίΗίοί уайиа.In Hebrew, the overlap procedure works as follows. Two phrases: egyu ^ aT 1ίζοΐΌΗι vyey 1ίΗίοί ayiu a1 uebau W yaayshY shg and yaayshY shg, ίat ^ b ^ aίζ ^ ίu 1ίΗίοί uayia turn into egyu ^ aT 1ίζοΐΌΗι vyey 1ίΗίοί ayiu a1 uebau W yaayshY shg, ίat ^ a b πιίζίίν 1ίΗίοί uayia.

В соответствии с настоящим изобретением обработка вышеописанного типа продолжается со словами и словосочетаниями, остающимися в подлежащем переводу документе. Поэтому в данном примере предпочтительного варианта осуществления изобретения следующими английскими словосочетаниями являются 'Ίη аббйюг1 ίο ту оееб ίο Ье Ыуеб Ьу а11 !йс дик ίη ίονη, I а1\тау5 таЫеб ίο Ье 1<ηο\νη и I а1\тау5 \уа1Цеб ίο Ье 1<ηο\νη а§ !йс Ьсз! р1ауег. Переводами на иврит, выданными базой данных для приведенных фраз, являются Ьегю^аГ 1ίζοΐΌΗι вйей 1ίΗίοί айиу а1 уебау Ш йаЬайшЫ Ьшг, ίат^б πιίζίίν 1ίΗίοί уайиа и 'Йат1б πιίζίίν 1ίΗίοί уайиа ^ίίοτ йа^айкан йасЫ Щу. Удаление перекрытия на английском языке дает: 'ΊηIn accordance with the present invention, processing of the type described above continues with words and phrases remaining in the document to be translated. Therefore, in this example of a preferred embodiment of the invention, the following English phrases are 'Ίη abbyug1 1 <ηο \ νη a§! Ys bc3! p1aueg. The Hebrew translations issued by the database for the phrases cited are: ег ю ^ ί ί ί ί ίΗί г г г ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί ίΗί. Removing an overlap in English gives: 'Ίη

- 15 007776 αάάίΐίοη ΐο ту леей ΐο Ье 1оуей Ьу а11 Ше д1г1з ίη Ιο\νπ. I а1\уаук \уагИей ΐο Ье 1<ηο\νπ ак Ше Ьек1 р1ауег. Удаление перекрытия на иврите дает: ЬегюкаГ ΙιζοιόοΙι кНе11 ΙίΗίοΙ а1шу а1 уейау Ш каЬакш-οΐ Ьшг, Κιιηίά гаМку ΙίΗίοΙ уакиа Ье1Юг какаккап каск ΐον.- 15 007776 αάάίΐίοη ΐο tu lei ΐο е е оу 1 а а 11 11 11 11 \ \ \ \ \ νπ. I a1 \ uauk \ uagIIe ΐο Ье 1 <ηο \ νπ ак Ше Бек1 р1ауег. Removing the overlap in Hebrew yields: ег ζ ζ ζ ζ ζ ζ ζ 11,,,,,,,,,,,,,,,,,,,,,,,, г г г ν ν ν ν ν ν ν ν ν ν ν ν ν ν ν ν.

При продолжении процедуры следующим словосочетанием является Ιη лйййюп ΐο ту леей ΐο Ье 1ο\Όά Ьу а11 Изе д1г1з ίη ΐονη, I а1\уаук \уагИей ΐο Ье 1<ηο\\·η ак Изе Ьек1 р1ауег и Изе Ьек1 р1ауег ΐο е\^гег р1ау οη 11зе Ыеу Υογ1< 81а(е ЬаккеЛаП ΐеат. Соответствующими фразами на иврите являются ЬегюкаГ ΙΙζοιόΟι ккек ΙίΗίοΙ лНлу а1 уейау Ш каЬакш-οΐ Ьшг, (алий гаЭку ΙίΗίοΙ уакиа Ье1Юг каκаΗкаη касЫ ΐον и каκаΗкаη каск1 ΐον кк кау раат 81кек Ьекνиΐζаΐ какайигка1 кке1 тей^ηаΐ ие\у \όγ1<. Удаление перекрытия на английском языке дает: Ιη айй^ΐ^οη ΐο ту ззеей ΐο Ье ^уей Ьу а11 Не д1г1к ίη ΐονη, I а1уаук \уагИей ΐο Ье Κηονη ак Не Ьек! р1ауег ΐο еуег р1ау οη ΐке №\у Υοιί< к1а1е ЬаккеФаП ΐеат. Удаление перекрытия на иврите дает фразу: ЬегюкаГ Ιΐζοι-есН ккек ΙΠίοί аклу а1 уейау Ш каЬакш-οΐ Ьшг, 1ат1й ^аΐζ^ίу ΗΗιοΙ уакиа Ье1Юг каκаккаη каск1 ΐον кк кау раат к1кек Ьекνиΐζаΐ какайигка1 кке1 тей^ηаΐ ие\у уигк, которая является переводом текста, ранее предложенного для перевода.By continuing the procedure following the phrase it is Ιη lyyyyup ΐο the the Levi ΐο Le 1ο \ Όά Ly a11 Ize d1g1z ίη ΐονη, I a1 \ uauk \ uagIey ΐο Le 1 <ηο \\ · η ak ek1 r1aueg Ys and Ys ek1 r1aueg ΐο e \ ^g er r1au οη 11ze Yeu Υογ1 <81a (e akkeLaP ΐeat. Relevant phrases in Hebrew are egyukaG ΙΙζοιόΟι kkek ΙίΗίοΙ lNlu a1 ueyau W kaaksh-οΐ shg (Aly SJSEC ΙίΗίοΙ uakia e1Yug kaκaΗkaη Casa ΐον and kaκaΗkaη kask1 ΐον kk kau RAAT 81kek ekνiΐζaΐ kakayigka1 кke1 тей ^ ηаΐ ие \ у \ όγ1 <. Removing the overlap in the English language gives: Ιη айй ^ ΐ ^ οη туο that zeei ΐο Ле ^ уей Лу а11 Not д1 g1k ίη ΐονη, I ауууук \ уагИе ΐο Ье Κηονη а Нен Неёк! р1ауег ΐο еуег р1ау οη ΐке № \ у Υοιί кеке уеате даете дает дает фразу фразу фразу фразу фразу фразу фразу дает фразу дает фразу фразу фразу фразу дает дает: Bshg, 1at1y ^ aΐζ ^ ίu ΗΗιοΙ wakia bе1Уг kakakkaη kask1 ΐον kk kau kaauat k1kek bekνiΐζaΐ kakayigka1 kke1 tey ^ ηаΐе \ u wig, which is a translation of the text previously proposed for translation.

По окончании данной процедуры в соответствии с настоящим изобретением переведенный окончательный текст выдается и выводится.At the end of this procedure, in accordance with the present invention, the translated final text is issued and output.

Следует отметить, что выдаваемые результаты представляли собой окончательный результат обработки в базе данных, выдающей перекрывающиеся ассоциации в соответствии с вышеописанной процедурой. По ходу исполнения процедуры система, в конечном счете, не примет выданный на втором языке результат, который не содержит естественно согласующейся связки по перекрытию с прилегающими сегментами на втором языке. Если бы у какого-либо выданного результата на иврите не было точного перекрытия со смежным ассоциированным словосочетанием на иврите, то данный результат был бы отвергнут и заменен таким ассоциированным словосочетанием на иврите, которое перекрывается со смежными словосочетаниями на иврите.It should be noted that the results returned were the final processing result in a database issuing overlapping associations in accordance with the above procedure. In the course of the execution of the procedure, the system will ultimately not accept the result given in the second language, which does not contain a naturally consistent connective in overlapping with adjacent segments in the second language. If any given Hebrew result did not have an exact overlap with the adjacent associated Hebrew phrase, then this result would be rejected and replaced by such an associated Hebrew phrase that overlaps with adjacent Hebrew phrases.

Программа РгодгатЗ, приведенная в приложении листингов компьютерных программ, является примером программы для реализации варианта осуществления ручного создания базы данных и перевода с использованием метода двойного перекрытия. Программы могут исполняться на компьютерных системах известного в технике типа.The RgodgatZ program provided in the computer program listing application is an example of a program for implementing the option of manually creating a database and translating using the double overlap method. Programs can be executed on computer systems of a type known in the art.

Вышеописанный вариант осуществления, сочетающий использование межъязыковой ассоциативной базы данных с методом перевода на основе принципа межъязыкового двойного перекрытия, может применяться в других областях для повышения качества существующих технологий, с помощью которых пытаются отождествлять информацию, находящуюся в одном состоянии, с информацией в другом состоянии, например известных в технике программных средств распознавания речи и сканирующих устройств с оптическим распознаванием символов (ОСЯ). Обе упомянутые технологии могут проверять результаты, полученные соответствующими системами, с использованием способов перевода в соответствии с настоящим изобретением. Если перевод не существует и поэтому предполагается ошибка, то пользователь может получить предупреждение и запрос, либо система может быть запрограммирована на поиск в базе данных таких близких альтернатив неперекрывающемуся переводу, которые давали бы перекрывающийся перевод. Все результаты, выдаваемые пользователю, конечно, подвергались бы обратному преобразованию на язык оригинала.The embodiment described above, combining the use of an interlanguage associative database with a translation method based on the principle of interlanguage double overlap, can be used in other areas to improve the quality of existing technologies by which they try to identify information in one state with information in another state, for example software known in the art of speech recognition and scanning devices with optical character recognition (OCR). Both of these technologies can verify the results obtained by the respective systems using translation methods in accordance with the present invention. If the translation does not exist and therefore an error is expected, then the user can receive a warning and a request, or the system can be programmed to search the database for such close alternatives to the non-overlapping translation that would give an overlapping translation. All the results given to the user, of course, would undergo a reverse conversion to the original language.

В соответствии с другим вариантом осуществления настоящего изобретения предлагаются способ и устройство для создания ассоциативной базы данных на одном языке и способ и система для использования ассоциативной базы данных с целью представления ответов на запросы или поставленные пользователем вопросы. В соответствии с данным вариантом осуществления ассоциативная база данных может организовать и хранить информацию, которая позволяет определять и анализировать ассоциации между словами или словосочетаниями. Программа ассоциирования может реализовать некоторые способы по настоящему изобретению и может быть использована для построения базы данных по настоящему изобретению и для анализа информации, хранящейся в базах данных, с целью определения ассоциаций между словами или словосочетаниями. На фиг. 3 показана память 208 компьютерной системы 200, в которой хранится интеллектуальное приложение 302, программа 304 ассоциирования, базы данных 306 и операционная система 308 для доступа со стороны процессора 202. Программа 304 ассоциирования может быть независимой программой или неотъемлемой составной частью интеллектуального приложения 302. Программа 304 ассоциирования может анализировать базы данных 306, чтобы определять ассоциированные слова либо в ответ на запрос из интеллектуального приложения 302, либо в ответ на запрос, переданный непосредственно пользователем через устройство ввода.According to another embodiment of the present invention, there is provided a method and apparatus for creating an associative database in one language and a method and system for using an associative database to provide answers to queries or questions posed by a user. In accordance with this embodiment, the associative database can organize and store information that allows you to define and analyze associations between words or phrases. An association program may implement some of the methods of the present invention and can be used to build a database of the present invention and to analyze information stored in databases in order to determine associations between words or phrases. In FIG. 3 shows a memory 208 of a computer system 200 that stores an intelligent application 302, an association program 304, databases 306, and an operating system 308 for access from processor 202. The association program 304 may be an independent program or an integral part of the intelligent application 302. Program 304 association can analyze the database 306 to determine the associated words either in response to a request from an intelligent application 302, or in response to a request transmitted directly a user through the input device.

Система и способ выполняют этапы, на которых синтаксически анализируют текст документа, введенного в систему, и создают частотную ассоциативную базу данных, в которой сегменты синтаксически разобранного текста ассоциируются между собой на основании, например, частоты появления и позиции конкретного фрагмента относительно других фрагментов документа. Сегменты синтаксически разобранного текста могут содержать слова и словосочетания. Документы, используемые в соответствии с настоящим изобретением, могут храниться в документальной базе данных для облегчения доступа, синтаксического разбора и анализа документов.The system and method perform the steps of parsing the text of a document entered into the system and creating a frequency associative database in which segments of syntactically parsed text are associated with each other based on, for example, the frequency of occurrence and position of a particular fragment relative to other fragments of the document. Segments of syntactically parsed text may contain words and phrases. Documents used in accordance with the present invention can be stored in a document database for easy access, parsing and analysis of documents.

Слова и словосочетания, которые часто появляются в непосредственной близости друг от друга вWords and phrases that often appear in close proximity to each other in

- 16 007776 документе, можно использовать в приложениях искусственного интеллекта или с развитой логикой, которые позволяют пользователю запрашивать систему для получения ответа на вопрос или выполнения действия. Цель использования ассоциативной базы данных по настоящему изобретению в интеллектуальных приложениях заключается в том, чтобы определять ассоциации по общему третьему слову или словосочетанию между или среди, по меньшей мере, двух слов или словосочетаний, выбранных интеллектуальным приложением.- 16 007776 document, can be used in artificial intelligence applications or with developed logic that allow the user to query the system to get an answer to a question or perform an action. The purpose of using the associative database of the present invention in smart applications is to define associations by a common third word or phrase between or among at least two words or phrases selected by the smart application.

Пользователь может определять в документальной базе данных интервалы как любое число слов и/или словосочетаний вблизи каждого появления каждого выбранного слова и/или словосочетания. Затем система производит поиск слов и/или словосочетаний, которые являются общими для интервалов, т.е. общих третьих слов или словосочетаний. Частоты появлений общих третьих слов или словосочетаний в интервалах каждого выбранного слова или словосочетания можно сохранять в частотной ассоциативной базе данных, показанной в табл. 3 и 4. В соответствии с альтернативным вариантом местоположения и частоту появления слов, повторяющихся в документальной базе данных, можно сохранять в базе данных повторяющихся слов и словосочетаний, именуемой также в настоящем описании базой данных повторных появлений, пример которой показан в табл. 5. При использовании упомянутых баз данных программа 304 ассоциирования может устанавливать для третьих слов и словосочетаний связи самого высокого ранга, в которых участвуют, по меньшей мере, 2 слова или словосочетания, выбранные интеллектуальным приложением 302 на основании заданных пользователем весовых коэффициентов или других критериев.The user can define intervals in the document database as any number of words and / or phrases near each occurrence of each selected word and / or phrase. The system then searches for words and / or phrases that are common to intervals, i.e. common third words or phrases. The frequency of occurrence of common third words or phrases in the intervals of each selected word or phrase can be stored in the frequency associative database shown in table. 3 and 4. In accordance with an alternative embodiment, the location and frequency of occurrence of words repeated in the document database can be stored in the database of repeated words and phrases, also referred to in this description as the database of repeated occurrences, an example of which is shown in Table. 5. When using the mentioned databases, the association program 304 can establish links of the highest rank for third words and phrases, in which at least 2 words or phrases are selected, selected by the intelligent application 302 based on user-defined weights or other criteria.

Построение ассоциативной базы данных в заданном пользователем интервалеBuilding an associative database in a user-defined interval

Предлагается способ построения ассоциативной базы данных одного типа, именуемой в настоящем описании частотной ассоциативной базой данных, которую можно применить к обработке документов на одном языке с целью построения базы данных связанных слов и словосочетаний на основе их близости друг к другу в тексте. Пример частотной ассоциативной базы данных приведен в табл. 3. Способ содержит следующие этапы.A method is proposed for constructing an associative database of one type, referred to in the present description as a frequency associative database, which can be applied to processing documents in one language with the aim of constructing a database of related words and phrases based on their proximity to each other in the text. An example of a frequency associative database is given in table. 3. The method comprises the following steps.

a. Собирают фонд текстов на одном языке в «документальной базе данных, при этом, чем больше фонд, тем лучше.a. They collect a fund of texts in one language in a “documentary database, and the larger the fund, the better.

b. Производят поиск каждого слова или словосочетания с определением многократных появлений данного слова или словосочетания в документальной базе данных.b. Search for each word or phrase with the definition of multiple occurrences of a given word or phrase in a documentary database.

c. Устанавливают заданное пользователем количество слов или словосочетаний с каждой стороны подлежащего анализу слова или словосочетания. Данное количество будет выполнять функцию интервала. Помимо того, что интервал задается определенным числом слов, его можно задать таким широким (всеми словами в конкретном тексте, в котором появляется слово или словосочетание) или таким узким (словосочетанием ограниченного размера в непосредственной близости от анализируемого слова или словосочетания), как может задать пользователь для конкретного применения.c. Set the user-defined number of words or phrases on each side of the word or phrase to be analyzed. This amount will serve as an interval. In addition to the fact that the interval is specified by a certain number of words, it can be set as wide (by all words in the specific text in which the word or phrase appears) or as narrow (by a phrase of limited size in the immediate vicinity of the analyzed word or phrase), as the user can set for specific application.

6. Определяют частоту, с которой каждое слово и словосочетание появляются в интервалах вблизи выбранного анализируемого слова или словосочетания, и, при необходимости, степень их близости к выбранному слову или словосочетанию. Ниже приведен пример построения ассоциации между большим числом документов на одном языке. Предложение 1 и предложение 2, показанные в табл. 2, представляют собой два предложения среди множества предложений в документальной базе данных и как весь фонд могут быть полностью проанализированы с вводом всех результатов в частотную таблицу.6. Determine the frequency with which each word and phrase appear in intervals near the selected analyzed word or phrase, and, if necessary, the degree of their proximity to the selected word or phrase. The following is an example of building an association between a large number of documents in one language. Proposition 1 and Proposition 2, shown in table. 2, represent two sentences among the many sentences in the documentary database and how the entire fund can be fully analyzed with all the results entered in the frequency table.

Таблица 2table 2

Предложение 1 Offer 1 I мепН До НИе босНог апб I маз зпеегбпд а Ιοί. апб Не Ηο16 те ННаН НИе со1б апб ННе £1и аге добпд агоипб Ике сгагу апб I зНои1б гезк, кеер какхпд Уд-Наиб-п С, апб а ΙϊΐΧΐβ сНъскеп зоир мои1бп'Н НигН. I MEPN TO NIOS BOSNOG APP I MAZ SPEEGBPD a Ιοί. apb not теο16 those NANA S1b apb NNE £ 1 and aye dobpd agoipb Ike saggu apb I zNoy1b gezk, keer kakhpd Ud-Naib-p S, apb a ΙϊΐΧΐβ with Unskep zoir my1bp'N NigN. Предложение 2 Offer 2 Аз а босНог, 1'т сопз£ап1:1у зееъпд зпеегбпд, геб еуеб ракхепИз азкхпд «НаН ННеу сап бо Но НгеаН ННе £1и, Но мНхсН I гербу, ННе оп1у ННхпдз ННаН геа11у могк аге гез£ апб Нхте. Az and bosNog, 1't const £ ap1: 1y zeepd zpeegbpd, Geb eueb rakhepIz azkhpd "Nan NNeu sap bo But nne £ 1 and Nghe An, but I mNhsN crest, nne op1u NNhpdz NNaN gea11u mogk aga res £ APB Nhte.

Система выполнит поиск повторяющихся слов или словосочетаний. В двух данных предложениях повторяются только следующие слова и словосочетания: I, ίο, ЧНе, 6ос1ог, апб, δποβζίπβ, а, ώαΐ, Пи, аге, гезГ.The system will search for duplicate words or phrases. In these two sentences only the following words and phrases are repeated: I, ίο, ЧНе, 6oc1og, apb, δποβζίπβ, a, ώαΐ, Pi, age, gezG.

Как указано в описании заявки № 10/024473 на патент США, в некоторых случаях применения вAs described in the description of application No. 10/024473 for US patent, in some cases, the application in

- 17 007776 систему можно заложить инструкцию рассматривать и игнорировать общие слова типа I, а, 1о и т.п. Однако данные общие слова будут рассматриваться и включаться в базу данных в случаях, обусловленных целью конкретного применения системы. Если общие слова игнорируются, то останутся: Эое1ог, зпее7шд, йи и гез1.- 17 007776 the system can be laid down instructions to consider and ignore common words of type I, a, 1o, etc. However, these common words will be considered and included in the database in cases determined by the purpose of a specific application of the system. If common words are ignored, then they will remain: Eoe1og, zpeee7shd, yi and ges1.

Если задано, что интервал содержит, например, до 30 слов с каждой стороны, то система зарегистрирует частоту появления каждого слова и словосочетания в пределах 30 слов от каждого из данных слов. Кроме того, система может также регистрировать близость каждого слова или словосочетания к анализируемому слову или словосочетанию. Поскольку каждое из данных слов появляется внутри интервала длиной 30 слов, начинающегося от каждого из других слов в обоих предложениях, то каждое слово имеет частоту, равную единице, совместного появления с каждым из других слов, как видно из табл. 3, в которой показан вариант осуществления частотной ассоциативной базы данных.If it is specified that the interval contains, for example, up to 30 words on each side, the system will record the frequency of occurrence of each word and phrase within 30 words from each of these words. In addition, the system can also record the proximity of each word or phrase to the analyzed word or phrase. Since each of these words appears inside an interval of 30 words starting from each of the other words in both sentences, each word has a frequency equal to one, the joint occurrence with each of the other words, as can be seen from the table. 3, an embodiment of a frequency associative database is shown.

Таблица 3Table 3

Слово/словосочетание Word / Phrase Ассоциированное слово/словосочетание Associate word / phrase Частота Frequency йосЕог yosEog зпеегл-пд speegl-pd 1 one £1и £ 1and 1 one гезЕ geze 1 one Зпеегтпд Zpeegtpd йосЕог yosEog 1 one £1и £ 1and 1 one гезЕ geze 1 one Г1и G1i зпеег1пд zpeeg1pd 1 one босЕог boseog 1 one гезЕ geze 1 one КезЕ KezE зпеегтпд zpeegtpd 1 one йосЕог yosEog 1 one £1и £ 1and 1 one

Кроме учета частоты, с которой слова или словосочетания появляются в любом месте в пределах интервалов, относящихся к анализируемым словам и словосочетаниям, можно построить ассоциативную базу данных на основании частот появления слов или словосочетаний на расстоянии, в точности равном X словам от анализируемого слова или словосочетания. В указанных случаях пользователю для конкретного применения потребуется точно задавать интервал в виде 1 слова или 1 словосочетания конкретной длины на точном расстоянии вблизи анализируемого слова или словосочетания.In addition to taking into account the frequency with which words or phrases appear anywhere within the intervals related to the analyzed words and phrases, you can build an associative database based on the frequencies of occurrence of words or phrases at a distance exactly equal to X words from the analyzed word or phrases. In these cases, the user for a specific application will need to set the exact interval in the form of 1 word or 1 phrase of a specific length at an exact distance near the analyzed word or phrase.

Например, система может анализировать документы, доступные в документальной базе данных, чтобы определить, содержат ли они фразу до 1о 1Ье дате 10000 раз, и может найти фразу до 1о 1Ье дате в пределах 20-словного интервала, относящегося к слову 1е18 87 раз. Кроме того, может определить, что фраза до 1о 1Ье дате появилась в точности на расстоянии 7 слов перед словом 1е18 8 раз (считая от первого слова до словосочетания).For example, the system can analyze the documents available in the document database to determine whether they contain a phrase up to 1 1 bf date 10,000 times, and can find a phrase up to 1 bf date within a 20-word interval relating to the word 1 e18 87 times. In addition, it can determine that a phrase up to 1o to the 1st date appeared exactly 7 words before the word 1e18 8 times (counting from the first word to the phrase).

Кроме того, можно регистрировать любое сочетание повторяющихся комбинаций слов и словосочетаний, построенное на основании общего числа слов в них. Например, в базу данных можно вводить число предложений в базе данных, в которых слово 1е1з появляется на расстоянии 3 слов перед фразой до 1о 11те дате, когда слово 11еке1з появляется на расстоянии 9 слов после фразы до 1о 1Ье дате. Указанная комбинация может появляться 3 раза, и частоту появления данной комбинации слов в тексте можно использовать в приложении, которое выводит смысл понятия, чтобы либо способствовать в выдаче ответа на вопрос, заданный пользователем, либо способствовать в выполнении запроса пользователя. На основании предложения 1 и предложения 2 в табл. 2, можно создать частотную ассоциативную базу данных, показанную в табл. 4.In addition, any combination of repeating combinations of words and phrases based on the total number of words in them can be recorded. For example, in the database, you can enter the number of sentences in the database in which the word 1е1з appears at a distance of 3 words before the phrase up to the 1st to 11th date, when the word 11е1з appears at a distance of 9 words after the phrase up to the 1st to 1th date. The specified combination can appear 3 times, and the frequency of occurrence of this combination of words in the text can be used in an application that displays the meaning of the concept, either to contribute to the issuance of an answer to a question posed by the user, or to assist in fulfilling the user's request. On the basis of proposal 1 and proposal 2 in table. 2, you can create the frequency associative database shown in table. 4.

- 18 007776- 18 007776

Таблица 4Table 4

Слово/словосочетание Word / Phrase Ассоциированное слово/словосочетание Associate word / phrase Частота Frequency Частота появления точно через 4 слова после Frequency of occurrence exactly through 4 words after ОосТог OosTog зпеегьпд zpeegpd 1 one 1 one £1и £ 1and 1 one 0 0 гезЕ geze 1 one 0 0 Зпеегхпд Zpeeghpd скэсЬог skogog 1 one 0 0 £1и £ 1and 1 one 0 0 гез£ geez £ 1 one 0 0 Пи Pi зпеегтпд zpeegtpd 1 one 0 0 босЪог bosog 1 one 0 0 гезЕ geze 1 one 0 0 Кез£ Kez £ зпеегьпд zpeegpd 1 one 0 0 йосЕог yosEog 1 one 0 0 £1и £ 1and 1 one 0 0

Как видно из табл. 4, из повторяющихся слов в интервале предложения 1 и предложения 2 только слово δηββζίηΰ; повторяется дважды точно на расстоянии 4 слов после одного из анализируемых слов. Данные таблицы, показывающие точные повторяющиеся комбинации слов в тексте на основании их близости друг к другу, измеряемой числом слов между ними, могут создаваться индивидуально с использованием серии узко заданных интервалов.As can be seen from the table. 4, from repeating words in the interval of sentence 1 and sentence 2 only the word δηββζίηΰ; repeated twice exactly at a distance of 4 words after one of the analyzed words. Data tables showing exact repeating combinations of words in the text based on their proximity to each other, measured by the number of words between them, can be created individually using a series of narrowly defined intervals.

Если вышеописанный способ применяют для построения базы данных всех взаимосвязей по степени близости и частотности между всеми повторяющимися комбинациями слов в доступном тексте в соответствии с вышеприведенным описанием, то может потребоваться большое число вычислений. Многие взаимосвязи, которые строятся в результате выполнения данной комплексной процедуры, могут никогда не потребоваться для приложения. Нижеописанный метод предусматривает индексацию повторяющихся словосочетаний, чтобы избежать выполнения заранее обработки, которая может никогда не потребоваться.If the above method is used to build a database of all the relationships in terms of proximity and frequency between all repeated combinations of words in the accessible text in accordance with the above description, then a large number of calculations may be required. Many of the relationships that are built as a result of this complex procedure may never be required for the application. The method described below indexes duplicate phrases to avoid pre-processing that may never be necessary.

Нижеописанную процедуру индексации можно применить как процедуру, альтернативную вышеописанному способу автоматического определения ассоциаций по частоте и степени близости, и чтобы выполнять общий интервально-частотный анализ и анализ точных комбинаций на основании местоположений конкретного слова или словосочетания в интервале в соответствии с вышеприведенным описанием. Данный вариант осуществления изобретения является способом построения такой базы данных повторяющихся слов и словосочетаний (или базы данных повторных появлений), которая содержит местоположение каждого повторяющегося слова и словосочетания в документальной базе данных, при этом способ содержит следующие этапы. 1. Поиск повторных появлений всех слов и словосочетаний в доступном тексте. 2. Ввод в базу данных «местоположений» для каждого неоднократно появляющегося слова и словосочетания посредством фиксирования его позиции в каждом документе, в котором оно появляется, например отождествлением номера слова у первого слова в словосочетании и номера документа в документальной базе данных. В соответствии с альтернативным вариантом сохранять можно только номер документа в документальной базе данных для документа, в котором находится слово или словосочетание. В данном случае позицию слова или словосочетания можно определить при ответе на запрос. Табл. 5 является примером информационных элементов в базе данных повторных появлений.The indexing procedure described below can be used as an alternative to the method described above for automatically determining associations by frequency and degree of proximity, and to perform general frequency-frequency analysis and analysis of exact combinations based on the location of a particular word or phrase in the interval in accordance with the above description. This embodiment of the invention is a method of constructing such a database of repeated words and phrases (or a database of repeated occurrences), which contains the location of each repeated word and phrases in a document database, the method comprising the following steps. 1. Search for repeated occurrences of all words and phrases in the accessible text. 2. Entering into the database of “locations” for each repeatedly appearing word and phrase by fixing its position in each document in which it appears, for example, by identifying the word number of the first word in the phrase and the document number in the document database. In accordance with an alternative embodiment, only the document number can be stored in the document database for the document in which the word or phrase is located. In this case, the position of a word or phrase can be determined when responding to a request. Tab. 5 is an example of information elements in a reappearance database.

- 19 007776- 19 007776

Таблица 5Table 5

Слово или словосочетание Word or phrase Частота и местоположение Frequency and location ктбз Ιονθ а магт кид ktbz Ιονθ а magt kid 20 раз (слово 58/ документ 1678; слово 4 5/ документ 560; слово 187/ документ 45231; слово 689/ документ 123; . ..) 20 times (word 58 / document 1678; word 4 5 / document 560; word 187 / document 45231; word 689 / document 123; ...) кШз Ιονβ хсе сгеат кШз Ιονθ а магт кид Ье£оге дотпд Со Ьес! ктЬз Ιονε 1се сгеат Ье£оге дотпд Со ЬесТ' кхЛз Ιονε зСаутпд ир 1аСе Ье£оге дохпд Со Ьес! KShz Ιονβ xse sgeat KGZ Ιονθ and Mag Kid Kid ог д д п п Со ес! ktz Ιονε 1se sgeat Bbc khlz Ιονε sSautpd ir 1aCе bе е до х п Со Со ес! 873 раза (слово 765/ документ 129; слово 231/ документ 764907; слово 652/ документ 4501; ...); 12 раз (слово 58/ документ 1678; слово 45/ документ 560; слово 187/ документ 45231;...) 10 раз (слово 765/ документ 129; слово 231/ документ 764907; ...) 17 раз (слово 23/ документ 561; слово 431/ документ 76431;...) 873 times (word 765 / document 129; word 231 / document 764907; word 652 / document 4501; ...); 12 times (word 58 / document 1678; word 45 / document 560; word 187 / document 45231; ...) 10 times (word 765 / document 129; word 231 / document 764907; ...) 17 times (word 23 / document 561; word 431 / document 76431; ...) Ье£оге доз.пд Со Ьес! Bf £ dose. Bf bc! 684 раз (слово 188/ документ 28; слово 50/ документ 560; слово 7 69/ документ 129; слово 436/ документ 76431;...) 684 times (word 188 / document 28; word 50 / document 560; word 7 69 / document 129; word 436 / document 76431; ...)

Как показано, каждое появление слова или словосочетания, обнаруженного, по меньшей мере, 2 раза в документальной базе данных, будет прибавляться к подсчитанной частоте, а местоположение данного слова или словосочетания будет отмечаться обозначением позиции номером слова в документе, а также номером, присвоенным для идентификации документа, в котором слово появляется, или посредством использования любого другого идентификатора местоположения слова или словосочетания в документальной базе данных.As shown, each occurrence of a word or phrase found at least 2 times in the document database will be added to the calculated frequency, and the location of this word or phrase will be marked with a position symbol by the word number in the document, as well as the number assigned for identification the document in which the word appears, or by using any other identifier for the location of the word or phrase in the document database.

Если база данных повторных появлений сформирована целиком и полностью (включая нумерованные позиции слов, а также номера документов) для всех документов в документальной базе данных, то информация о местоположении позволяет системе вычислять любые общие взаимосвязи по частоте или любые взаимосвязи по частоте появления конкретной комбинации слов, создаваемые в соответствии с вышеприведенным описанием.If the database of repeated occurrences is formed entirely and completely (including numbered word positions, as well as document numbers) for all documents in the document database, then the location information allows the system to calculate any general relationships in frequency or any relationships in the frequency of occurrence of a particular combination of words, created in accordance with the above description.

Кроме того, если база данных повторных появлений еще не построена, то система может на ходу анализировать частоты появления, по меньшей мере, в двух интервалах. Любое повторное появление слова или словосочетания, еще не внесенное в базу данных повторных появлений, можно включать в базу данных, пока система отвечает на запрос анализом непосредственно документов в документальной базе данных, чтобы дополнить анализ базы данных повторных появлений. После того как информацию, полученную непосредственным анализом документов в документальной базе данных, используют в конкретной задаче, для которой данная информация создавалась, информацию можно сохранить в базе данных повторных появлений для любого будущего использования. Выполняет ли система анализ частот появления (частотный анализ) с использованием базы данных повторных появлений, или на ходу строятся упомянутые взаимосвязи, в результате данных действий создается база данных ассоциаций слов и словосочетаний, которую могут применять интеллектуальные приложения.In addition, if the database of reappearances has not yet been built, then the system can on the fly analyze the frequency of occurrence in at least two intervals. Any reappearance of a word or phrase that has not yet been entered into the reappearance database can be included in the database while the system responds to a request by analyzing directly the documents in the document database to supplement the analysis of the reappearance database. After the information obtained by the direct analysis of documents in the document database is used in the specific task for which this information was created, the information can be stored in the reappearance database for any future use. Whether the system performs an analysis of occurrence frequencies (frequency analysis) using a database of repeated occurrences, or the relationships are built on the fly, as a result of these actions, a database of word and word associations is created that can be used by intelligent applications.

Как видно из фиг. 3, в рамках процедуры общего частотного анализа, интеллектуальное приложение 302 может запрашивать частотную ассоциативную базу данных или базу данных повторных появлений через программу 304 ассоциирования посредством ввода, по меньшей мере, 2 слов или словосочетаний о том, чтобы установить, какие другие третьи слова или словосочетания часто ассоциируются с некоторыми или всеми представленными словосочетаниями. Система может применять два разных способа при выполнении общего частотного анализа (СТА): либо 1) независимый общий частотный анализ, либо 2) связанный общий частотный анализ. Кроме того, система может дополнительно выполнять статистиAs can be seen from FIG. 3, as part of a general frequency analysis procedure, the smart application 302 can query a frequency associative database or a reappearance database through an association program 304 by entering at least 2 words or phrases to establish which other third words or phrases often associated with some or all of the phrases presented. The system can apply two different methods when performing a common frequency analysis (CTA): either 1) an independent general frequency analysis, or 2) an associated general frequency analysis. In addition, the system can additionally perform statistics

- 20 007776 ческий анализ после выполнения любой из двух процедур посредством распространения их на дополнительное поколение или поколения данных или посредством сочетания результатов и/или сегментов любого общего частотного анализа для последующего частотного анализа.- 20 007776 analysis after performing any of the two procedures by distributing them to an additional generation or generation of data or by combining the results and / or segments of any general frequency analysis for subsequent frequency analysis.

Независимый общий частотный анализ (1СЕА)Independent General Frequency Analysis (1CEA)

Когда интеллектуальное приложение 302 представляет программе 304 ассоциирования, по меньшей мере, 2 слова и/или словосочетания для общего частотного анализа (СЕА), система может идентифицировать все слова и словосочетания, часто связываемые с представленными словами с использованием ассоциативной базы данных в соответствии с настоящим изобретением. Затем система может идентифицировать слова и/или словосочетания, которые часто ассоциируются с некоторыми или всеми представленными словами или словосочетаниями.When the smart application 302 presents at least 2 words and / or phrases for common frequency analysis (CEA) to the associating program 304, the system can identify all words and phrases often associated with the presented words using an associative database in accordance with the present invention . The system can then identify words and / or phrases that are often associated with some or all of the words or phrases represented.

Затем система может использовать общие ассоциации между представленными словами и/или словосочетаниями множеством заданных пользователем способов. Например, система может идентифицировать общую ассоциацию самого высокого ранга суммированием (или умножением или любым другим заданным пользователем способом взвешивания) частот для общей ассоциации или ассоциации по общему третьему слову или словосочетанию к представленным словам и/или словосочетаниям в частотной ассоциативной базе данных. Другим примером задаваемого пользователем параметра, который может потребоваться, является минимальная частота (оцениваемая по общему рангу, номеру строки или другому критерию) по всем таблицам представленных слов и/или словосочетаний.The system can then use common associations between the presented words and / or phrases in a variety of user-defined ways. For example, the system can identify a common association of the highest rank by summing (or multiplying or any other user-defined weighting method) frequencies for a common association or association by a common third word or phrase to the presented words and / or phrases in a frequency associative database. Another example of a user-defined parameter that may be required is the minimum frequency (estimated by the overall rank, line number, or other criteria) for all tables of the words and / or phrases presented.

При использовании элементов данных в примере базы данных повторных появлений система может определить частоту, с которой 1се сгеат и к1бз ίονβ появляются в заданном пользователем интервале во всех доступных документах за 1 анализ, и затем система может зарегистрировать частоту, с которой 1се сгеат и Ьейэге §οίπ§ ΐο Ьеб появляются вместе. Затем частотой каждой из независимых связей сможет воспользоваться приложение, которое выдаст относительное значение для каждой связи. Значение будет получено на основе того, как оценивается (по заданию пользователя в абсолютном или относительном исчислении) частота фразы 1се сгеат в частотной таблице фразы к1бз 1ονе и в частотной таблице фразы 'Ьейэге §οίπ§ ΐο Ьеб, или на основе процентного отношения количества случаев появления ассоциации (например, 1се сгеат) со словом или словосочетанием (например, к1бз Ιο\ό) к общему количеству случаев появления словосочетания (например, к1бз 1ονе). И вновь, частотные таблицы для к1бз Ιο\ό и Ьейэге §οίπ§ ΐο Ьеб представляют собой табличные классификации по рангам появлений третьих слов или словосочетаний на основе их близости к выбранным словосочетаниям к1бз 1ονе и Ьейэге §οίπ§ ΐο Ьеб.When using data elements in the example of the reappearance database, the system can determine the frequency with which 1 all sgeat and k1bz ίονβ appear in the user-defined interval in all available documents for 1 analysis, and then the system can register the frequency with which 1 all sgeat and ей э ге § §οίπ § ΐο Ьб appear together. Then the frequency of each of the independent links will be able to use the application, which will give a relative value for each link. The value will be obtained on the basis of how the frequency of the phrase 1се сgeat is estimated (according to the user's instructions in absolute or relative terms) in the frequency table of the phrase к1бз 1ονе and in the frequency table of the phrase 'эейэге § §ίίί§ί или или или, or based on the percentage of the number of occurrences association (for example, 1se sgeat) with a word or phrase (for example, к1бз Ιο \ ό) to the total number of cases of occurrence of a phrase (for example, к1бз 1ονе). Again, the frequency tables for k1bz \ο \ ό and ей ей § § § § представляют представляют представляют представляют are tabular classifications according to the rank of occurrence of third words or phrases based on their proximity to the selected phrases k1bz 1ονе and ей ΐ ΐ ΐ ΐ ΐ.

В соответствии с данным способом на основе заданных пользователем значений после анализа фразы 1се сгеат можно проанализировать на относительную частотность фразу а шагт йид определением ее положения в частотной таблице для к1бз 1ονе (на основании заданных пользователем требований приложения к ширине интервала или степени близости), а затем определить положение фразы а шагт йид в частотной таблице для фразы Ьейэге дο^ηд ΐο Ьеб. Все остальные частые ассоциации (заданные пользователем) в обеих частотных таблицах будут сравниваться, например фраза з!аутд ир 1а1е, и оцениваться на основании заданных пользователем значений комбинированных относительных частот из обеих таблиц. Система выдаст словосочетание самого высокого ранга на основании заданного пользователем весового коэффициента каждой ассоциации по частоте. Возможно, в результате данного анализа система определит, что, хотя к1бз Ιο\ό («дети любят») 1се сгеат («мороженое») больше, чем \\агт йидз («сердечные объятия»), однако, к1бз Ιο\Ό ^агт йидз («дети любят сердечные объятия») больше, чем к1бз Ιο\Ό 1се сгеат («дети любят мороженное») Ьейэге дο^ηд ΐο Ьеб («перед сном»).In accordance with this method, on the basis of user-defined values after analyzing the phrase 1se, the phrase can be analyzed for the relative frequency of the phrase and step by determining its position in the frequency table for k1bz 1ονе (based on user-defined requirements of the application for the width of the interval or degree of proximity), and then to determine the position of the phrase a step yid in the frequency table for the phrase ей э ге д д д.. еб. All other frequent associations (user-defined) in both frequency tables will be compared, for example, the phrase h! Outdir 1a1e, and evaluated on the basis of user-specified values of combined relative frequencies from both tables. The system will issue a phrase of the highest rank based on a user-defined weight coefficient of each frequency association. Perhaps, as a result of this analysis, the system will determine that, although k1bz Ιο \ ό (“children love”) 1se sgeat (“ice cream”) is larger than \\ agt yids (“heart hugs”), however, k1bz Ιο \ Ό ^ agt yidz (“children love hearty hugs”) is more than k1bz Ιο \ Ό 1se sgeat (“children love ice cream”) Ь э ге д ΐ (((((((((((еб ΐ ΐ ΐ ΐ ΐ ΐ еб еб (((((((((((((((((((((((((((((((((((((((((((((й больше ΐ ΐ.

В качестве другого примера, когда в систему введены слово каηда^οοз и слово и словосочетание ίίηά и ίη Атепса для независимого общего частотного анализа, представлена табл. 6, представляющая собой частотную таблицу, которую можно собрать по документам в документальной базе данных.As another example, when the word kanda ^ ooz and the word and phrase ίίηά and ίη Ateps are introduced into the system for an independent general frequency analysis, the table is presented. 6, which is a frequency table that can be collected from documents in a document database.

Таблица 6Table 6

АССОЦИАЦИИ ASSOCIATIONS АизкгаИа AizkgaIa кке Ζοο Kke Ζοο Иею 2еа1апс1 Jeyu 2aaaps1 капдагооз capdagoosis 21000 21000 7000 7000 1000 1000 ίίηά ίίηά 1000 1000 2000 2000 500 500 ίη Атегъса; ίη Atega; 300 300 5000 5000 100 one hundred Итого Total 22300 22300 14000 14000 1600 1600

Слово АизйаНа имеет самый высокий ранг, исходя из суммы совокупных ассоциаций по строкам. Однако заданные пользователем параметры могут взвешивать относительные значения частот. Так, поThe word Aizyana has the highest rank, based on the sum of the total associations in rows. However, user-defined parameters can weight relative frequency values. So, by

- 21 007776 одному их возможных способов, ассоциации с наименьшей частотой можно присвоить оценку один, а затем ассоциации с большими частотами можно оценить в зависимости от кратности к наименьшей частоте. В рассматриваемом случае фраза Ле /оо будет иметь самый высокий ранг.- 21 007776 one of the possible ways, associations with the lowest frequency can be assigned a rating of one, and then associations with the highest frequencies can be evaluated depending on the multiplicity to the lowest frequency. In this case, the phrase Le / oo will have the highest rank.

Таблица 7Table 7

АизГгаПа AizGgaPa РЬе Ζοο Rie Ζοο Νθν 2еа1апс1 Νθν 2еа1апс1 капдагооз capdagoosis 21 (в 21 раз выше наименьшей частоты) 21 (21 times above lowest frequency) 7 (в 7 раз выше наименьшей частоты) 7 (7 times the lowest frequency) 1 (наименьшая частота) 1 (smallest frequency) мкеге сап I ίίηά mkege sap I ίίηά 2 2 4 4 1 one ίη Атег1са ίη Ateg1sa 3 3 50 fifty 1 one Итого Total 26 26 61 61 3 3

Относительные веса ассоциаций показывают, как /оо станет результатом на основании вышеупомянутого заданного пользователем параметра. Аналогичные результаты можно получить умножением количества раз, когда конкретное слово или словосочетание ассоциируется с каждым из запросов, чтобы придать значение относительному равновесию между общими ассоциациями. В нашем примере, в результате выдается Ле /оо:The relative weights of the associations show how / oo will result based on the aforementioned user-specified parameter. Similar results can be obtained by multiplying the number of times a particular word or phrase is associated with each of the queries in order to emphasize the relative equilibrium between common associations. In our example, the result is Le / oo:

1. Ле /оо 7000 х 2000 х 5000 = 70,000,000,0001. Le / oo 7000 x 2000 x 5000 = 70,000,000,000

2. АизЕайа 21000 х 1000 х 300 = 6,100,000,0002. AizEaya 21000 x 1000 x 300 = 6,100,000,000

3. \е\\' 7еа1апб 1000 х 500 х 100 = 50,000,0003. \ e \\ '7еа1апб 1000 х 500 х 100 = 50,000,000

Чтобы классифицировать по рангу и выбрать ассоциации, общие, по меньшей мере, для 2 представленных слов и/или словосочетаний, можно применить другие заданные пользователем критерии. Сюда можно отнести оценивание некоторых ассоциаций в некоторых категориях выше остальных. Например, приложение может присвоить более высокое значение ассоциации «местоположения» (например, ΐη Атепса) для вопроса «где?» (например, ууНеге саη уои Гтб к^даток ΐη Атепса? («где можно обнаружить кенгуру в Америке?»).To classify by rank and select associations that are common to at least 2 of the words and / or phrases presented, other user-defined criteria can be applied. This includes the assessment of some associations in some categories above others. For example, an application might assign a higher association value for a location (for example, ΐη Atepsa) to the question “where?” (For example, uneNega saη uoy GTB to ^ datok ΐη Atepsa (“where can a kangaroo be found in America?”).

Связанный общий частотный анализ (КСГА)Related General Frequency Analysis (CSAG)

Кроме отыскания общих независимых ассоциаций, по меньшей мере, к 2 представленным словам и/или словосочетаниям, в соответствии с другим вариантом осуществления можно осуществлять поиск с целью определения частых появлений слов и/или словосочетаний, которые обнаруживаются в заданных пользователем интервалах, но только в документах, содержащих, по меньшей мере, 2 анализируемых слова или словосочетания.In addition to finding common independent associations for at least 2 represented words and / or phrases, in accordance with another embodiment, a search can be performed to determine the frequent occurrences of words and / or phrases that are found in user-defined intervals, but only in documents containing at least 2 analyzed words or phrases.

Данный вариант осуществления содержит следующие этапы.This embodiment comprises the following steps.

a. В базе данных находят номера всех документов, общих, по меньшей мере, для 2 представленных слов и/или словосочетаний.a. The database contains the numbers of all documents common to at least 2 of the presented words and / or phrases.

b. Сравнивают каждое слово и словосочетание в заданных пользователем интервалах вблизи всех представленных слов и/или словосочетаний и регистрируют частоту для всех повторяющихся слов и словосочетаний в интервалах. И вновь, заданный пользователем интервал может быть ограничен и может содержать только повторяющиеся слова или словосочетания в непосредственной близости от представленных слов или словосочетаний.b. Compare each word and phrase in user-defined intervals near all the words and / or phrases presented and record the frequency for all repeated words and phrases in the intervals. Again, a user-defined interval may be limited and may contain only repeating words or phrases in the immediate vicinity of the presented words or phrases.

Например, допустим, что системе предъявлены 2 словосочетания Лбз 1оуе и ЬеГоге дотд 1о Ьеб для связанного общего частотного анализа (КСГА). Если база данных уже содержит следующие элементы данных, соответствующие фразам в документах в документальной базе данных:For example, suppose the system is presented with 2 phrases Лбз 1ее and ЛеГоге дотд 1о Лэб for related general frequency analysis (CSGA). If the database already contains the following data elements corresponding to phrases in documents in the document database:

'к1бз 1оуе а \уагт Гид 'k1bz 1ou a \ uagt Guide 20 раз 20 times 'к1бз 1оуе 1се сгеат 'k1bz 1ou 1se sgeat 873 раза 873 times 'к1бз 1оуе а \уагт Гид ЬеГоге дотд 1о Ьеб 'k1bz 1ou a \ uagt Guide LeGoge dotd 1o Leb 12 раз 12 times 'к1бз 1оуе 1се сгеат ЬеГоге дотд 1о Ьеб 'k1bz 1ou 1se sgeat LeGoge dotd 1o Leb 10 раз 10 times 'к1бз 1оуе 81аутд ир 1а1е ЬеГоге дотд 1о Ьеб 'k1bz 1ou 81autd ir 1a1e LeGoge dotd 1o Leb 17 раз 17 times ЬеГоге дотд 1о Ьеб LeGoge Dotd 1o Leb 684 раза 684 times

база данных повторных появлений может направить систему к документам, которые находятся в документальной базе данных и содержат как фразу Лбз 1оуе, так и фразу ЬеГоге дотд 1о Ьеб, потому что у них одинаковый связанный с ними номер документа. Кроме того, при необходимости, система может отыскивать только те документы, в которых расстояние между словосочетаниями не превышает заданное пользователем число слов или соответствует любой другой заданной пользователем степени близостиthe reappearance database can direct the system to documents that are in the documentary database and contain both the phrase з з оу е е and the phrase Г Г ог от от от 1 1 еб because they have the same document number associated with them. In addition, if necessary, the system can only search for documents in which the distance between phrases does not exceed a user-specified number of words or matches any other user-defined degree of proximity

- 22 007776 друг к другу.- 22 007776 to each other.

После того как система идентифицировала в документальной базе данных все документы, которые содержат фразу к1й§ 1оус в заданной близости от фразы ЬсГогс дотд ίο Ьсй, система может построить частотную таблицу всех повторяющихся слов и словосочетаний в пределах заданного пользователем интервала. Из ограниченного примера вышеописанной базы данных слов и словосочетаний известно, что фраза 1сс сгсат будет появляться с частотой не менее 10, фраза ь1ау1пд ир 1аГс - с частотой не менее 17 и фраза а теагт 1шд - с частотой не менее 12. Все указанные частоты могут быть намного выше, поскольку соответствующие фразы могут появляться в одном и том же тексте вблизи фраз к1йь 1оус и 'ЬсГогс дотд 1о Ьсй без непосредственного примыкания к ним (например, к1й§ 1оус 1сс сгсат апй оГЬсг 5\\'сс15 ЬсГогс дотд 1о Ьсй).After the system has identified all documents in the documentary database that contain the phrase k1y§ 1oos in the specified proximity from the phrase bcGogs btd bc, the system can build a frequency table of all repeated words and phrases within a user-defined interval. From a limited example of the above database of words and phrases, it is known that the phrase 1cc ssat will appear with a frequency of at least 10, the phrase b1a1pd ir 1aGs will appear with a frequency of at least 17 and the phrase a teag 1shd with a frequency of at least 12. All of these frequencies can be much higher, since the corresponding phrases can appear in the same text near the phrases k1y1ouc and 'bcogs dotd 1o bc without directly adjoining them (for example, k1y§ 1ouc ccsat apy bcrc 5 \\' cc15 bcogs bdc 1o bcb).

На запрос \ν1ιηΙ йо к1й§ 1оус ЬсГогс дотд 1о Ьсй? («что дети любят перед сном?») можно дать много «правильных» ответов. Однако, если есть критическая масса документов, отражающих различные характерные мнения, многие более высокие частоты будут отражать консенсус по вопросу, а низкие частоты существующие альтернативные мнения. Например, в интервале с фразами к1й§ 1оус и ЬсГогс дотд 1о Ьсй может 3 раза присутствовать фраза 1ю1 кЬотег, что указывает на приоритетный порядок мнения, которое далеко не так популярно, как некоторые другие мнения.At the request of \ ν1ιηΙ yo k1y§ 1ous bcGogs dotd 1o bc? (“What do children like before going to bed?”) You can give a lot of “right” answers. However, if there is a critical mass of documents reflecting different characteristic opinions, many higher frequencies will reflect consensus on the issue, and lower frequencies will reflect alternative opinions. For example, in the interval with the phrases k1y§1oc and bcGogs dotd 1o bc3, the phrase 1u1 kboteg may be present 3 times, which indicates the priority order of opinion, which is far from being as popular as some other opinions.

В соответствии с другими вариантами осуществления настоящего изобретения для независимого общего частотного анализа (1СЕА) или связанного общего частотного анализа (ЯСЕА) можно использовать тезаурус или любые другие известные или установленные эквиваленты словосочетаний вместо отыскиваемых слов и словосочетаний, чтобы находить повторяющиеся слова и словосочетания по интервалам данных эквивалентов слов. Например, система может также производить поиск фраз к1й§ Ькс, к1й§ геа11у 1оус, к1й§ сп)оу, сЫ1йгсп сп)оу, сЫ1йгсп 1оус, вместо фразы к1й§ 1оус. Тот же самый метод можно использовать, чтобы заменить в системе фразу ЬсГогс дотд 1о Ьсй известными эквивалентами типа фраз ЬсГогс Ьсй, ЬсГогс дотд 1о Исср, ЬсГогс Ьсййтс. Сочетание известного в технике тезауруса слов и/или общих частотных способов в соответствии с настоящим изобретением будет давать большее число семантически эквивалентных слов и словосочетаний. Ниже следует общее разъяснение того, каким образом система определяет семантически эквивалентные словосочетания с использованием ассоциативных баз данных и интеллектуального приложения 302 и посредством общего частотного анализа. Система может также исполнять независимый общий частотный анализ (1СЕА) и связанный общий частотный анализ (ЯСЕА) представленных слов и словосочетаний и сочетать результаты с использованием заданных пользователем весовых параметров.In accordance with other embodiments of the present invention, for the independent general frequency analysis (1CEA) or related general frequency analysis (JCEA), you can use a thesaurus or any other known or established phrase equivalents instead of the searched words and phrases to find duplicate words and phrases over data intervals equivalents of words. For example, the system can also search for phrases k1y§ bks, k1y§ gea11u 1oc, k1y§ cn) oo, ci1ygsp cn) oo, ci1ygsp 1oos, instead of the phrase k1y§ 1oos. The same method can be used to replace in the system the phrase bcGogs dotd 1o bc with well-known equivalents of the type of phrases bcGogs bcd, bcGogs dotd 1o Issr, bcGogs bc. A combination of words and / or general frequency methods known in the thesaurus technique in accordance with the present invention will produce a greater number of semantically equivalent words and phrases. The following is a general explanation of how the system determines semantically equivalent phrases using associative databases and intelligent application 302 and through general frequency analysis. The system can also perform independent general frequency analysis (1CEA) and associated general frequency analysis (YAEA) of the words and phrases presented and combine the results using user-defined weight parameters.

Частотный анализ второго уровняLevel 2 Frequency Analysis

В соответствии с другим вариантом осуществления система может выполнять частотный анализ с использованием общей ассоциации между 1-ым или 2-ым словом или словосочетанием и выбранным 3им словом или словосочетанием в качестве общей частоты для 2 анализируемых слов или словосочетаний, что добавит новую информацию к результатам анализа для приложения. Например, если общая ассоциация, выбранная по частотам всех слов и словосочетаний в пределах общего интервала фраз ЬсГогс дотд 1о Ьсй (1-я) и к1йь 1оус (2-я), представляет собой фразу 1сс сгсат (3-я), то в соответствии с данным вариантом осуществления выполняется либо независимый, либо связанный частотный анализ для фраз либо ЬсГогс дотд 1о Ьсй (1-я) и 1сс сгсат (3-я), либо к1й§ 1оус (2-я) и 1сс сгсат (3-я) и выбираются ассоциации на основании результатов 2 данных анализов. Кроме того, любые, по меньшей мере, 2 слова или словосочетания можно анализировать с использованием таких же методов в стольких сочетаниях такого количества поколений результатов, сколько задает пользователь. Специальные приложения будут запрашивать выполнение автоматизированного анализа, выявляющего общий частотный анализ, который следует выполнить для каждого поколения результатов анализа частот ассоциаций. Более сложные приложения будут выявлять, по меньшей мере, 2 частотных анализа, которые должны быть выполнены перед тем, как использовать в сочетании, по меньшей мере, 2 независимых результата.In accordance with another embodiment, the system can perform frequency analysis using a common association between the 1st or 2nd word or phrase and the selected 3rd word or phrase as the total frequency for the 2 analyzed words or phrases, which will add new information to the analysis results for the application. For example, if a general association, selected by the frequencies of all words and phrases within the general interval of phrases bcGogs dotd 1o bcb (1st) and k1b 1stc (2nd), is a phrase 1cc cgsat (3rd), then in accordance with this embodiment, either independent or related frequency analysis is performed for phrases or bcGogs dotd 1o bcf (1st) and 1cc csat (3rd) or k1§ 1c (2nd) and 1cc csat (3rd) and associations are selected based on the results of 2 analyzes. In addition, any at least 2 words or phrases can be analyzed using the same methods in as many combinations of as many generations of results as the user sets. Special applications will request an automated analysis to identify a common frequency analysis to be performed for each generation of association frequency analysis results. More sophisticated applications will identify at least 2 frequency analyzes that must be performed before using at least 2 independent results in combination.

Использование общего частотного анализа для определения функции или значения словаUsing general frequency analysis to determine the function or meaning of a word

В соответствии с описанием заявки № 10/024473 на патент США получаемые с высокой частотой ассоциации между анализируемыми словом и словосочетаниями и слово, и словосочетания, которые найдены в их интервалах и не являются переводами, но являются тесно связанными понятиями, можно использовать в приложениях искусственного интеллекта.In accordance with the description of US patent application No. 10/024473, the associations obtained between the analyzed word and phrases and the word and phrases that are found at their intervals and are not translations but are closely related concepts that can be used in artificial intelligence applications can be used with high frequency .

Искусственный интеллект или интеллектуальное приложение представляет собой приложение, которое способно ответить на вопрос или выполнить задачу, которые не обязательно ставились в прошлом с требованием, соответственно, дать ответ или выполнить задачу. В соответствии с настоящим изобретением можно использовать ассоциативные базы данных, чтобы распознавать словообразования и/или комбинации слов и словосочетаний, которыми можно воспользоваться как указателями классов для определения функции или назначения других слов или словосочетаний, ассоциированных с указателями классов. Например, конкретную комбинацию слов обычно можно ассоциировать со словом, которое является именем человека, типом пищи или действием. В соответствии с настоящим изобретением с использованием общего частотного анализа можно анализировать документы, чтобы выявлять существование данных комбинаций и их ассоциацию с другими словами или словосочетаниями. На основанииArtificial intelligence or an intelligent application is an application that is able to answer a question or perform a task that was not necessarily posed in the past with a requirement, respectively, to give an answer or complete a task. Associative databases can be used in accordance with the present invention to recognize word formations and / or combinations of words and phrases that can be used as class pointers to determine the function or purpose of other words or phrases associated with class pointers. For example, a particular combination of words can usually be associated with a word that is a person’s name, type of food, or action. In accordance with the present invention, using general frequency analysis, documents can be analyzed to detect the existence of these combinations and their association with other words or phrases. Based

- 23 007776 данной ассоциации, система может классифицировать другие слова, которые аналогичным образом ассоциированы с этими комбинациями, так как другие слова, которые ассоциированы аналогичным образом, очевидно, должны попадать в аналогичные классы. Следовательно, система может выявлять наличие указателей классов и использовать данные указатели.- 23 007776 of this association, the system can classify other words that are similarly associated with these combinations, since other words that are associated in a similar way should obviously fall into similar classes. Therefore, the system can detect the presence of class pointers and use these pointers.

Один из примеров описанного приложения состоял бы в том, чтобы помогать способу перевода в соответствии с настоящим изобретением при выполнении переводов, которые система не может сделать иначе, с использованием вышеописанных процедур. Например, допустим, система получила запрос на английском языке, I 1оуе МозНе, для перевода на язык X. Допустим, система располагает переводом словосочетания I 1оуе, но не имеет переводы для словосочетаний I 1оуе МозНе или 1оуе МозНе.One example of the described application would be to assist the translation method in accordance with the present invention in making translations that the system cannot do otherwise using the above procedures. For example, suppose the system received a request in English, I 1st MozNe, for translation into X. Suppose the system has a translation of the phrase I 1stoue, but does not have translations for the phrases I 1stou Mozne or 1st mozne.

Ассоциативная база данных содержит слово МозНе в словосочетаниях типа ту пате 15 МозНе, Мг. МозНе Ееш, 1из пате 18 МозНе. Чтобы выявить взаимосвязь между данными словосочетаниями и именем МозНе, можно воспользоваться общим частотным анализом (СЕЛ). Тогда пользователь может указать системе данные фразы как фразы, обладающие высокой степенью корреляции с именами и потому являющиеся индикаторами имен, т.е. индикатором категории конкретного типа. Когда слово МозНе появится в заданном пользователем числе (или процентной части) фраз, являющихся «индикаторами имени», система определит статистическую достоверность того, что слово МозНе потенциально является именем, потому что оно появляется в тексте, который является «индикатором имени».The associative database contains the word MozNe in phrases such as tupate 15 MozNe, Mg. MozNee Yesh, 1of the 18 MozNe. To identify the relationship between these phrases and the name MozNe, you can use the general frequency analysis (CEL). Then the user can indicate to the system these phrases as phrases that have a high degree of correlation with names and therefore are indicators of names, i.e. category category indicator. When the word MozNe does not appear in a user-specified number (or percentage) of phrases that are “name indicators”, the system will determine the statistical certainty that the word MozNe is potentially a name because it appears in the text, which is a “name indicator”.

Хотя другие известные в технике системы также используют такие индикаторы имен и другие индикаторы категорий, например, для дат, чисел и других специальных классов, настоящее изобретение дает возможность использовать кодированные вручную индикаторы типа фраз, сообщающих об именах, чтобы выявить все остальные фразы, в которых также появляются имена наподобие МозНе и другие известные имена. Например, пользователь мог бы и не подумать о том, чтобы прибавить в качестве указателя имени фразу (Не диу'з пате 1з («имя парня»), однако, в соответствии с настоящим изобретением данная фраза будет представлена, а также многие другие, которые пользователь не включил при использовании данного варианта осуществления. Каждое слово и словосочетание обладает ограниченной совокупностью возможных альтернативных слов или словосочетаний, которые можно обнаружить среди окружающих слов и словосочетаний. Данная совокупность будет содержать слова и словосочетания, точно выражающие понятия, которые они заменяют, и будут иметь размах от исходно выраженного понятия до мыслей, которые являются прямыми противоположностями. Например, в процессе анализа фразы I 1оуе сНоео1а1е («я люблю шоколад») система может сформировать все возможные замены слова 1оуе. Система сформирует эквиваленты и почти эквиваленты типа I геа11у 1оуе сНосо1а1е («я действительно люблю шоколад»), I айоге сНосо1а1е («я обожаю шоколад»), I геа11у еп)оу сНосо1а1е («я действительно наслаждаюсь шоколадом»), а также неэквиваленты и противоположности типа I 1о1ега(е сНосо1а1е («я терпимо отношусь к шоколаду») и I На(е сНосо1а1е («я ненавижу шоколад»). Система не определит повторяющиеся частоты слов, которые не заполняют все, остающееся после слова 1оуе, с использованием независимого (или, в альтернативном варианте осуществления, связанного) общего анализа частот ассоциаций. Например, базы данных при анализе не будут выдавать фразы I ПзН сНосо1а1е («я ловлю в воде шоколад»), I уои сНосо1а1е («я вы шоколад»), I \\'Но сНосо1а1е («я кто шоколад»).Although other systems known in the art also use such name indicators and other category indicators, for example, for dates, numbers, and other special classes, the present invention makes it possible to use manually encoded indicators such as phrases reporting names to identify all other phrases in which names like MozNe and other famous names also appear. For example, the user might not have thought of adding the phrase (Not di'u paté 1z (“guy’s name”) as a name indicator, however, in accordance with the present invention, this phrase will be presented, as well as many others that the user did not turn on when using this embodiment, each word and phrase has a limited set of possible alternative words or phrases that can be found among the surrounding words and phrases. and phrases that express exactly the concepts that they replace, and will range from the original expression to thoughts that are direct opposites.For example, in the process of analyzing the phrase I 1ее с Ноео1а1е ("I love chocolate"), the system can form all possible word replacements 1ou. The system will form equivalents and almost equivalents of type I geo11u 1oue с Носо1а1е ("I really like chocolate"), I айоге с Носо1а1е ("I love chocolate"), I gea11u ep) оу с Носо1а1е ("I really enjoy chocolate"), and also nonequivalents, etc. on the contrary, type I 1o1ega (e cHoso1a1e (“I am tolerant of chocolate”) and I Na (e cHoso1ae (“I hate chocolate”). The system will not detect repeating word frequencies that do not fill everything remaining after 1ye, using an independent (or, in an alternative embodiment, related) general analysis of association frequencies. For example, databases during the analysis will not produce the phrases I ПЗН сНосо1а1е (“I catch chocolate in water”), I уо с сНосо1а1е (“I am chocolate”), I \\ 'But cНосо1а1е (“I am chocolate”).

Как только система установит, что слово МозНе является именем, и если фраза I 1оуе является индикатором имени (но не единственным, в котором когда-либо появлялось имя МозНе), то, если механизм перевода располагает переводом для слова МозНе на языке В, данный механизм может присоединить его к переводу I 1оуе на языке В без перекрытия. Если перевод слова МозНе на языке В не известен, то можно воспользоваться функцией транслитерации с английского языка на язык В, чтобы образовать на языке В представление имени МозНе и присоединить его к переводу фразы I 1оуе на язык В без перекрытия.As soon as the system determines that the word MozNe is a name, and if the phrase I 1ее is an indicator of the name (but not the only one in which the name MozNe has ever appeared), then if the translation mechanism has a translation for the word MozNe in language B, this mechanism can attach it to the translation of I 1oue in language B without overlapping. If the translation of the word MozNe in B is not known, then you can use the transliteration function from English to B to form a representation of the name MozNe in B and attach it to the translation of the phrase I 1oue into B without overlapping.

Имена, которые явно связаны с другими словами и/или словосочетаниями как имена, являются простым примером того, как определяемые пользователем общие статистические связи между словосочетаниями, отражающими понятия, можно классифицировать по общему значению с целью использования в интеллектуальном приложении. Кроме того, все словосочетания будут обладать собственными динамическими связями со всеми остальными связанными общими представлениями и понятиями, что наглядно подтверждается одноязычными ассоциативными базами данных, которые содержат перечень связанных понятий на основе частоты их нахождения в непосредственной близости друг от друга, когда они выражены на языке. У каждого словосочетания, составляющего осмысленное понятие, будет собственное множество связанных понятий в виде часто повторяющихся комбинаций в тексте, расположенных в определенной близости друг к другу, чтобы система получала вероятности значений для упомянутых понятий в любом заданном контексте.Names that are explicitly associated with other words and / or phrases as names are a simple example of how user-defined general statistical relationships between phrases that reflect concepts can be classified by their common value for use in an intelligent application. In addition, all phrases will have their own dynamic connections with all other related general concepts and concepts, which is clearly confirmed by monolingual associative databases that contain a list of related concepts based on the frequency of their being in close proximity to each other when they are expressed in a language. Each phrase that makes up a meaningful concept will have its own set of related concepts in the form of frequently repeated combinations in the text, located in a certain proximity to each other, so that the system receives the probability of values for the mentioned concepts in any given context.

Если, например, запрос перевода содержит слово, которое явно не является именем, то частоту для связанных понятий можно анализировать на следующем уровне соседних слов и словосочетаний, чтобы обеспечить дополнительный контекст. Например, если запрос на английском языке, подлежащий переводу на язык В, имеет вид I 1оуе ЕаНН, то данный запрос несколько неоднозначен, так как слово ЕаНН может быть именем или «чувством веры без доказательства».If, for example, a translation request contains a word that is clearly not a name, then the frequency for related concepts can be analyzed at the next level of adjacent words and phrases to provide additional context. For example, if a request in English to be translated into language B is of the form I 1ее ЕАНН, then this request is somewhat ambiguous, since the word ЕАНН may be a name or “a sense of faith without proof”.

Если другими соседними словами около фразы I 1оуе ЕаНН в полном запросе перевода являютсяIf other neighboring words near the phrase I 1ее ЕАНН in the full transfer request are

- 24 007776- 24 007776

Нег («ее») и кНе («она»), а не доб («бог»), гебдюи («религия»), сНигсН («церковь») и т.д., то система применит формулы, которые взвесят частоту, степень близости, а также другие индикаторы категорий в отношении ассоциаций, существующих в базе данных системы, и будет «понимать», что следует выбрать перевод Вера (Рабй) как «имя», а не вера (Рабб) как «вера без доказательства». Остальные соседние слова и словосочетания вместе с их набором повторяющихся связей с другими понятиями будут представлять дополнительное подтверждение намерений говорящих, пока статистическая значимость не зафиксирует ответ или система не запросит пользователя дать разъяснения из-за недостатка информации. Такое случилось бы, например, если бы весь вопрос имел вид I 1оуе Рабб. Поскольку в таком виде вопрос несколько неоднозначен, даже человек-переводчик может спросить: «Вы подразумеваете, что слово Рабб относится к некоторому лицу?»Neg (“her”) and kNe (“she”), but not ext (“god”), hebdui (“religion”), cNigSN (“church”), etc., the system will apply formulas that will weigh the frequency , degree of affinity, as well as other category indicators in relation to associations existing in the system database, and will “understand” that one should choose the translation Faith (Rabbi) as “name” and not faith (Rabb) as “faith without proof” . The remaining neighboring words and phrases, together with their set of repeating relationships with other concepts, will provide additional confirmation of the speakers ’intentions, until the statistical significance fixes the answer or the system asks the user for clarification due to lack of information. This would happen, for example, if the whole question had the form I 1st Rabb. Since the question in this form is somewhat ambiguous, even a human translator may ask: “Do you mean that the word Rabb refers to a certain person?”

В английском языке первая буква верхнего регистра подразумевает «имя» Вера (Рабб). Данное свойство служит еще одной характеристикой, с которой может работать система для определения того, что Рабб (Вера), вероятно, является именем. Во многих языках, не использующих латиницу, не содержатся знаки верхнего/нижнего регистров, и поэтому при решении рассмотренного вопроса будут полагаться только на поуровневые отношения между словосочетаниями, связанными частой близостью друг к другу в тексте, и любым другим представлением языка (голосом, символами, знаками и т.д.).In English, the first letter of upper case implies the "name" Vera (Rabb). This property is another characteristic that the system can work with to determine that Rabb (Faith) is probably a name. Many languages that do not use the Latin alphabet do not contain upper / lower case characters, and therefore, when resolving the issue under consideration, they will only rely on level-wise relations between phrases associated with frequent proximity to each other in the text and any other representation of the language (voice, symbols, signs, etc.).

Использование общего частотного анализа для поиска семантически аналогичных словUsing general frequency analysis to search for semantically similar words

Слова и словосочетания в языке, которые представляют конкретную идею, часто появляются в комбинациях. Данные комбинации могут быть обозначены частотой, с которой конкретные слова и словосочетания обнаруживаются непосредственно перед конкретным словом (в английском языке, слева от конкретного слова), а также после конкретного слова (в английском языке, справа от конкретного слова). В соответствии с этим слова и словосочетания, выражающие одинаковые понятия, будут иметь схожие тип и порядок слов и словосочетаний, которые идут впереди и отходят от них.Words and phrases in a language that represent a specific idea often appear in combinations. These combinations can be indicated by the frequency with which specific words and phrases are found immediately before a specific word (in English, to the left of a specific word), and also after a specific word (in English, to the right of a specific word). In accordance with this, words and phrases expressing the same concepts will have a similar type and order of words and phrases that go ahead and move away from them.

Другим примером использования комбинаций слов для выработки информации является создание исчерпывающего тезауруса эквивалентов слов и словосочетаний. Если систему запрашивают определить слово, у которого то же самое или почти то же самое значение, как у другого слова, т. е. слова являются семантически подобными, то система может найти частоты слов и словосочетаний, ассоциируемых с данным словом, и произвести поиск слова в таком языке, в котором частоты ассоциаций наиболее точно соответствуют ему. Обычно, чем больше конструктивно подобны образования двух слов и/или словосочетаний, тем более схожи их значения. Иногда противоположности будут характеризоваться большими частотами общих ассоциаций, но будут сильно различаться по некоторым важным качественным ассоциациям, которые создают картину «сигнатуры противоположностей», которую система также может обеспечивать приложениям.Another example of using word combinations to generate information is the creation of a comprehensive thesaurus of word equivalents and phrases. If the system is asked to identify a word that has the same or almost the same meaning as another word, i.e. the words are semantically similar, then the system can find the frequencies of words and phrases associated with the given word and search for the word in a language in which the frequencies of associations most closely match it. Usually, the more constructively similar the formation of two words and / or phrases, the more similar their meanings. Opposites will sometimes be characterized by high frequencies of common associations, but will vary greatly in some important qualitative associations that create a picture of the “signature of opposites,” which the system can also provide to applications.

Система будет обнаруживать характер ассоциации между любым понятием, представленным словом или словосочетанием, и любым другим понятием, представленным словом и словосочетанием, так называемую «сигнатуру ассоциации». Система использует ассоциативные базы данных, чтобы обнаруживать конкретные словообразования в пределах заданных пользователем интервалов, предназначенных для обнаружения комбинаций слов, окружающих понятие, которое определяет отношение между понятием и другими понятиями, находящимися в относительной близости от него. Программа Ргодгат4, представленная в приложении листинга компьютерных программ, является примером программы, которая использует общий частотный анализ для нахождения семантически эквивалентных или подобных слов.The system will detect the nature of the association between any concept represented by a word or phrase, and any other concept represented by a word and phrase, the so-called “association signature”. The system uses associative databases to detect specific word formations within user-defined intervals designed to detect combinations of words surrounding a concept that defines the relationship between the concept and other concepts located in relative proximity to it. The Rgodgat4 program presented in the computer program listing application is an example of a program that uses general frequency analysis to find semantically equivalent or similar words.

Например, один вариант осуществления, использующий конкретное словообразование вблизи слова или словосочетания, использующего независимый общий частотный анализ (1СРА), заключается в том, чтобы идентифицировать слова и словосочетания, которые представляют собой эквиваленты или почти эквиваленты в семантическом отношении (т.е. по смыслу) в отношении любого слова или словосочетания. Данный вариант осуществления содержит следующие этапы. Этап 1, заключающийся в том, что принимается запрос на то, чтобы слово или словосочетание (слово запроса) было подвергнуто анализу на эквиваленты, и выдается словосочетание (выданное слово) заданного пользователем размера, которое появляется с наибольшей частотой, а также частота появления выданного слова, при этом выданное слово располагается непосредственно слева от слова запроса во всех доступных документах, использующих независимый общий частотный анализ (1СРА). Чем больше заданное пользователем словосочетание, тем более точным будут окончательные результаты. Этап 2, заключающийся в том, что выполняется независимый общий частотный анализ (1СРА) для каждого результата из заданного пользователем числа имеющих наивысший ранг результатов этапа 1 с использованием интервала, образованного 1 словом или словосочетанием справа от каждого анализируемого слова или словосочетания (применение интервала длиной в 1 слово или словосочетание означает, что система будет классифицировать по рангу наиболее часто повторяющиеся слова и словосочетания справа от каждого из слов или словосочетаний, анализируемых на этапе 2). Затем выполняется суммирование полученных на этапе 2 частот всех общих слов и словосочетаний. Этап 3, заключающийся в том, что выполняется независимый общий частотный анализ (1СРА) запроса с использованием интервала, образованного заданным пользователем числом слов непосредственно справа от запроса (и вновь, для обеспечения точности обычно требуется, по меньшей мере,For example, one embodiment using a particular word formation near a word or phrase using an independent general frequency analysis (1CPA) is to identify words and phrases that are equivalent or almost equivalent semantically (i.e., meaning ) in relation to any word or phrase. This embodiment comprises the following steps. Stage 1, which consists in the fact that a request is received for the word or phrase (query word) to be analyzed for equivalents, and a phrase (given word) of a user-defined size that appears with the greatest frequency, as well as the frequency of occurrence of the issued word is issued while the issued word is located immediately to the left of the query word in all available documents using independent general frequency analysis (1CPA). The larger the user-defined phrase, the more accurate the final results. Stage 2, namely, that an independent general frequency analysis (1CPA) is performed for each result from a user-specified number of the highest rank results of stage 1 using the interval formed by 1 word or phrase to the right of each analyzed word or phrase (using an interval of length 1 word or phrase means that the system will classify by rank the most frequently repeated words and phrases to the right of each of the words or phrases analyzed on stage 2). Then, the summation of the frequencies obtained in stage 2 of all common words and phrases is performed. Stage 3, namely, that an independent general frequency analysis (1CPA) of the request is performed using the interval formed by the user-specified number of words directly to the right of the request (and again, at least

- 25 007776 два слова). Этап 4, заключающийся в том, что выполняется независимый общий частотный анализ (1СЕЛ) для каждого слова и словосочетания из заданного пользователем числа имеющих наивысший ранг слов и словосочетаний, выданных на этапе 3 с использованием интервала, образованного 1 словом или словосочетанием слева от каждого анализируемого слова или словосочетания (и вновь, результаты применения интервала длиной в 1 слово или словосочетание непосредственно слева от анализируемого слова или словосочетания будут классифицироваться по рангам на основе частоты слов и словосочетаний, наиболее часто идущих впереди каждого слова и словосочетания, анализируемого на этапе 4). Затем частоты всех общих слов и словосочетаний, полученных в результате выполнения этапа 4, суммируются. На этапе 5 определяется каждое из слов или словосочетаний, которые выдаются как на этапе 2, так и на этапе 4. Численные значения частот каждого из общих слов и словосочетаний, выданных на этапе 2, умножаются на численные значения частот общих слов и словосочетаний, выданных на этапе 4. Слова или словосочетания, классифицированные наивысшим рангом на основании произведений их частот, выданных на этапе 2 и этапе 4, будут словами и словосочетаниями, наиболее семантически эквивалентными или подобными запросу.- 25 007776 two words). Stage 4, which consists in the fact that an independent general frequency analysis (1 SEL) is performed for each word and phrase from the number of words and phrases given by the user specified by the user that were issued in step 3 using the interval formed by 1 word or phrase to the left of each analyzed word or phrases (and again, the results of applying an interval of 1 word or phrase immediately to the left of the analyzed word or phrases will be classified by rank based on frequent you words and phrases most often walking in front of every word and phrase, analyzed in step 4). Then, the frequencies of all common words and phrases obtained as a result of step 4 are summed up. In step 5, each of the words or phrases that are issued both in step 2 and in step 4 is determined. The numerical values of the frequencies of each of the common words and phrases issued in step 2 are multiplied by the numerical values of the frequencies of common words and phrases issued in stage 4. Words or phrases classified by the highest rank on the basis of the products of their frequencies issued in stage 2 and stage 4 will be words and phrases that are most semantically equivalent or similar to the query.

В примере варианта осуществления с построением тезауруса эквивалентов всех слов и словосочетаний в документальной базе данных системы предполагается, что пользователь вводит слово йеРнпей («задержанный») для определения всех известных системе эквивалентов слов и словосочетаний.In the example of an embodiment with the construction of a thesaurus of equivalents of all words and phrases in the document database of the system, it is assumed that the user enters the word eRnpei (“delayed”) to determine all the equivalents of words and phrases known to the system.

На этапе 1, на основании результатов наивысшего ранга (заданных пользователем), взятых в количестве 3 для большей наглядности, сначала система определит (смотри ниже) 3 словосочетания (заданные пользователем), наиболее часто появляющихся непосредственно слева от «йеРнпей»:At stage 1, based on the results of the highest rank (user-defined), taken in the amount of 3 for greater clarity, the system will first determine (see below) 3 phrases (user-defined), most often appearing immediately to the left of “eRnpei”:

1. 111с 5Н5рсс1 \ν;·ΐ5 («по подозрению»)1. 111s 5Н5рсс1 \ ν; · ΐ5 (“on suspicion”)

2. \ν;·ΐ5 аггс51сб апб («был арестован и»)2. \ ν; · ΐ5 aggs51sb apb ("was arrested and")

3. сопЛ'шей Ю Ье («продолжал быть»)3. sopl'shoy leb ("continued to be")

На этапе 2 система находит (смотри ниже) слова и словосочетания, которые наиболее часто следуют за 3 вышеприведенными выданными в результате словосочетаниями справа:At stage 2, the system finds (see below) the words and phrases that most often follow the 3 above phrases shown as a result on the right:

1. Ле 5и5рес1 \ν;·ΐ51. Le 5i5res1 \ ν; · ΐ5

2. \ν;·ΐ5 атте^ей апб2. \ ν; · ΐ5 atte ^ her apb

3. сопйпией ΐο Ье3. by concession

a. атгейей (240, частота)a. athei (240, frequency)

b. ЬеИ (120) с ге1еа8ей (90)b. LeI (120) with geIea8ey (90)

a. ЬеИ (250)a. LIE (250)

b. сопуШей (150)b. Sopushey (150)

c. ге1еа8ей (100)c. g1ea8ey (100)

a. Ьеа1Лу (200)a. Lea1Lu (200)

b. сопййеп1 (150)b. sopeyep1 (150)

c. орЬшЩю (120)c. Orshy (120)

Затем частоты общих результатов, выданных на этапе 2, суммируются. На этапе 2 выданы только следующие общие результаты:Then, the frequencies of the overall results generated in step 2 are added up. In step 2, only the following general results are issued:

a. 1е1й 120 + 250 = 270a. 1st 120 + 250 = 270

b. те1еа§ей 90 + 100 = 190b. te1eagay 90 + 100 = 190

На этапе 3 система определит 3 наиболее часто появляющихся (согласно заданному пользователем параметру) двухсловных словосочетания (заданных пользователем) непосредственно справа от выбранного запроса «йеРнпей» в документах в базе данных:At stage 3, the system will determine the 3 most frequently occurring (according to the parameter set by the user) two-word phrases (specified by the user) immediately to the right of the selected query “eRnpei” in the documents in the database:

1. Тог диейюшпд1. Toge diyyyuspd

2. оп сЬатдек2. op satdec

3. йиппд Ле3. yippd le

На этапе 4 система определит (смотри ниже) слова и словосочетания, наиболее часто появляющиеся непосредственно слева от 3 словосочетаний, выданных на этапе 3:At stage 4, the system will determine (see below) the words and phrases most often appearing immediately to the left of the 3 phrases issued at stage 3:

1. 'Тот диейюшпд а. 1е1й (300)1. 'That diyyuspd a. 1st (300)

Ь. ™ап1ей (150) с ЬтоидЫ ш (100)B. ™ ap1ey (150) with bids (100)

2. оп сЬатдек а. 1е1й (350)2. OP SATDEC a. 1st (350)

b. аттейей (200)b. attei (200)

c. ЬтоидЫ ш (150)c. Lids W (150)

3. йиппд Ле а. ЬеаиЛиГ (500)3. yippd Le a. LeaLiG (500)

b. 1арру(400)b. 1arru (400)

c. реор1е (250)c. Reor1e (250)

Затем суммируются все общие результаты, полученные на этапе 4. В данном примере выдано 2 общих результата:Then all the general results obtained at stage 4 are summarized. In this example, 2 general results are issued:

- 26 007776- 26 007776

a. Ье1бa. B1b

b. ЬгоидЫ шb. Bids

300 + 350 = 650300 + 350 = 650

100 + 150 = 250100 + 150 = 250

Этап 5. На данном этапе перемножаются (смотри ниже) частоты общих результатов, выданных на этапах 2 и 4:Step 5. At this stage, the frequencies of the overall results issued in steps 2 and 4 are multiplied (see below):

1. Ье1б1. b1b

2. аггеЧеб2. Agg Cheb

650 х 270 = 175,500650 x 270 = 175,500

200 х 240 = 48,000200 x 240 = 48,000

Вышеприведенный наглядный пример основан на сравнительно небольшом числе документов в документальной базе данных. Документальная база данных может быть больше и может содержать документы, удаленно доступные системе по сетям, например сети 1п1егпе1.The above illustrative example is based on a relatively small number of documents in a document database. The document database may be larger and may contain documents remotely accessible to the system over networks, for example, 1n1egpe1 networks.

Вышеописанный вариант осуществления представляет собой один из многих вариантов способа по настоящему изобретению, который позволяет применять независимый общий частотный анализ (1СЕА) (или, в альтернативном варианте, связанный общий частотный анализ (КСЕА)) для определения характеристик понятий, отраженных словами и словосочетаниями, и характер отношения между словом или словосочетанием и любым другим словом или словосочетанием.The above embodiment is one of many variations of the method of the present invention that allows the use of independent general frequency analysis (1CEA) (or, alternatively, coupled general frequency analysis (KCEA)) to characterize concepts reflected by words and phrases, and the nature of the relationship between a word or phrase and any other word or phrase.

Можно применять и другие способы, основанные на одной и той же принципиальной идее использования отношений, существующих между понятиями и обнаруживаемых по их частоте и близости друг к другу в языке, в сочетании с другими индикаторами категорий, с целью решения более сложных проблем. Указанные способы могут содержать этапы, заключающиеся в выполнении общего частотного анализа, по меньшей мере, для 2 различных наборов сегментов и использовании комбинированных результатов в соответствии с инструкциями пользователя.You can apply other methods based on the same fundamental idea of using the relationships that exist between concepts and are detected by their frequency and proximity to each other in the language, in combination with other category indicators, in order to solve more complex problems. These methods may include the steps of performing a general frequency analysis for at least 2 different sets of segments and using combined results in accordance with user instructions.

Один из примеров более сложного отношения, которое можно обнаружить, представляет собой комбинацию, образованную при сравнении сигнатур слов или словосочетаний, которые являются противоположностями друг другу. Чтобы обнаружить комбинацию, пользователь будет вводить слово в систему (например, 1ю1 (горячий)). Тогда система определит все частоты появления повторяющихся слов и словосочетаний около данного слова (в результате формируется «сигнатура» слов). Затем пользователь обратиться к системе с требованием определить все частоты появления повторяющихся слов и словосочетаний около слова или словосочетания, отражающего противоположное понятие (например, Со1б (холодный)). Затем система произведет для перекрывающихся понятий поиск общей комбинации для левой стороны от слова 1ю1 и правой стороны от слова со1б и для левой стороны от слова со1б и правой стороны от слова 1ю1.One example of a more complex relationship that can be detected is a combination formed by comparing signatures of words or phrases that are opposites of each other. To detect a combination, the user will enter a word into the system (for example, 1-1 (hot)). Then the system will determine all frequencies of occurrence of repeating words and phrases around a given word (as a result, a “signature” of words is formed). Then the user will turn to the system with the requirement to determine all frequencies of occurrence of repeating words and phrases around a word or phrase that reflects the opposite concept (for example, Co1b (cold)). Then, for overlapping concepts, the system will search for a common combination for the left side of the word s1b and the right side of the word s1b and for the left side of the word s1b and the right side of the word s1b1.

Полученный результат представляет собой комбинацию, образованную сравнением двух сигнатур, которую система может впоследствии использовать для идентификации других пар слов или словосочетаний с аналогичными комбинациями, образованными сравнениями их сигнатур. Следовательно, если система получит запрос в виде слова или словосочетания таким образом, что будет производить поиск противоположности, то система (1) обнаружит все слова и словосочетания, окружающие данный запрос, (2) определит список слов и словосочетаний, которые имеют сигнатуры, аналогичные запросу, но не с такой степенью подобия, которая позволяет классифицировать их как синонимы, (3) затем сравнит сигнатуры этих связанных (но не синонимических) слов и словосочетаний с запросом и (4) сравнит результат сравнения, полученный на этапе 3, с результатами сравнений сигнатур ранее обнаруженных пар противоположных слов или словосочетаний. Если какие-либо из результатов сравнений, выполненных на этапе 3, содержат комбинацию, которая достаточно подобна (на основании заданных пользователем критериев) комбинации, образованной сравнениями сигнатур известных противоположностей, то система выявит слово или словосочетание в результатах этапа 2, которые противоречат запросу, чтобы сформировать комбинацию и обозначить ее как противоположность запросу.The result obtained is a combination formed by comparing two signatures, which the system can subsequently use to identify other pairs of words or phrases with similar combinations formed by comparisons of their signatures. Therefore, if the system receives a query in the form of a word or phrase in such a way that it searches for the opposite, then the system (1) detects all the words and phrases surrounding the query, (2) determines a list of words and phrases that have signatures similar to the query , but not with a degree of similarity that allows them to be classified as synonyms, (3) then compares the signatures of these related (but not synonymous) words and phrases with the query and (4) compares the comparison result obtained in step 3 with Signature comparisons of previously discovered pairs of opposing words or phrases. If any of the comparisons performed in step 3 contain a combination that is sufficiently similar (based on user-defined criteria) to the combination formed by comparisons of signatures of known opposites, then the system will identify a word or phrase in the results of step 2 that contradict the query so that form a combination and designate it as the opposite of the request.

Следует также отметить, что параметры, задаваемые пользователем так, чтобы система создавала эквиваленты словосочетаний (или любое другое отношение), могут содержать словосочетания, характеризующиеся любой степенью близости к запросу, а не только непосредственно примыкающие к запросу с левой или правой стороны. Корректировка заданных пользователем параметров потребуется для приложений, в которых выражение семантического содержания обычно менее эффективно или конструктивно менее общепринято (например, переговоры, записанные на «форумах» сети 1п1егпе1 (сйа! гоот), и переговоры других типов).It should also be noted that the parameters set by the user so that the system creates equivalent phrases (or any other relation) may contain phrases characterized by any degree of proximity to the request, and not only directly adjacent to the request from the left or right side. Correction of user-specified parameters will be required for applications in which the expression of semantic content is usually less efficient or structurally less generally accepted (for example, conversations recorded on the “forums” of the network 1p1egpe1 (sya! Goot), and other types of negotiations).

В принципе, процедура построения ассоциативной базы данных содержит этапы, заключающиеся в том, что (ί) принимается единица группированных данных, организованных линейно или упорядоченно, (ίί) группа данных делится на все возможные смежные поднаборы целой группы, и (ш) строятся отношения между всеми поднаборами данных на основе часто повторяющейся (обычно, непосредственной) близости друг к другу всех доступных единиц группированных данных. По существу, на основе общего частотного анализа, система выдает пользователю часто повторяющиеся отношения близости между сегментами поднаборов данных, чтобы облегчать обнаружение определенных повторяющихся комбинаций, которые задают «сигнатуру данных», обеспечивающую обобщенную информацию о любых данных, связанных с упомянутой общей «сигнатурой данных». Поэтому одни и те же процедуры, используемые при создании базы данных, и общий частотный анализ можно применять в приложениях распознавания обраIn principle, the procedure for constructing an associative database contains the steps that (ί) a unit of grouped data is organized, organized linearly or in order, (ίί) a group of data is divided into all possible adjacent subsets of the whole group, and (w) the relationships between all subsets of data based on the often repeated (usually immediate) proximity to each other of all available units of grouped data. Essentially, based on a common frequency analysis, the system provides the user with frequently repeated proximity relationships between segments of the data subsets to facilitate the detection of certain repeated combinations that define a “data signature” that provides generalized information about any data associated with the said common “data signature” . Therefore, the same procedures used to create the database, and the general frequency analysis can be applied in image recognition applications

- 27 007776 зов для извлечения информации из данных и текста различными другими способами. опознавания цели и любом другом приложении. которое требует распознавания образов.- 27 007776 call for extracting information from data and text in various other ways. target recognition and any other application. which requires pattern recognition.

Специалистам в данной технической области очевидно. что при наличии опыта и квалификации в вышеописанные устройство и способы можно внести множество изменений. не выходящие за пределы сущности и объема изобретения.Specialists in this technical field is obvious. that if you have experience and qualifications in the above device and methods, you can make many changes. not going beyond the essence and scope of the invention.

Приложениеapplication

ЧЬаЦЧЫз'.'т 1йе','аге','о£ И1е’,Ъу’,^,Ь.е’,^,1о Ле'.'аз'.'оп'/ап'/аГ, ЧиЛ','&от',Ъе','ул1Г,Ъа8','по£,Ъу Ше',>ои1б','8Ьои1с1','5а1(Г,'1', Ъи1^,,^,8о'_>Ъаб',’1УЬо^,,'по','оп1у^,,Ъег',^,о£ а',Ъееп','апб 1Ье','а! 1Ье');ChaTsChYz '.' T 1ye '' aga ',' about £ I1e ^'dy', .e ^', Le 1 °'. 'Az'. 'Op' / Up '/ aT, Chill', '& on 'bE''ul1G,a8''on the £, dy Chez'> oi1b '' 8oi1s1 '' 5a1 (T, '1', ^{^i1,,,} 8o _'> ab', ^'1Uo,, 'for', ^'op1u,, ^eg', a £ a 'eep', 'APB 1e''and1e!');

$ехс1ибе_&е = аггау( '1Г,'е11е','8Оп','Еа^,,^,5е5^,,'ип^,,'ипе','е81','е1а11','роиг','£’а1ге','орА(с)гег'₁'ро8ег','де', Че'Да'Дез'.'еГ.'А '/еп'.^'.'дие'/дш'.'сеЫ'/се'.'сез'.'сеГ/сейеБ'/бапз 1е', ’бапз к'/зоп^'бе 1а',’<1и',^>гА8 бе','бе'_>'баргАз^|,^,раг’,'А|1ге','А к’.’аи'/аих’, 'сотте¹,^,51^,,^|епауап!','5иг^,)^,ип'>'ипе^|)кег8’,'ауес')'1Г5^,§гА(с)','уо1оп1А(с)^,>^,беуо1г’_>Ά^ΐτε оЬНдА(с)','<Й8ай','(Й8а18','<И8еп!',']е','та15','81'_э'ои'_>'ауа1Х','ауа18','ауа1еп1', '9ш','цие'_>'поп','зеи1етеп1','е11е','ег Ιε','εί 1а','е1 кз’/без'/бапз');$ ehs1ibe_ & e = Array ( '1G' e11e '' 8Op ',' ^{^Ed,,,} ^5e5, ^'un,' une '' E81 '' e1a11 ',' pour ',' £ 'a1ge''opA (s) heg' ₁ 'ro8eg', 'de', Che'Da'Dez. 'eG.'A'/ep'.^'.'die'/dsh'.'seY'/se'. . 'ces''NEG / seyeB' / bapz 1e ',' bapz to '/ Hodgson ^ "baa 1a', '<1 and'> gA8 Be ',' baa _'>' bargAz ^{^|,,} ragas ',' A | '.' 1ge ',' A to au '/ aux''comme ^{^1,,} ^51,, ^| epauap!', ^{^'5ig,),} u'>'une ^| ) keg8 ','aues')'1G5 ^, §gA (s)', 'yo1op1A (s) ^, > ^, beuo1r'_> Ά ^ ΐτε оННДА (с) ','<88ай',' (88а18 ','< I8ep! ','] E ',' ta15 ',' 81 ' _e ' oi '_>' aua1X ',' aua18 ',' aua1ep1 ',' 9sh ',' cie '_>' pop ',' zei1etep1 ',' e11e ',' eg Ιε ',' εί 1a ',' e1 cz '/ without' / bapz ');

$ехс1ибе_зра = аггау( ’1о^,,'е11а','8и^,,’ип^,,^,ш1а'>^,е8^,>^,й1е','Зи1',^,рог',^,рага^,,Ъасег^,,Ъасеп^,,^,е11о8’, 'е11а8^,,'бе','е1','1а^,,^,1о8^,,^|у',^|Ьа81а7еп^,,’81','е8е^,,^,яие^,,'адие11о^|,^,адиеПа', 'езк'/ейо'.'езМ.-'/егез'.'зоп'.'беГ.'сегса'.'а! 1або','е51аг','зет','аГ,'сото', 'епсепб1бо','ип','аггоЪа^,,'соп','безбе','А(с)Г,'уо1ипид',^,бепе','11ау','беЬег','<1уо', 'уо'_; ^,рего','зто','азА-','!ап^,,'о','ЬаЬА-а',^и1еп','дшА(с)п','по','8А31о','8о1атеп1е', 1а',Ъа δΐάο');$ ehs1ibe_zra = Array ( '1 ^°,' e11a '' ^8u, ^{^'un,,,} ^sh1a'> ^{^E8>} y1e '' Zi1 ^{^'horn',} ^raga, ^aseg,, ^asep, ^,, e11o8 '' ^e11a8, 'Be', 'e1', ^{^'1a,,} ^1o8,, ^| y' ^| ^a81a7ep,, '81 ',' ^{^e8e,,,} ^que, 'adie11o ^{^|,,} adiePa ',' ezk '/ neo'. 'ezM .-' / egez '.' zop '.' beG. 'segsa.' a! 1abo ',' e51ag ',' zet ',' aH, 'soto' , 'epsepb1bo', 'un', 'argoBa ^, ' sop ',' bebebe ',' A (c) G, 'wo1ipid' ^, bepe ',' 11au ',' beebe ','<1uo',' yo '_; ^, rego', 'zto', 'aza -', '! ap ^, ' o ',' baa-a ', ^ u1ep', 'dshA (s) n', 'po', '8A31o' , '8o1atep1e', 1a ', ba δΐάο');

$<Нг = ЬеЫге;$ <Hr = LeBe;

$<йгбопе = ЬеЬ&ебопе;$ <igbope = bb &ebope;

$1ап§ = ”.еп§;$ 1ap§ = ”.ep§;

$о1ап£ = .Де;$ o1ap £ =. Де;

$(аЫе =’ЪеЫге;$ (aye = ’bеyge;

$1ап§иа§есоип1 = 1ап§соип1; $1апдиаде = 1ап§;$ 1ap§iaoesip1 = 1 $ 1apdiad = 1ap§;

$о1апдиадесоип1 = о1ап§соип!; $о1ап§иа§е = о1ап§;$ o1apdiadesoip1 = o1ap§soip !; $ o1ap§iage = o1ap§;

#$беЪи§ = кие;# $ beSi§ = cues;

Йтсбоп декшсгоДтеО {Ytsbop dekshsgoDteO {

Из1($изес, $зес) = ехр1обе(^И ,т1сгобте0); ге!ит ((Доа1)$изес + (Доа!)$зес);Iz1 ($ izes, $ sec) = ehr1obe ^(And t1sgobte0); he! um ((Doa1) $ hez + (Doa!) $ hez);

} $аПз!аг1 = дектсгойтеО;} $ aPz! ag1 = dektgoyteO;

$ίρ = £ореп(7и5г/1оса]/арасЬе/1о2.Ьс!, ·νν+);$ ίρ = о реп (((7 & 5g / 1os] / с Ь /1 /1 /1 о !, !, !, ·!

ίριιΐβ ($ίρ,δΐ3Πίη§ .ба1е(Н:г8).<ВК>\о);ίριιΐβ ($ ίρ, δΐ3Πίη§. бае (Н: г8). <VK> \ o);

- 28 007776 ίδίβΐίδΐ = й1е(”Ьйр://128.241.244.1 66/11з1.р11р?(Йг=$с11г&1ап§=$1ап2);#с11ап§е $1етр = Ш1р1ойе(,$й1е11з1);- 28 007776 ίδίβΐίδΐ = 11е (”:р: //128.241.244.1 66 / 11з1.р11р? (Гg = $ c11g & 1ap§ = $ 1ap2); # с11ап§е $ 1etр = Ш1р1ойе (, $ 11е11з1);

$1151 = 8Ьг1:о1о\уег(1пт($1етр)); $татаггау = ехр1ойе(\п,$11з1);$ 1151 = 8Lr1: o1o \ ueg (1pt ($ 1tetr)); $ tataggau = exp1oye (\ n, $ 11z1);

80П($татаггау); ге5е1($татаггау);80P ($ Tataggau); ge5e1 ($ tatggau);

$й1еаггау = аггауО;$ y1eaggau = aggauO;

$са!с = 0;$ sa! c = 0;

£ог ($1 = 0 ; $1 < соип1($татаггау); $Ж-)#сош11($тал1аггау) сЬапде { 1Г(й1е_ех1515(81г_гер1асе($1ап2,$о1ап§,$татап-ау[$1]))) { .£ og ($ 1 = 0; $ 1 <coip1 ($ tataggau); $ W -) # com11 ($ tal1aggau) cbap {1G (d1e_ex1515 (81g_ger1ase ($ 1ap2, $ o1ap§, $ tatap-ay [$ 1])))) {.

$1етр = $татаггау[$1];$ 1eter = $ tataggau [$ 1];

$1етр1 = Й1е($татаггау[$£|); ипзе1($1етр2);$ 1tetr1 = 11e ($ tataggau [$ £ |); ipze1 ($ 1tetr2);

£ог ($т = 0 ; $т < соип1($1етр1); $т++) ( ί£ (зЬг51г($1етр1[$т],....)) ипзе1($1етр1[$т]);£ og ($ m = 0; $ m <co1 ($ 1tetr1); $ mt ++) (з £ (bt51r ($ 1tetr1 [$ m], ....)) and no1 ($ 1tetr1 [$ m]) ;

$1етр1[$т] = еге£1_гер1асе([[:зрасе:]]+, ,з1пр_1адз($1етр1[$т])); $1етр1[$т] = иг1йесойе(зй_гер1асе(&Ь.1аЪ;,,$1етр1[$т]));$ 1tetr1 [$ t] = ee £ 1_per1ase ([[: [time:]] +,, s1pr_1adz ($ 1tetr1 [$ t])); $ 1tetr1 [$ m] = 11йесесойе з (з з з (й__ерер11асас (& (&b.1a3; ,, $ 1tetr1 [$ m]));

ΐ£ ($1етр1[$т] !=) $1етр2 .= $1етр1[$т];ΐ £ ($ 1tetr1 [$ t]! =) $ 1tetr2. = $ 1tetr1 [$ t];

} $й1еаггау[$1етр] = и1£8_епсобе($1етр2); ####### $1етр = 51г_гер1асе($1ап2,$о1ап2,$та1паггау[$(]); $1етр1 = П1е(з1г_гер1асе($1ап§,$о1ап£,$татагтау[$1])); ипзе!($1етр2);} $ d1eaggau [$ 1tetr] = and1 £ 8_epsobe ($ 1tetr2); ####### $ 1tetr = 51g_ger1ase ($ 1ap2, $ o1ap2, $ ta1paggau [$ (]); $ 1tetr1 = P1e (s1g_ger1ase ($ 1ap§, $ o1ap £, $ tatagtau [$ 1])); ! ($ 1eter2);

£ог ($т = 0; $т < соип!($1етр1); $т++) { ί£ (з1гз1г($1етр 1 [$т],ипзе!($1етр1 [$т]);£ og ($ m = 0; $ m <so!! ($ 1tetr1); $ mt ++) {ί £ (s1gz1g ($ 1tetr 1 [$ t], uh! ($ 1tetr1 [$ t]);

ГСтг»1 = οί ^м ** с1т4г\ +аггс’/’Ф4-А**м-л1 ГС-»-м1\\·GSG "1 = οί ^m ** s1t4g \ + aggs '/' F4-A ** m-l1 GS -" - m1 \\ ·

X [,ψΧΧ^ УХ»/^Х · у ) V ЬкаХХ£/X ['Ч'ХХХ'] у/) $1етр1[$хп] = иг1йесобе(з1г_гер1асе(&ЫаЬ;'',,$1етр1[$1п])); ΐ£ ($1етр1[$т] != $1етр2 .= $1етр1[$т];X [, ψΧΧ ^ YX ”/ ^ X · y) V bkAXX £ / X ['' Х Х Х Х ']] y /) $ 1teter1 [$ xn] = ig1yoseob (s1r_ger1ase (&Ыab;])); ΐ £ ($ 1tetr1 [$ t]! = $ 1tetr2. = $ 1tetr1 [$ t];

} $Я1еаггау[$1етр] = и1£8_епсобе($1етр2);} $ Y1eaggau [$ 1tetr] = и1 £ 8_псобе ($ 1етр2);

} ) (ри1з ($ф,ба1с(Н:1:з).<ВЮ^>бопе 1оай1пд й1ез т!о аггауЛп); $абфуогйз = ΐπιβ;}) (ri1z ($ f, ba1s (H: 1: z). <VU ^> bopo1o1pd i1ez! ooaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa;

$с!ойо = сош11($та1па1гау);$ c! oyo = sosh11 ($ ta1pa1gau);

$ΐ = Ο;$ ΐ = Ο;

£ог ($1 = 0; $1 < $с!ойо ; $1++) {£ og ($ 1 = 0; $ 1 <$ c! Oyo; $ 1 ++) {

ϊ£ (Й1е_ех151з(з1г_гер1асе($1апд,$о1апд,$тап1аггау[$1]))) $й1ех1з1 = йие; е1зе Ш1зе1($й1ех1з1);ϊ £ (11e_ex151z (s1r_ger1ase ($ 1apd, $ o1apd, $ tap1aggau [$ 1]))) $ i1ex1z1 = ue; e1ze Sh1ze1 ($ y1eh1z1);

ριΐηΐ Шее = $й1ех1з1 - $паатаггау[$4]\п;ριΐηΐ Neck = $ d1ex1z1 - $ paataggau [$ 4] \ n;

- 29 007776 ίΓ ($йеЬи§ == 1гие) $й1ех181 = ίπιβ;- 29 007776 ίΓ ($ ееии§ == 1гие) $ й1ех181 = ίπιβ;

ίΓ ($β1βχΪ8ί ==-!гие) (ίΓ ($ β1βχΪ8ί == -! Гие) (

ίΓ($ша1паггау[$1) && $<1еЬи§ != ΐπιβ) {ίΓ ($ а 1 п аг га [[$ 1) && $ <1еи§! = ΐπιβ) {

зу81ет(шу $та1паггау[$1] /и5г/1оса1/арасйе/$й1гйопе/.8!г_гер1асе(/и8г/1оса1/арасЬе/$<йг/,_>$та1па1тау[$1]));zu81et (shu $ ta1paggau [$ 1] /i5g/1osa1/arasie/$y1yyope/.8!g_ger1ase(/i8g/1osa1/arac/e _/ $<yg/, _> $ ta1pa1tau [$ 1]));

зуйешС'ту .з1г_гер1асе($1апд,$о1апд_э$та1паггау[$1]). /и5г/1оса1/арасйе/$сЯг<1опе/.81г_гер1асе($1ап2,$о1ап2,8!г_гер1асе(^,7и8г/1оса1/араске/$(1н·/ $татаггау[$!])));zuyesh S'tu .z1g_ger1ase ($ 1apd, $ o1apd _e $ ta1paggau [$ 1]). / i5g / 1osa1 / arasye / $ siag <1ope / .81g_ger1ase ($ 1ap2, $ o1ap2.8! g_ger1ase ( ^, 7i8g / 1os1 / araske / $ (1n · / $ tataggau [$!])));

} $1п§ = $61еаггау[$ташаггау[$1]];} $ 1n§ = $ 61 geaggau [$ tashaggau [$ 1]];

$ο1ηβ = $Я1еаггау[81г_гер1асе($1апе,$о1ап&$та1па1гау[$!])];$ ο1ηβ = $ Я1еаггау [81г_гер1асе ($ 1апе, $ о1ап & $ т1п1гау [$!])];

$1п§8 = ехр1ойе( ,$1п§);$ 1n§8 = exp1oye (, $ 1n§);

Гог ($ΐ = 0; $ΐ < соип1($1пдз); $ϊ++) {Gog ($ ΐ = 0; $ ΐ <soip1 ($ 1pdz); $ ϊ ++) {

ϊΓ(!βΓββ([^Λα-ζΑ-Ζ],$1η£8[$ί])) $1пдз[$1] = 8ίΓίο1ο·ννα·($1η§ε[$ΐ]);ϊΓ (! βΓββ ([ ^Λ α-ζΑ-Ζ], $ 1η £ 8 [$ ί])) $ 1dp [$ 1] = 8ίΓίο1ο · ννα · ($ 1η§ε [$ ΐ]);

} $01ηβ8 = ехр1ойе( ,5о1пд);} $ 01ηβ8 = exp1oye (, 5o1pd);

Гог ($ϊ = 0; $ΐ < соип!($о1п§з) ; $ϊ++) {Gog ($ ϊ = 0; $ ΐ <soip! ($ О1п§з); $ ϊ ++) {

ΐΓ(!βΓβ2([^ΛΒ-ζΑ-Ζ],$ο1η§8[$ΐ])) $ο1η§δ[$ΐ] = 81т1о1оугег($о1пд8[$1]);ΐΓ (! βΓβ2 ([ ^Λ Β-ζΑ-Ζ], $ ο1η§8 [$ ΐ])) $ ο1η§δ [$ ΐ] = 81t1o1ougeg ($ o1pd8 [$ 1]);

λ $8ите = соип1($1п£з);λ $ 8ite = soip1 ($ 1n £ s);

$8итЬ = сошй($о1п§з);$ 8tb = soy ($ o1n§3);

ίΓ ($8ите > $8шпЬ) { Зтагдт = гоипй($зите / ($зите - $зшпЬ)); $асйоп - а<И;} е1зе1Г ($5шпЬ > $8ите) { $таг§ш = (гоипй($зитЬ / ($зшпЬ - $зшпе))); $асйоп = 8иЬ; } еке { Жтагдт = 1; $асйоп = зий”;}ίΓ ($ 8ite> $ 8шпЬ) {Згагдт = Гойпй ($ Зите / ($ Зите - $ зшпЬ)); $ apyop - a <i;} e1ze1r ($ 5shn> $ 8ite) {$ taggsh = (goipy ($ zn / ($ znn - $ znn))); $ ayop = 8b; } eke {Zhtagdt = 1; $ asyop = ziy ”;}

ЗпитЬег = соип1($1п§з);ZnBn = soip1 ($ lnp3);

Гог ($) = $1+1; $] < $с1ойо ; $}++) # тат 1оор, го1а1е ЬеЪуееп 1Ье Й1ез ίο Ъе скескей. {Gog ($) = $ 1 + 1; $] <$ s1oyo; $} ++) #tat 1ooor, goaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaaa ... {

1Г(й1е_ех181з(81г_гер1асе($1ап&$о1ап§,$татаггау[$]]))) # сЬеск Й1епате тайЬ.1G (g1e_ex181z (81g_ger1ase ($ 1ap & $ o1ap§, $ tatggau [$]]))) # cesk

{ $й1е_81аП = ββίπύστοίπηβΟ;{$ d1e_81aP = ββίπύστοίπηβΟ;

ипзе1($апау);ipze1 ($ apau);

Заггау = аггауО;Zaggau = aggauO;

$1ηβίρ = $й1еаггау[$татаггау[$з]];$ 1ηβίρ = $ d1eaggau [$ tatggau [$ s]];

$οΙη£ίρ = $й1еаггау[81г_г^1асе($1ап2,$о1ап8,$татаггау[$з])];$ οΙη £ ίρ = $ i1eaggau [81g_r ^ 1ase ($ 1ap2, $ o1ap8, $ tataggau [$ 3])];

$1η§8ίρ = ехр1ойе( ,$1пд{р);$ 1η§8ίρ = exp1oye (, $ 1pd {p);

Гог ($ί = 0 ; $ΐ < соип1($1пдз1р) ; $ϊ++) <Gog ($ ί = 0; $ ΐ <soip1 ($ 1pdz1r); $ ϊ ++) <

ΪΓ (!егед([^ла-2А-2]^и ₎$1пд81р[$1])) $1η£8ίρ[$ί] = 8к1о1о\¥ег($1п§з1р[$1]);ΪΓ (! Едeged ([ ^l a-2A-2] ^u ₎ $ 1pd81r [$ 1])) $ 1η £ 8ίρ [$ ί] = 8k1o1o \ ¥ eg ($ 1п§з1р [$ 1]);

} $ο1η§8ίρ = ехр1ойе( ^п,$о1п§ф);} $ ο1η§8ίρ = exp1oye ( ⁿ , $ o1n§f);

Гог ($ΐ = 0; $ΐ < сошй($о1п£з1р); $ί++)Gog ($ ΐ = 0; $ ΐ <sosh ($ o1n £ z1p); $ ί ++)

- 30 007776 {- 30 007776 {

ϊ£ (!ετε§(*(^Λ&-ζΑ-Ζ],$ο1ηβ8ίρ[$ί])) $ο1η£5ίρ[$ΐ] = 8ίτίοΙολνβΓ($ο1η§5ΐρ[$ΐ]);ϊ £ (! ετε§ (* ( ^Λ & -ζΑ-Ζ], $ ο1ηβ8ίρ [$ ί])) $ ο1η £ 5ίρ [$ ΐ] = 8ίτίοΙολνβΓ ($ ο1η§5ΐρ [$ ΐ]);

) $8ΐπηβίρ = СОШ11($1пд81р);) $ 8ΐπηβίρ = SOSH11 ($ 1pd81r);

$5шпк1р = соип1($о1п£81р);$ 5shpk1p = soip1 ($ o1n £ 81r);

ΐ£ ($зите1р > ЗзитЫр) { $таг§т!р = гоип<1($8ите1р / ($зите1р - $зип1Ыр)); $асйоп = аёб;} екя£(ХзитЫр < Хвитеф) { $таг{рп{р = (гоип<1($5ит111р / ($5ит111р - $8шпе1р))); $ас11оп = зиЬ; } е1зе { $таг§1п1р = 1; $асНоп = абб; } $питЬегф = соип1($о1п§81р);ΐ £ ($ zit1p> zitpir) {$ tagit! p = goip <1 ($ 8itepr / ($ zit1p - $ zipip)); $ acyop = ayb;} ekya ((з ит Ы <<<ите ите ф ф)))) {$ tag {pn {p = (го ип <1 ($ 5m111p / ($ 5m111p - $ 8mn1p))); $ ac11op = zb; } e1ze {$ tag§1n1p = 1; $ acnop = abb; } $ pithelf = soip1 ($ o1n§81r);

1£($0еЪид = ίηιβ) ρτίηΐ ^еС’Н-ьз'Э.’^ВК^;1 £ ($ 0eBid = ίηιβ) ρτίηΐ ^ eС’Н-нз'Э. ’^ VK ^;

Гог ($ΐ = 0; $ϊ < $пшпЪег; 5Ϊ++) #тат Ιοορ, οονετδ еуегу зрасе.Gog ($ ΐ = 0; $ ϊ <$ шпЪегЪ; 5ег ++) #tat Ιοορ, οονετδ ueegu zrase.

{ ΐ£($ί = $]) $т = $ί +1;{ΐ £ ($ ί = $]) $ t = $ ί +1;

е1зе $ηϊ = 0;e1ze $ ηϊ = 0;

£ог ($η = $ηΐ; $п < $питЪег1р; $п++) {£ og ($ η = $ ηΐ; $ n <$ pitBeg1p; $ n ++) {

ип8е1($1Ьезате11);un8e1 ($ lzate11);

$р = 0;$ p = 0;

ип5е1($ШеЪ);un5e1 ($ cb);

$1ап§81аг1 = §е1т1сгойте0;$ 1ap§81ag1 = §е1т1сойте0;

ν/Ьйе ($р < 15 && $1π88[$ϊ+$ρ] — $1η§δ1ρ[$η+$ρ] && $1п§з1р[$п+$р] != )#скеск ΐ£ ϋιε $η ινοπίδ πκίεΐι.ν / bye ($ p <15 && $ 1π88 [$ ϊ + $ ρ] - $ 1η§δ1ρ [$ η + $ ρ] && $ 1п§з1р [$ n + $ p]! =) # skisk ΐ £ ϋιε $ η ινοπίδ πκίεΐι.

{ $1кеЪ .= $1π§₅[$ΐ+$ρ].{$ 1ke3. = $ 1π§ ₅ [$ ΐ + $ ρ].

$ύιεΒ1 = 1пт($1ЬеЬ); ϊ£(!ετε8(^,,['~!@#$%^Λ&*0^<>_⁺=-?.,;:Λ],$11ιεΒ1) && !еге₈([09],8иЬ51г($±еЫ,0,1)) && !εΓε§(^Λ[0-9]*$,$ΦεΒ1) && $ΰιεΒ1 != && зиЬзД($й1еЫ,0,1) != && !еге§([0-9],8иЬ51г($й1еЫ,П) && зиЬз1г($Ц1еЫ,-1) != && виЬ81г($1ЬеЫ,0,1) !=&& 8иЬз&($1ЬеЫ,-1)$ ύιεΒ1 = 1pt ($ 1bb); ϊ £ (! ετε8 ( ^,, ['~! @ # $% ^Λ & * 0 ^<> _ ⁺ = -?.,;: Λ], $ 11ιεΒ1) &&! ee ₈ ([09], 8 and 51 ($ ± еЫ, 0,1)) &&! εΓε§ ( ^Λ [0-9] * $, $ ΦεΒ1) && $ ΰιεΒ1! = && зиЗЗД ($ б1еЫ, 0,1)! = &&! еег§ ([0-9 ], 8bb51r ($ b1eB, n) && bbb1g ($ b1bb, -1)! = && bbb81r ($ bbb, 0,1)! = && 8bbb ((bbb, -1)

Ι-- тп && $1ЬеЫ 1= && $1ЬеЫ != && !1п._аггау($1ЬеЫ,$ехс1ис1е_еп2)) (Ι-- mn && $ 1bfb 1 = && $ 1bbfb = &&! 1p._aggau ($ 1bbf, $ exc1is1e_ep2)) (

$1етр = $8ΠΗγ[$ύιεΒ1][ΗεΒΓε\ν_ο];$ 1 meter = $ 8ΠΗγ [$ ύιεΒ1] [ΗεΒΓε \ ν_ο];

ί£ (!$1етр) #ηβντ, туе1соте {ί £ (! $ 1tetr) # ηβντ,

$аггау[$1ЬеЫ][ЬеЪге5У_с] = }$ aggau [$ 1ЬеЫ] [беЬге5У_с] =}

εΙβείΓ (!8ίΓ8ΐτ($ίβιηρ,,$ΐ,)) #ηενν, тлгекоте {εΙβείΓ (! 8ίΓ8ΐτ ($ ίβιηρ ,, $ ΐ,)) # ηενν, only {

$аггау[$ШеЫ][118Ъг8\у_с”] = $1етр.$ aggau [$ ШеЫ] [118Ьг8 \ у_с ”] = $ 1 meter.

} $ех!га = Яоог($1/$таг£1п);} $ ex! ha = Yaog ($ 1 / $ tag £ 1n);

- 31 007776 ΐ£(Засйоп =ч айй) { Зех!гавт = $ί + 5ех1га - 45; 5ех!га1§ = $ϊ + $ех1га + 45;- 31 007776 ΐ £ (Zasyop = h ay) {Zech! Gavt = $ ί + 5ex1ga - 45; 5ex! Ha1§ = $ ϊ + $ ex1ga + 45;

екеИ (Засйоп = 5иЬ) { Зехггавт - 8ί - $ех!га - 45; $ех!га!§ = $ϊ - Зехйа + 45;} ϊ£ (8ех!гавт < 0) Зехйавт = 0;ekei (Zasyop = 5bb) {Zehgggawt - 8ί - $ ex! ha - 45; $ ex! ha! § = $ ϊ - Zekhya + 45;} ϊ £ (8ex! gawt <0) Zekhyavt = 0;

ΐ£ (Зех1га1§ > $зитЬ) Зех!га1§ = ЗзитЬ;ΐ ((Zekh1ga1§> $ zt) Zekh! ga1§ = Zzit;

$01апё81аг1 = дейтсгойтеО;$ 01apy81ag1 = deitsgoyteO;

£ог ($е = Зехйавт; Зе < 5ех1га1§; $е++) {£ og ($ e = Zehavt; Ze <5ex1ga1§; $ e ++) {

Зехйап = йоог($п/5гпаг§т!р);Zehyap = yoog ($ n / 5gpag§t! P);

ΪΓ (Засйоп = айй) {ЗЬо! = $п + Зехйап - 45; $ίορ = $п + Зех!гап + 45; } е1ве1£(Засйоп = виЬ) { $Ъо1 = $п - Зехйап - 45; $1ор = $п - ЗехСап + 45;} И (ЗЬо! < 0) $Ъо1 = 0;ΪΓ (Zasyop = ay) {Zo! = $ n + Zekhyap - 45; $ ίορ = $ n + Зех! Гап + 45; } e1be1 £ (Zajop = bjb) {$ bo1 = $ n - Zhejap - 45; $ Lop = $ n - ZekhSap + 45;} U (Zb0! <0) $ b01 = 0;

ίί ($1ор > ЗвитЫр) $1ор = ЗвитЫр;ίί ($ 1op> Sounds) $ 1op = Sounds;

ипве1($1Ьс);ipve1 ($ 1bc);

£ог ($х = ЗЪо!; $х < $1ор ; $х++) # сЬеск ±е епдНвЬ, 10 Ъаск апй 10 Гопуагй. { ипве1($1еп§);£ og ($ x = 3b0!; $ X <$ 1op; $ x ++) # besk ± e bk, 10 bkb 10 Gopuagy. {ipve1 ($ 1ep§);

И (($1« && $х > Зе) || $1 != $ϊ)# $п > Зе &&And (($ 1 "&& $ x> Ze) || $ 1! = $ Ϊ) # $ n> Ze &&

{ $а = 0;{$ a = 0;

Ми1е (Зо1п§в[$е+$а] = $о1пдв1р[$х+$а] && $о1пдв[3е+8а] 1= ) {Mi1e (Зо1п§в [$ е + $ а] = $ о1пдв1р [$ х + $ а] && $ о1пдв [3е + 8а] 1 =) {

$1еп§ .= . $о1пдв[$е+$а];$ 1ep§. =. $ o1pdv [$ e + $ a];

$1еп§ = 1лт($1еп§);$ 1ep§ = 1lt ($ 1ep§);

1Г(!егед([’~!@#$%^А&*()о_+=-?._>;;Л],$1еп2) && !еге8([09],зиЪз1г($!епд,0,1)) && !егед(^л[0-9]*3,$(епд) && $1еп§ != && виЬв1г($!епд,0,1) != && !еге§([09],виЬв1г($1еп8,-1)) && виЬв1г($1еп8,-1) != && виЬв1г($1еп8,0,1) != && виЬзй(31еп§,-1G (! Unified (['~! @ # $% ^A & * () о _ + = - ?. _> ;; Л], $ 1ep2) &&! Ex8 ([09], sicl1 ($! Epd, 0,1 )) &&! ezed ( ^l [0-9] * 3, $ (epd) && $ 1ep§! = && bbb1r ($! ebd, 0.1)! = &&! ezeg§ ([09], bbb1r ($ 1 bp8, -1)) && bbb1g ($ 1bb8, -1)! = && bbbb1g ($ 1bb8,0,1)! = && bbbb (31bg, -

1) != && $1еп§ != && $1еп§ !^в && !т_аггау(51еп8,$ехс1ийе_&е)) {1)! = && $ 1ep§! = && $ 1ep§! ⁱⁿ &&! t_aggau (51ep8, $ exx1iee_ & e)) {

51етраггау = аггау_кеув($аггау[$1ЬеЪ1]);51etraggau = aggau_keuv ($ aggau [$ 1bе1]);

ίί (т_аггау(51еп£,81етраггау)) {ίί (t_aggau (51ep £, 81etraggau)) {

$1етр = $аггау[$111еЫ][$1еп§];$ 1 meter = $ aggau [$ 111еЫ] [$ 1п§];

ϊ£(!8ίτ5ΐτ($ΐβιηρ,_>$χ,))# && !з!г5!г($1етрГ’,₁$е₎)) {ϊ £ (! 8ίτ5ΐτ ($ ΐβιηρ, _> $ χ,)) # &&! з! г5! г ($ 1етрГ ', ₁ $ е ₎ )) {

$аггау[$й1еЪ1][$1еп&| = $1етр.$х,;$ aggau [$ d1e3] [$ 1п & | = $ 1tetr. $ X ,;

} }}}

е1ве {e1we {

$аггау[$1ЬеЫ][$1еп8] = ,$х,;$ aggau [$ lbf] [$ lep8] =, $ x ,;

}}

- 32 007776 }- 32 007776}

$а++;$ a ++;

} #еп<1 ο£ν/1ΰ1ε Ιοορ }} # ep <1 ο £ ν / 1ΰ1ε Ιοορ}

}# епй о£ £ог 1оор.} # й о ог £ ог 1 1 ор ор.

}# εηά о£ ηεχν 1оор $о!ап§еп(1 = дейпдсгоНтеО;} # εηά о £ ηεχν 1оор $ о! апппep (1 = DeypdsgoNteO;

$йте1 = $о1ап§епд - $о1ап£51аг1;$ a1 = $ o1ap§epd - $ o1ap £ 51ag1;

#фи1з ($ф,РгепсЬ ν/οτά пшпЪег $п о£5питЪег1р 1оок $1нпе1\п);# phi1z ($ ph, Przeps ν / οτά ш п п $ $ п п о о 5 5 5 ег 5 1 1 р 1 ок $ $ 1 1 1)))));

}# епс1 υρ ίο 5 ЪеЬгеху (озеОдег.} # eps1 υρ ίο 5

$р++;$ p ++;

} # εηά о£ч?ЪЙе Ιοορ $р < 15 $1апдепс1 = βείτηίοΓΟίπηεΟ;} # εηά о £ ч? ЬЬе Ιοορ $ p <15 $ 1apdeps1 = βείτηίοΓΟίπηεΟ;

$йте2 = $1ап@еп<1 - $1апд81аг1;$ ite2 = $ 1ap @ ep <1 - $ 1apd81ag1;

#фи1з ($φ,Εη§1Ϊ81ι χνοτά питЬег $ΐ о£$питЬег 1оок $1нпе2\п);# phi1z ($ φ, Εη§1Ϊ81ι χνοτά peter $ ΐ о £ $ peter 1оок $ 1нпе2 \ п);

} }}}

ΐ£ (соип1($аггау) > 0) {ΐ £ (soip1 ($ aggau)> 0) {

$(й>81аг1 = §е!т1сго11те0;$ (w> 81ag1 = §е! т1сго11те0;

Хзкеат = МУ89Ь_СОМ4ЕСТ( 127.0.0.1”,’’гоо1”);Hzkeat = МУ89Ь_СОМ4ЕСТ (127.0.0.1 ”,’ ’GOO1”);

$1етрЬеЪ = аггау_кеу8($аггау)·, £ог ($ί = 0; $ΐ < соип!($1етр11еЬ) ; $ΐ++) {$ 1eterb = argau_keu8 ($ argau) ·, ог og ($ ί = 0; $ ΐ <soip! ($ 1eter11e); $ ΐ ++) {

$1п§ = $1етрЬеЪ[$1];$ 1n§ = $ 1tepBe [$ 1];

ΐ£ (8иЪз1г_соип1($а1гау[$1пд][ЬеЬгеху_с],,) - 1 > 0) {ΐ ((8 & b3 / g_soip1 ($ a1gau [$ 1pd] [bbbcu_c] ,,) - 1> 0) {

$1п§с = зиЪз1г_соип1($аггау[$1пд][11еЪгеху_с],_>) - 1;$ 1ngc = zi3z1g_soip1 ($ argau [$ 1pd] [11ezgu_s], _> ) - 1;

$£етро1пд = аггау_кеу8($аггау[$1пд]);$ £ etro1pd = aggau_keu8 ($ aggau [$ 1pd]);

$η= 1;$ η = 1;

χνΐιίΐε ($п < соип1($1етро1пд) && соип1($1етро1п§) > 1) {χνΐιίΐε ($ n <soip1 ($ 1tro1pd) && soip1 ($ 1tro1p§)> 1) {

$о1п§ = 5Иетро1п§[$п];$ o1n§ = 5Itro1n§ [$ n];

$о!п§с = 8иЪ8й_соип1($аггау[$1п§][$о1пд],,) -1;$ o! ngc = 8 & b8y_soip1 ($ argau [$ 1n§] [$ o1np] ,,) -1;

$циегу = ирда1е $1аЫе 8βί 1о1а1 = 1о1а1+1, $1апдиадгсошй = $1апдиадесои1й+$1п8С, $о1ап£иа§есошй = $о1ап8иа§есоип1+$о1п§с, агйс1е = сопса1(агйс1е,\, $татаггау[$}] V) хуЬеге (агёск ηοί 1£ке'% Бташагтау^] %' апй $1ап§иа§е = '.а4Й51а8Ье8($1п2).' ап4 $о1ап§иа§е “ ^т.а<М51а8Ье8($о1пз).');$ cieuu = irda1e $ 1aEe 8βί 1o1a1 = 1o1a1 + 1, $ 1 apdiadgos = $ 1 apadiades1i + $ 1n8C, $ o1ap £ iagocess = $ o1ap8iaegesoip1 + $ o1n§c, ayc1e1 }] V) xyGee (agesk ηοί 1 £ ke '% Btashagtau ^]%' apy $ 1apgiage = '.a4Y51a8be8 ($ 1n2).' Ap4 $ o1apgiage “ ^so <M51a8be8 ($ o1pz). ');

МУ8рЬСЪгаш,$диегу,$81геат)ог <Не(#2 Сап'1 $циегу .музрь_ЕКв.око);МУ8рЬСъгаш, $ diego, $ 81geat) og <Not (# 2 Сап'1 $ cyegu .muzr_Ekv.oko);

$пит = МУ8рЬ_АЕРЕСТЕО_К.ОА8($81геат);$ pit = MU8r_AERESTEO_K.OA8 ($ 81geat);

ϊ£ ($пит = 0) {ϊ £ ($ pit = 0) {

$дииу — ϊπδειΐ 1§поге ΐηίο $1аЫе уа1иез(\’Ж1ЬЬ\,\'’1\^,,,^,,,.аа(181а8Ье8($1п8).^,,,''.аа<181а8Ье8($о1п8).^,'',\^ии.а(1(181а8Ье8($111ё).А ,?'$1пдс\Д.а0481а8Ье5($о1пд).\,\$о1п8с\,\ $татаггау[$]]$ diiu - ϊπδειΐ 1§poge ΐηίο $ 1aYe ua1iez (\ 'ZH1 \, \' 1 \ ^,,, ^,,, .aa (181a8e8 ($ 1p8) ^,,, '' aa <181a8e8 ($ o1p8).. . ^'' \ ⁱⁱ .a (1 (181a8e8 ($ 111o) .A,? '$ 1pds \ D.a0481a8e5 ($ o1pd). \, \ $ o1p8s \ \ $ tataggau [$]]

- 33 007776- 33 007776

КГ¥£РЦ'Ъгат'^,,$диегу,$з1геат)ог с!1е(”#3 СапЧ $циегу .МУ8рЕ_ЕККОЕ0);KG ¥ £ RTs'gat ^', $ Diogo, $ z1geat) og with 1e ( "# $ 3 SapCh tsiegu .MU8rE_EKKOE0!);

} $п++;} $ p ++;

} }}}

}}

М¥5рЬ_СЬО8Е($81геат);M ¥ 5рЬ_СЬО8Е ($ 81geat);

$<1Ьеп(1 - §ейшсго1ш1еО;$ <Lbn (1 - ейшсейшссгого11шшше;

$Нте = $£ϊόεηά - $0Ьз1аг1;$ Hte = $ £ ϊόεηά - $ 0b3l1ag1;

фи1з ($ίρ,άΕ 1оок $Йте\п);phi1z ($ ίρ, άΕ 1 оook $ тее \ п);

} $й1е_епс1 = §еПшсгоЕтеО;} $ y1e_eps1 = §еПшсгоЕтеО;

} }}}

$аПепс! = деПгпсгоНтеО;$ apeps! = dePpGsGoNteO;

$йте - $а11епб - $аПз!аг1;$ ite - $ a11epb - $ aPz! ag1;

£ри1з ($(р,'ЧЬ.е ν/ΕοΙβ зЫ1 Шок $йте\п);£ ri1z ($ (p, 'b.

фи!з ($ф,Епа1; ^и.йа1е(У-т-<1Нл:8). - $са1с - <ВК>\п); £с1озе($ф);phi! s ($ φ, Epa1; ^and .a1e (V-t - <1Hl: 8). - $ ca1s - <BK> \ n); £ c1ose ($ φ);

?>?>

????

Продолжение сноски с предыдущей страницы Продолжение сноски на следующей страницеContinuation of footnote from previous page Continuation of footnote on next page

- 34 007776 <7 ίτνοπΐ = ипйеЗ паНопз;- 34 007776 <7 ίτνοπΐ = З е З З па Н па;;

$епдзра_{ = еп§зра;$ epzra_ {= epzzra;

$еп§йе_1 = ’ЪеЬйе;$ epigye_1 = ’bib;

$йезра_1 = йезра;$ Jesra_1 = Jesra;

$с = 1;$ c = 1;

ΜΥ8ρΕ_€ΟΝΝΕσΓ(^,,128.241.244.166,Γθοΐ);ΜΥ8ρΕ_ € ΟΝΝΕσΓ ( ^,, 128.241.244.166, Γθοΐ);

$Чиегу = ве1ес11о(а1,1апд,1апдсоип1,о1ап§,о1апдсоип1 йот $еп§йе_1 ν/Неге о!ап§ = 'Зм'огй';$ Chiegu = ve1es11o (a1,1apd, 1apdsoip1, o1ap§, o1apdsoip1 iot $ epgye_1 ν / Hehe o! Ap§ = '3m'ogy';

$гезик = М¥8рЬ(Ъгат,5^иегу) ог Ше(Етгог #1 - $_Чиегу - ''.МУ89Ь_ЕККОК0); $ф1егу1 = зеке! 1ап8 &^ош $еп§5ра_1 ν/Ьегс о1ап§ = '$хуогй';$ gezik = M ¥ 8r (gat, 5 ^ Jehu) og Chez (Etgog # 1 - $ Jehu _W - ''.MU89_EKKOK0); $ f1egu1 = zeke! 1ap8 & ^osh $ ep§5ra_1 ν / begs o1ap§ = '$ huogy';

$гезиЙ1 = МУ8рЬ(Ьгат_;$диегу1) ог <Не(Еггог #2 - $_Чиегу1 - .МУЗрЬ.ЕККОКО); Гог ($ΐ = 0 ; $ΐ < М¥8рЬ_ЫиМ_КОА5($ге8иИ1); $ΐ++) {$ geziY1 = MU8r _(gat; $ diegu1) og <not (On Error # 2 - $ _H iegu1 - .MUZr.EKKOKO); Gog ($ ΐ = 0; $ ΐ <М ¥ 8рЬ_ЫиМ_КОА5 ($ ге8иИ1); $ ΐ ++) {

1181($1ап§) = М¥8рЬ_ГЕТСН_К.ОА($гезиЙ1);1181 ($ 1ap§) = M ¥ 8p_GETSN_K.OA ($ geziJ1);

$ϊη .= .'.аййз^йезСЛапд).’;$ ϊη. =. '. ayz ^ yesSLapd). ’;

) $П1 = 5иЪвй($т,1);) $ P1 = 5 & bv ($ m, 1);

$пит = М¥8рЬ_ЪШМ_К.ОА8($ге8и11);$ pit = M ¥ 8рЬ_ЬШМ_К.ОА8 ($ ге8и11);

ρπηΐ $ίη<ΒΚχΒΚ>\η;ρπηΐ $ ίη <ΒΚχΒΚ> \ η;

Гог ($ϊ = 0 ; $ΐ < $пит; $ί++) {Gog ($ ϊ = 0; $ ΐ <$ pit; $ ί ++) {

Нз1($1о1а1,$1ап8,$1ап§с,$о1ап8,$о1ап§с) = М¥8рЕ_ГЕТСН_КОА($гези11);Hz1 ($ 1o1a1, $ 1ap8, $ 1ap§s, $ o1ap8, $ o1ap§s) = M ¥ 8pE_GETSN_KOA ($ gezi11);

ρτΐηΐ ”$1ап§, $Чиегу2 = зе1ес1 сМ йот $йезра_1 хуйеге о1апд = '.айсШазЬез^апд).' аий 1ап§ ίη ($т)”;ρτΐηΐ ”$ 1ap§, $ Chiegu2 = ze1es1 cM yot $ jesra_1 huyege o1apd = '. aiy 1ap§ ίη ($ t) ”;

$гезиИ2 = М¥8рЬ(Ъгат^,’,$чиегу2) ог (йе(Еггог #3 - $чиегу2 - .МУ8<^Е_Е1<К.ОК.О); 1£(М¥8рЬ_ЫЦМ_КОА8($ге8и112) > 0) {$ hezi2 = M ¥ 8pb (bgat ^, ', $ chieu2) og (e (Ergog # 3 - $ ciegu2 - .MU8 <^ E_E1 <K.OK.O); 1 £ (M ¥ 8р_ЫЦМ_КОА8 ($ ге8и112)> 0 ) {

$гез .= $ΐ - $1о1а1,Яапд,$1апдс,$о1апд,$о1а11дс<ВК>\п'';$ ges. = $ ΐ - $ 1o1a1, Yaapd, $ 1apds, $ o1apd, $ o1a11ds <VK> \ n '';

$с++;$ c ++;

} }}}

ρπηΐ <ВК.хВК>$гез;ρπηΐ <VK.hVK> $ ges;

ρπηΐ $с/ ^п.М¥89Ь_ЫиМ_КОА8($ге8и11);ρπηΐ $ s / ^n. М ¥ 89Ь_ЫиМ_COA8 ($ ge8i11);

?>?>

????

- 35 007776 <1- 35 007776 <1

Гипсйоп сопуей($5¥Ьа1,$о1ап§) {Gipsyop sopoyu ($ 5 ¥ ba1, $ o1ap§) {

ίί ($ννή3ί = $™Ьа1 = V;ίί ($ ννή3ί = $ ™ bа1 = V;

ίί ($5УЙа( = \\) гейта;ίί ($ 5 UYA (= \\) gate;

$циегу = зе1ес1 з1ейег (тот. $о1апд. 1ейег иЪеге Пейег = ’ХмгЬаГ;$ cieuu = ze1es1 z1eyeg (that. $ o1apd. 1eyeg ieege Peyeg = ’HmgLaG;

5гезик = МУ5рЦтт1Ьи511,$9иегу) ог <Яе(*5>уЬа1* -еггог #1 5циегу -. МУ8рЬ_ЕВКОК0);5gezik = MU5rCTmTi5i511, $ 9iegu) og <Яe (* 5> yaa1 * -nogog # 1 5cegu -. MU8р_ЕВКОК0);

;£(МУ8рЬ_КиМКО\У8(5гезик) > 0) {; £ (MU8p_KiMKO \ Y8 (5gezik)> 0) {

Нй($81ейег) = МУ8рЬ_ГЕТСН_К.О^($ге8иЙ);Ny ($ 81eyeg) = MU8p_GETSN_K.O ^ ($ ge8iJ);

гейта 5з1ейег;gate 5z1eyeg;

} е1зе гейта 8£прз1а8Йез($1УЙа1);} e1ze gate 8 £ prz1a8Yez ($ 1Yaa1);

}}

Й1ПСЙОПY1PSYOP

0Уег1ар($з,$тт,$теап,$108_>$о8теап,$тах,$б1сбопагу_£,$1ап8,$о1апд,$8расеа<Мге53,$1 опдез1о1апд) {0Ueg1ar ($ s, $ TT, $ teap, $ 108 _> $ o8teap, $ max, $ b1pagu_ £, $ 1ap8, $ o1apd, $ 8racea <Mge53, $ 1

$1етртах = $тах;$ 1tax = $ max;

5{5о1апд) = 5озтеап;5 {5o1apd) = 5ozteap;

${$1ап§} = $теап;$ {$ 1ap§} = $ theap;

$теап = ехр1обе( ,$теап);$ teap = exp1obe (, $ teap);

$озтеап = ехр1обе( ,$озтеап);$ ozteap = exp1obe (, $ ozteap);

£ог (5т = $тт; 5т < сошй(5теап); $т++) {£ og (5m = $ mt; 5m <soi (5theap); $ m ++) {

ипзе1(5з1пп£);ipze1 (5z1pp £);

Гог ($1 = $т; $1 < соип£($теап) ; $1++) $8ίπη8 .= $теап[$1].Gog ($ 1 = $ m; $ 1 <soip £ ($ teap); $ 1 ++) $ 8ίπη8. = $ Teap [$ 1].

$8т = $8 + соигй($теап);$ 8m = $ 8 + soigy ($ teap);

ипзе1(5пех£\уогбта(сЬ);ipze1 (5peh £ \ wogbta (cb);

ίί (58расеаббгезз[$8т+1]) $пехйУогбта{сЬ = $1ап§ Йке ’.зЦ_гер1асе(%,,£пт($з{пп§.5зрасеаббгезз[5зт])). %' ог;ίί (58raceabbgesis [$ 8m + 1]) $ pehi Wogbta {cb = $ 1ap§ кеke ’.zC_her1ace (% ,, £ pt ($ s {nn §.5zraseabbgesz [5zt])). % 'og;

5циегу1 = 8е1ес1 $1апд,$о1ап§ Дот $<йсбрпагу_1 чуйеге $пех1луогбта£сй $1апд =. '.8й_гер1асе(%/',й£т(58йбпд.5зрасеай(1ге88[5зт])).' апб $о1ап§ о ” огбег Ьу $1апд безе, 1еп§Й1(51апд),$о1апд безе, 1епд1й($о1апд) безе;5ciegu1 = 8e1es1 $ 1apd, $ o1ap§ Dot $ <ysbrpagu1 chuyege $ peh1luogbta £ c $ $ 1apd =. '.8y_ger1ase (% /', d £ t (58ybpd.5zraseai (1ge88 [5zt])). 'Apb $ o1ap§ o ”ogbeg by $ 1apd meringue, 1ep§I1 (51apd), $ o1apd meringue, 1epd1y ($ o1apd) meringues;

$гези111 = МУЗрЬ(''пшйЬизй''_> ^,'$диегуГ) ог б1е(сапЧ еггог #2 - '5циегу1' . МУ8рЬ_ЕККОК0);$ gezi111 = MUZR ('' pshyBuizy ''_> ^, '$ dieguig) og b1e (sabch ergog # 2 -' 5ceguu1 '. MU8р_ЕККОК0);

$1 = 0;$ 1 = 0;

5уЫ1е ($1 < МУ80Ь_МиМК.О\¥8($гези111))# && $£етрта1сЬ != уез) {5уЫ1е ($ 1 <МУ80Ь_МиМК.О \ ¥ 8 ($ геи111)) # && $ £ etrta1сЬ! = Уез) {

1Ϊ8ί($ {-1ешр.$1апв}3 Петр”.$о1апв}) = МУ8рЬ_ЕЕТСН_КО^($ге5и1£1); $£етртеап = ехр1обе(^п ,5{'Четр.51апв});1Ϊ8ί ($ {-1shr. $ 1apv} 3 Peter ”. $ O1apv}) = MU8p_EETSN_KO ^ ($ ge5u1 £ 1); $ £ etrteap = exp1obe ( ⁿ , 5 {'Chet. 51apv});

$1етротеап = ехр1обе(^п ,$ (1етр.5о1апд});$ 1etrotheap = exp1obe ( ⁿ , $ (1tr.5o1apd});

$1§ = $т;$ 1§ = $ t;

$Ьп = 0;$ Bn = 0;

ипзе1(51стрта1сй);ipze1 (51strta1sy);

- 36 007776 ννΐΰΐβ ($ΐβ < соип1($1етртеал) + $т) {- 36 007776 ννΐΰΐβ ($ ΐβ <soip1 ($ 1trteal) + $ t) {

ί£ (($8расеаббге88[$8+$1д] = $1етртеап[$Ьп]) && ($1етрта1сЬ != по)) $1етрта£сЬ = уев;ί ((($ 8erasebbg88 [$ 8 + $ 1d] = $ 1tetrheap [$ bn]) && ($ 1tett1cb! = u)) $ 1tetre £ cb = yee;

е1зе $1етрта1сй = по;e1ze $ 1terta1sy = by;

$£§++;$ £ § ++;

$Йп++;$ Ip ++;

} ϊ£ ($1етрта1сй = уез && 8иЪ51г_соип1($1опдез£ге8ик, ) <= 8иЬз1г_соип1(${1етр.$1апд}_> )) #сЬескз ϊ£Λβ пеху оуейар ΐδ та£сЬт§ Ле 1гап81абоп ΓβςιιβδΙ.} ϊ (($ 1detter1sy = u && 8 & b1 51g_soip1 ($ 1degree ге ge8ik,) <= 8u3b1g_soip1 ($ {1tetr. $ 1apd} _> )) # cbcq ϊ £ Λβ peuyuyu ΐδ that £ cbtβ 1 1β1

{ $1опве81ге81111 = ${£етр.$1ап§};{$ 1oper81ge81111 = $ {£ etr. $ 1ap§};

$отеап = ехр1обе($1етротеап[0],${5о1ап§});$ oteap = exp1obe ($ 1etrotheap [0], $ {5o1ap§});

$1о = соип1($отеап) - 1;$ 1o = soip1 ($ oteap) - 1;

ЛсбескЪ = 8иЬ8й-(${£етр.$о1апд},0,81г1еп($1етротеап[0]));Lsbesk = 8bb8y - ($ {£ etr. $ O1apd}, 0.81r1ep ($ 1troteap [0]));

ΐ£ ($озтеап[$1оз] = $1етротеап[0] && 188е1($о8теап[$1оз])) {ΐ £ ($ ozteap [$ 1oz] = $ 1 tetroteap [0] && 188е1 ($ o8teap [$ 1oz])) {

ΐ£ (соип1($теап) + соип{($(етртеап) -1 > $тах) # δΐηβΙβννοΓά оуейар {ΐ £ (soip1 ($ teap) + soip {($ (etrteap) -1> $ max) # δΐηβΙβννοΓά oueyar {

$тах = $т + соип1($1етртеап);$ max = $ m + soip1 ($ 1trteap);

$пз = $т;$ pz = $ t;

$1о1ап§ = ${$о1ап§} . 5иЬ81г(${1етр.$о1апд},81г1еп($1етротеап[0]));$ 1o1ap§ = $ {$ o1ap§}. 5bb81r ($ {1tetr. $ O1apd}, 81g1ep ($ 1tetroteap [0]));

$оуег1ар = ίπιβ;$ oueg1ar = ίπιβ;

) е1зе $1етрта1сЪ = по;) e1ze $ 1terta1cb = by;

} β18βΐ£ ($овтеап[($1о8-1)] = $1етротеап[0] && $О8теап[$1оз] = $1етротеап[1] && 18зе1($о8теап[($1о8-1)])) {} β18βΐ £ ($ ovteap [($ 1o8-1)] = $ 1 tetroteap [0] && $ O8teap [$ 1oz] = $ 1 tetroteap [1] && 18ze1 ($ o8teap [($ 1o8-1)])) {

ΐ£ (соип1($теап) + соип1($1етртеап) -1 > $тах) # зт§1е\уогб оуегкр {ΐ £ (soip1 ($ teap) + soip1 ($ 1eterteap) -1> $ max) # 3t1e \ wogb ueegcr {

$тах = $т + соип1($1етртеап); $П5 = $т;$ max = $ m + soip1 ($ 1trteap); $ P5 = $ t;

$1о1ап§ = ${$о1ап§} . 5пЪ81г(${4етр.$о1ап§),81г1еп($1етротеап[0]. .$1етротеап[1]));$ 1o1ap§ = $ {$ o1ap§}. 5nb81r ($ {4etr. $ O1ap§), 81g1ep ($ 1etroteap [0].. $ 1troteap [1]));

$оуег1ар = ΐπιβ;$ oueg1ar = ΐπιβ;

} е18е $1етрта1сЬ = по;} e18e $ 1tetra1cb = by;

} е1зе1£ ($о8теап[($1оз-2)] = $1етротеап[0] && $озтеап[($1оз-1)] — $1етротеап[1] && $озтеап[$1оз] = $1етротеап[2] && 188е1($озтеап[($1о8-2)])) { ΐ£ (согш1($теап) + соип1($1етртеап) -1 > $тах) # зтд1еугогб оуег1ар {} e1ze1 £ ($ o8teap [($ 1oz-2)] = $ 1 metrotheap [0] && $ ozteap [($ 1oz-1)] - $ 1 metrotheap [1] && $ ozteap [$ 1oz] = $ 1 metrotheap [2] && 188е1 ($ ozteap [($ 1о8-2)])) {ΐ £ (сшш1 ($ тап) + soip1 ($ 1етртеап) -1> $ тах) # Зтд1еугогб оуег1ар {

$тах = $т + соип1($1етртеап);$ max = $ m + soip1 ($ 1trteap);

- 37 007776 $пз = $ш;- 37 007776 $ pz = $ w;

$1о1ап§ = ${$о1ап§} . зиЬзк(${'Четр.$о1апд},зк1еп($1етротеап[0]. ,$1етротеап[1]. ,$1етротеап[2]));$ 1o1ap§ = $ {$ o1ap§}. siZk ($ {'Chetr. $ o1apd}, sk1ep ($ 1 metrotheap [0]., $ 1 metrotheap [1]., $ 1 metrotheap [2]));

$оуег1ар = 1гие;$ oueg1ar = 1gie;

} е1зе $1етрта1сЬ = по;} е1зе $ 1етрта1сЬ = по;

} е1зе1£ (зиЬзк_соип1(${$о1ап§}, ) = 0 && $1сЬескЬ = 1пт(зиЬ5&(${$о1ап§}_>1))) { ΐ£ (соип{($теап) + соип1($1етртеап) - 1 > $тах) # зтдкчуогй оуег1ар {} e1ze1 £ (szbk_soip1 ($ {$ o1ap§},) = 0 && $ 1cbk = 1pt (ziB5 & ($ {$ o1ap§} _> 1))) {ΐ £ (coi {($ teap) + coi1 ($ 1 ) - 1> $ тах) # Зтдкчуогй оуег1ар {

$тах = $т + сошй($1етртеап);$ tax = $ t + soshy ($ 1retrteap);

$пз = $ш;$ pz = $ w;

$о1апдттиз = зиЬзк(${1етр.$о1ап_ё},зк1еп(${$о1апд}));o1apdttiz zizk $ = ($ {$ 1etr o1ap _g.}, zk1ep ($ {$ o1apd}));

$1о1ап§ = ${$о1ап§} . . $о1ап§ттиз;$ 1o1ap§ = $ {$ o1ap§}. . $ o1ap§ttis;

$оуег1ар = кие;$ oueg1ar = cue;

} }}}

е1зе1£(зиЬзк_соип1(${$о1ап§}, ) — 0 && зиЬзк_соип1(${'Четр.$о1ап§}, ) — О) # епдПзЬ оуег!ар ЬеЬгеду опе хуогй оп1у.e1ze1 £ (siZk_soip1 ($ {$ o1ap§},) - 0 && ziZk_soip1 ($ {'Chetr. $ o1ap§},) - 0) #

{ $тах = $т + соип1($1етртеап);{$ max = $ m + soip1 ($ 1retrteap);

$пз - $т;$ pz - $ t;

$к>1ап§ = ${$о1ап§) . . ${'Четр.$о1ап§};$ k> 1ap§ = $ {$ o1ap§). . $ {'Fourth $ o1ap§};

$оуег1ар = кие;$ oueg1ar = cue;

} е1зе {} e1ze {

$1етрта4сЬ = по;$ 1 tetra 4cb = by;

} ΐ£ ($оуег1ар = кие) {} ΐ £ ($ oyeg1ar = kie) {

$ттеап = ехр1ойе( ”.$1етртеап[0],${$1ап§});$ tteap = exp1oye (”. $ 1trteap [0], $ {$ 1ap§});

$к> = соип1($ттеап) -1;$ k> = soip1 ($ tteap) -1;

$По8 = сошп($теап) -1;$ Po8 = sshp ($ teap) -1;

ΐ£ ($ттеап[$1:о] && $1о > 0) {ΐ £ ($ teap [$ 1: о] && $ 1о> 0) {

$1скеск = зиЬзк(${^,Четр.$1ап§},5к1еп($1етртеап[0])+1);$ 1sk = ziZk ($ { ^, Chet. $ 1ap§}, 5k1ep ($ 1retrteap [0]) + 1);

ί£ <8иЪзк($1сЬеск,0,8к1еп(кш1($штеап[$1о]))) — клп($ттеап[$к>])) # оуег1аррт§ {ί <8 Ъ Ъ с к ((1 Ь с еск еск,, 0.8 1 еп еп к (1 1 $ ((те ап ап [$ 1]]))))))))))))))))))))))))) - klp ($ те т [[$ $)))))) #

$Иап_ё = ${$1ап_ё) . 8иЪ8к($1сЬеск,8к1еп(кпп($ттеап[$1о])));$ Iap _ё = $ {$ 1ap _ё ). 8 & b8k ($ 1cb, 8k1ep (kpp ($ tteap [$ 1o])));

} }}}

екеД ($теап[$коз] = $1етртеап[0] && $теап[$Йоз]) {eKeD ($ teap [$ goats] = $ 1 tetrtheap [0] && $ teap [$ Yoz]) {

- 38 007776 $Йап§ = ${$1ап§} . зиЬз1г(${1етр.$1апд},з1г1еп($1етртеап[0]));- 38 007776 $ Yap§ = $ {$ 1ap§}. si3s1r ($ {1tetr. $ 1apd}, s1g1ep ($ 1tetrteap [0]));

} е1зе {ρπηί ВИЗ ЕЯКОЯ; ехй;} }} e1ze {ρπηί VISION JAYAKOY; hey;}}

} $1++;} $ 1 ++;

} }}}

ΐ£($оуег!ар != ΐηιβ) $оуег1ар = Гаке;ΐ £ ($ oueg! ar! = ΐηιβ) $ oueg1ar = Gake;

ΪΓ ($1етртах = $тах && $оуег1ар != Ьгае) $тах = 0;ΪΓ ($ 1ertax = $ max && $ oyeg1ar! = Bae) $ max = 0;

$аггау = аггау( ь =*=* э» , пин ^-'ииидцфшеап), шеаи ιυ» —>ъио51г_ииипцф1и1анё, )_эо5теап=>$1о1ап8,тах=>$тах,1о1ап§^|->$1о1апе^и,'^,оуег1ар=>$оуег1ар^,’,'’1оп 8ез1о1апд=>$1оп£ез1:о1ап8);$ array = Array (s = * = * e "pin ^ - 'iiidtsfsheap) sheai of w» -> io51g_iiiptsf1i1ano,) _e o5teap => $ 1o1ap8, max => $ max, 1o1ap§ ^| -> $ 1o1ape ^and ^'oueg1ar => $ ^oueg1ar,' '' 1op 8ez1o1apd => $ 1op £ ez1: o1ap8);

ге1ит $аггау;ge1it $ aggau;

} й1псйоп1гап51а1е($\Уогс1,$1оск,$1а83,$Ьазе1ап8) {} i1psyop1gap51a1e ($ \ wogs1, $ 1osk, $ 1a83, $ baz1ap8) {

§1оЪа1 $1д_1,$ргейх_^$ШсНопагу_1;§1оБа1 $ 1д_1, $ ргейх _ ^ $ ШсНопагу_1;

$Ъазе1апд = ЬеЪгелу;$ Baz1apd = bghel;

ϊί (!$ννοτά) τβΐυτη;ϊί (! $ ννοτά) τβΐυτη;

ί£ ($4гап8еп£ = ίηιβ) {ίί (еге£([а-гА-2],$зуог<1)) τβίιιπι $\νοπ1;} ί£($Ъазе1ап§ — ЬеЬгезу) { $зрасей = ίπιβ; $етаПеп(1 = · о,£.бТ·, ϊ£($Ьазе1ап§ = ’^арапезе) { $сксбопагу_1 = с11сйопагу]ар; $зрасей = ка1зе;} ΐί ($Ъазе1ап8 — сЫпезезпп) { $(Нспопагу_1 = ФсйопагусЬпзйп; $зрасей = ка1зе; }ί £ ($ 4gap8ep £ = ίηιβ) {ίί (its £ ([a-gA-2], $ zuog <1)) τβίιιπι $ \ νοπ1;} ί £ ($ бае1ап§ - ееЬезеу) {$ miracle = ίπιβ; $ etaPep (1 = · oo, £ .bT ·, ϊ £ ($ ba1e1a2 = '^ arapeze) {$ sksbopagu_1 = c11syopagu] ap; $ zraez = ka1ze;} ΐί ($ ba1e1ap8 - cIbeseupp) {$ ( Psiopagusbnzip; $ serpent = ka1ze;}

М¥5рЬ_СОКНЕСТ(216.205.78.138,^ипоЬо(1у)ог Ые(сапЧ соппеск . МУ89Ь_ЕККОК0);M ¥ 5p_SOKNEST (216.205.78.138, ^and poO (1y) ogye (sapch soppesk. MU89_EKKOK0);

$ινοπ1 = ίπιη($ννοΓά);$ ινοπ1 = ίπιη ($ ννοΓά);

ΐΓ ((з1г5Ы($у/огф11еЪгеу($10_1).,) || 8ΐΤ5ΐτ($ννθΓ<1,Ηβ6Γβν($ίά._ί). ) || 3υΒ8ΐΓ($ν/0Γά,3ΐΓ1εη.($·ΛΌΓά) - 5ίτ1εη($ΐά_ί)) — ЬеЬгеу($1д_1)) && Ϊ8δβΐ($ίά_ΐ)) {ΐΓ ((s1g5Y ($ y / ogf11eBgeu ($ 10_1).,) || 8ΐΤ5ΐτ ($ ννθΓ <1, Ηβ6Γβν ($ ίά._ί).) || 3υΒ8ΐΓ ($ ν / 0Γά, 3ΐΓ1εη. ($ · ΛΌΓά) - 5ίτ1εη ($ ΐά_ί)) - ЛеЬгеу ($ 1д_1)) && Ϊ8δβΐ ($ ίά_ΐ)) {

$\νοπ! - 5^_тер1асе([1еЪтеу($И_1),'\5'^от0');$ \ νοπ! - 5 ^ _ter1ase ([1еЬтеу ($ и_1), '\ 5' ^ from 0 ');

$зуз1етз11е = ίηιβ;$ zuz1etz11e = ίηιβ;

ΐί (5ν/οτφ # \νλν\ν.30Γηεύιίηβ #ΐί (5ν / οτφ # \ νλν \ ν.30Γηεύιίηβ #

1Г(8^г81г($\уог0,1111р://«^п¥.шЬеЬге1У.сол1/п81а.Ыт1)) {1Γ (8 ^ r81r ($ \ yog0,1111p: // \\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\\

$λνοτά = 8ρΙΐΙ('-,$\уогф;$ λνοτά = 8ρΙΐΙ ('-, $ \ wogf;

$\νοτά = зрШ(&,$\уогс1[1]);$ \ νοτά = spr (&, $ \ wogs1 [1]);

гекит $ννοΓ<1[0];hekite $ ννοΓ <1 [0];

- 39 007776 ΐί (8ίτ8ΐτ($·ννοΓ<1,://)) { $ΐβιηρ = βχρ1οάβ(://,$ννοπ1); 5аййгезз = $1етр[1]; } е1зе $аййгезз = $угог<1;- 39 007776 ΐί (8ίτ8ΐτ ($ · ννοΓ <1,: //)) {$ ΐβιηρ = βχρ1οάβ (: //, $ ννοπ1); 5yygezz = $ 1 meter [1]; } e1ze $ ayygezz = $ ogo <1;

БасИгезз = ехр1ойе(/,$ай(1ге8з);BasIgezz = exp1oye (/, $ ay (1ge8z);

БаййгеззсЬеск = $аййгез5[0];PayPal = $ payPal5 [0];

ί£ (!ετεβ([3-ζΑ-Ζ.. $аййгеззсЬеск)) БаййгеззсЬеск = $аййгезз[ 1];ί £ (! ετεβ ([3-ζΑ-Ζ .. $ aygezsbesk)) Baiygezsbesk = $ ayygesz [1];

1£(еге§([а-гА-2],$ас1йге83сйеск)) {1 £ (eeg§ ([a-gA-2], $ ac1yge83syesk)) {

$1ап§ = епдНзЬ;$ 1ap§ = bff;

$о1ап§ = $Ъазе1ап§;$ o1ap§ = $ base1ap§;

1х ^&αιυιυννει\,Λαυοΐ4^φνννινι._>ν_>/)}--- ιιιι,ρ.// у χ ψγννιιχ — оииои^уущи, ιу, ц>рю — }1x ^ & αιυιυννει \, Λαυοΐ4 ^ φνννινι. _> ν _> /)} --- ιιιι, ρ. // y χ ψγννιιχ - ии ^ ои ущ и, ι,,> ryu -}

ϊ£ (8Що1олуег(5иЬз1г($5УОГЙ,0,8)) — Ьйрз://) {$νζοτά = 8иЬз1г($дуогс1,8); $рге =ϊ ((Щ о ол ол у у ег (5 5 и з 1 1 г ($ $ 5 5,,, 0,8 0,8 0,8 0,8 0,8 0,8 0,8::: //:: // // // // // // // // // // // // // // // // // // // // 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 // // // // // // // // // // // // $ rge =

ΪΓ (8ίιΐοΙονβτ(3υΒ8ίτ($·ννοπ1,0,6)) = Йр7/) { $\νοτά = зиЪз1г($1¥огй,6); $рге = }ΪΓ (8ίιΐοΙονβτ (3υΒ8ίτ ($ · ννοπ1,0,6)) = Yp7 /) {$ \ νοτά = zi3z1g ($ 1 ¥ ogy, 6); $ rge =}

} βίβεΐί ($Ъазе1ап§ — ЬеЬгеху) {} βίβεΐί ($ bае1ап§ - bеехеху) {

$1апд = ’ЪеЬгету;$ 1apd = ’bégetu;

$о1апд = епдНзЬ;$ o1apd = ebp;

И (зиЬзЬг($5Уогс1,0,8) — „§§“://*) { δτνοπΐ = зиЬз1г($ж>п1,8); $рге = Ьйр://; $иррег = {гие;} е!зе1£(зиЬз1г($1Уог<1,0,7) — { $·\νοτά = зиЬз1г($1¥Ог<1,7); $рге = Ьйр://;} е1зе1£ (зиЪз1г($у/ог<1Д9) — ,,δδ“π://*) { $χνοτά = зиЬз1г($^огй,9); $рге = Ййрз://; $иррег = ’Чгие;} е1зеИ (зиЪз1г($\уогс1,0,8) = ,,§δ“π://) {$\νοτά = зиЬз1г($^огй,8); Зрге = ЬПрз://; } .And (siZbr ($ 5WGs1,0,8) - "§§": // *) {δτνοπΐ = siBiSr ($ x> n1,8); $ rge = bp: //; $ irreg = {gee;} e! e1 £ (ziB3l ($ 1Vy <1,0,7) - {$ · \ νοτά = ziBi1r ($ 1 Ог Og <1,7); $ pge = bp: //;} e1ze1 £ (zi3z1g ($ y / a2 <Д9) -, δδ “π: // *) {$ χνοτά = ziZi1g ($ ^ ogy, 9); $ pge = yrz: //; $ irreg = 'Chrie; } e1eI (si3i1i ($ \ woogs1,0,8) = ,, §δ “π: //) {$ \ νοτά = Ьi3i1i ($ ^ ai, 8); ргrеe = brzi: //;}.

βίββΐί (биЬ81г($луогй,0,7) = “§“^/*) { $·ννοπ! = зиЪз1г($ч¥оп1,7); $рге = Йр://; $иррег ~ 1гие;} е1зе1£ (βιΛβίτφινοπΙ,Ο,ό) = {$\νοΓά = зиЪз1г($угог<1,б); $рге = Др://;} е1зе1Е (зиЬз1г($\Уог<1,0,1) — *) { $у/огй = зиЬзГДЗ'Л'огсЦ); $иррег = ΐπιβ; } } сюсхх ^ψυ<κ>&ιαιΐ£--{ $1ап§ = Э'арапезе;βίββΐί (bb81g ($ lougy, 0.7) = “§“ ^ / *) {$ · ννοπ! = siZi1r ($ h ¥ op1.7); $ rge = yr: //; $ irreg ~ 1;;} e1ze1 £ (βιΛβίτφινοπΙ, Ο, ό) = {$ \ νοΓά = ЗиБз1г ($ unloading <1, b); $ pg = Dp: //;} e1ze1E (ziBz1r ($ \ yz <1,0,1) - *) {$ y / ogy = ziBzGZZ'L'ogsz); $ irreg = ΐπιβ; }} sysxxx ^ ψυ <κ> & ιαιΐ £ - {$ 1ap§ = E'arapese;

$о1ап§ = епдНзк;$ o1ap§ = epdk;

} екеУ ($Ьазе1апд = сЪтезезпп) {} ekeU ($ base1apd = cb); {

$1апд = сЬтезезпп;$ 1apd = cbt;

$о1ап§ = епдИзк;$ o1ap§ = epdk;

} $5 = 0;} $ 5 = 0;

$1етргер1асе = 8ίτίο1σννβΓ($\νθΓά);$ 1eterger1ase = 8ίτίο1σννβΓ ($ \ νθΓά);

- 40 007776 ν/ΗϊΙβ ($5 < зД1еп($!етргер1асе)) { ΐ£ (!еге§([.. .-£а-гА-20-9\У'],$!етргер1асе[$8])) {- 40 007776 ν / ΗϊΙβ ($ 5 <Д 1 еп еп ($! Рг рг 1 1))))) {ΐ £ (! Е е § [. [/ .. г-----]]]],,, $! Ет рг [[[[$ 8])) {

$1етргер1асе = 8иЪзД_гер1асе($1етргер1асе, $!етргер1асе[$з] ,$8,1);$ 1trger1ase = 8 & 3trg1ase ($ 1trger1ase, $! Etger1ase [$ 3], $ 8.1);

$5 = $8 + 2;$ 5 = $ 8 + 2;

} $з++;} $ s ++;

} $1етргер1асе = егед1_гер1асе([[:зрасе:]]+, ,$1етргер1асе);} $ 1eterger1ase = eger1_ger1ase ([[:: []:]] +,, $ 1erger1ase);

$зрасеаббгез8 = ехр1обе( ,$1етргер1асе);$ zraseabbgez8 = exp1obe (, $ 1erger1ase);

(Г- _ ЛФ» — и, Ш15е1($8расе);(Г- _ ЛФ »- и, Ш15е1 ($ 8rase);

$со1ог = геб;$ co1og = geb;

$соип!з = соип1($8расеаббгезз);$ soip! s = soip1 ($ 8)

$циегу = зеке! $1ап§,$о1ап§ Дот $б1сйопагу_1 ν/йеге $1ап§ = '$1етргер1асе'; $гезик = МУЗрЬ(т1тЬи8Й,$циегу) ог б1е(сапЧ еггог #0.1 - 'Хциегу¹ . МУЗБЩЕКЙОКО);$ qiegu = zeke! $ 1ap§, $ o1ap§ Dot $ b1syopagu_1 ν / yeg $ 1ap§ = '$ 1peter1ase'; $ hezik = MUZR (t1Ti8Y, $ tsiegu) og b1e (sapch heggog # 0.1 - 'Hziegue ^1. MUSSHCHYOKO);

1£(МУ8рЬДЩМкОА8($ге8и11) > 0) {1 £ (МУ8рДЩМкОА8 ($ ге8и11)> 0) {

Из1(${$1ап§},${$о1ап@}) = М¥89Ь_РЕТСН_КОА($гези11);From1 ($ {$ 1ap§}, $ {$ o1ap @}) = M ¥ 89L_RETSN_COA ($ gezi11);

$врасе - $ {$о1апд};$ vrase - $ {$ o1apd};

$соип!з = 0;$ soip! s = 0;

} луйНе ($соип!з > $в) # ууогб Ьейуееп..} luyNe ($ soip! s> $ c) # wooogb

{ $5расеаббгез8[$8] = !пт($8расеаббге88[$з]);{$ 5raceabbgez8 [$ 8] =! Fri ($ 8thoseabbge88 [$ h]);

ΐ£ ($1а§8 = Дие) {ΐ £ ($ 1a§8 = Die) {

$ореп = <£оп1 со1ог=\$со1ог\>;$ open = <£ op1 co1og = \ $ co1og \>;

$с1озе = </£οηΐ>;$ c1ose = </ £ οηΐ>;

ί£ ($со1ог — геб) $со1ог = Ыие;ί £ ($ co1og - geb) $ co1og = b;

е!зе $со1ог = геб;e! e $ co1og = geb;

} ,Τ £« «А 7\Л’П» {}, Τ £ ““ A 7 \ L’P ”{

ип8е!($гез1оГаббгез8);ip8e! ($ gez1oGabbgez8);

£ог ($ΐ = $з; $ΐ < $соил1з; $ί++) $гез1о£аббгезз .= .ХзрасеаббгеззЩ]; $ге8!о£аббгезз = Дпп($ге8!о£аббге88);£ og ($ ΐ = $ s; $ ΐ <$ soi1z; $ ί ++) $ gez1o £ abbgez. =. Хraseеббгезз]]; $ ge8! o £ abbgezz = Dpp ($ ge8! o £ abbge88);

$циегу » 8е1ес! $1ап§,$о1ап§ Дот $б1сНопагу_! ν/йеге $1апд = '$гез1о£аббгез5'; $гези11 = М¥8рЬ(тпйЬиз11,$диегу) ог б1е(сапЧ еггог #0.2 - ^циегу¹. МУ8РЬ_ЕККОКО);$ ciegu »8е1ес! $ 1ap§, $ o1ap§ Dot $ b1s ν / е $ $ д ап г = $ ез ез ез о аб б г 5 5 5 '; $ gezi11 = M ¥ 8pb (mn6i11, $ diego) og b1e (sabch ergog # 0.2 - ^ tiegu ^1. MU8P_EKKOKO);

1£(М¥89Ь_КиМКОА8($гези11) = 1) {1 £ (M ¥ 89L_KiMCOA8 ($ gezi11) = 1) {

И81(${$1ап§},${$о1ап8}) = МУ8рЬ_ЕЕТСН_В.ОА($ге8иЙ);H81 ($ {$ 1ap§}, $ {$ o1ap8}) = MU8p_EETSN_V.OA ($ ge8iJ);

$зрасе .= .$ореп.${$о1апв}.$с1озе;$ zrase. =. $ orep. $ {$ o1app}. $ c1ose;

- 41 007776 $зрасе = 1пт($зрасе);- 41 007776 $ race = 1pt ($ race);

$соип15 =Ό;$ soip15 = Ό;

} е1зе {} e1ze {

$п = $з + 1;$ n = $ s + 1;

ипзе1($пехЬУ0гбта1сЬ);ipze1 ($ pehUU0gbta1cb);

ίί ($зрасеаббгезз[$п]) $пехк^огбта1ск = $1ап§ Нке '.51г_гер1асе(%,,$зрасеаббгезз[$з]). .зб_гер1асе(%,,$8расеаббгезз[$п]).%' ог; .ίί ($ zraseabbgesz [$ n]) $ pehk ^ ogbta1sk = $ 1ap§ nke '.51r_ger1ase (% ,, $ zraseabbgesz [$ z]). .zb_ger1ase (% ,, $ 8thеseabbgezz [$ n]).% 'og; .

$циегу = зе1ес! $1ап§,$о1ап£ Дот $б1сйопагу_1 λνΗετε $пехДуогбта!сЬ $1ап§ = '$5расеаббге58[$з]' апб $о1ап£ о огбегЪу $1апд безе, 1еп§б1($1ап§),$о1ап£ безе, 1еп£1Ь($о1ап§) безе;$ ciegu = ze1es! $ 1ap§, $ o1ap £ Dot $ b1siopagu_1 λνΗετε $ infant Duogbta! C $ 1ap§ = '$ 5raceabbge58 [$ s]' apb $ o1ap £ o ogbegu $ 1apd meringue, 1ep§b1 ($ 1ap§), $ o1ap £ meringue , Ln £ 1b ($ o1ap§) meringue;

$гезиИ = М¥8рЬ(пшмЪизЬ,$циегу) ог б1е(еап'1 епог #1 - 'Зциегу¹. МУ8РЬ_ЕККОКО);$ geziI = M ¥ 8pb (pnm3b, $ tzieu) og b1e (eap'1 epog # 1 - 'Ztziegu ^1. MU8P_EKKOKO);

ΪΓ ($та1сЬ = уез) ипзе1($та1ск);ΪΓ ($ ta1cb = uez) ipze1 ($ ta1sk);

ϊί ((МУ8рЬ_ЫиМЯО5¥8($ге5ик) > 0) && ($таДЬ != по)) {ϊί ((МУ8рЬЫЫМЯО5 ¥ 8 ($ ge5ik)> 0) && ($ here! = by)) {

$п = 0;$ n = 0;

$тах1тит = 0;$ tach1tit = 0;

$тахйпитг = 0;$ tachypitt = 0;

ипзе1($Дпа1з);ipze1 ($ dpa1z);

ипзе1($£та1зг);ipze1 ($ £ ta1zg);

хшзе1($1оп§е81о1апе); ипзе1($1оп§ез11ап§);xshze1 ($ 1op§e81o1ape); ipze1 ($ 1op§ez11ap§);

ννΗϊΙβ ($п < ΜΥ8ΡΕ_ΝυΜΚ0ν78($Γε3υ11))# && ($та1ск 1= уез)) {ννΗϊΙβ ($ n <ΜΥ8ΡΕ_ΝυΜΚ0ν78 ($ Γε3υ11)) # && ($ ta1sk 1 = uez)) {

Нз1($ {$1ап§} ,$ {$о1ап§})=М¥8рЬ_РЕТСН_КО\У($гези11);Hz1 ($ {$ 1ap§}, $ {$ o1ap§}) = M ¥ 8pb_RETSN_KO \ Y ($ gezi11);

$теап = ехр1обе( ,${$1ап§});$ teap = exp1obe (, $ {$ 1ap§});

Жозтеап = ехр1обе( ,${$о1ап£});Josteap = exp1obe (, $ {$ o1ap £});

$1о8 = сошй($ояпеап) -1;$ 1o8 = so ($ oyapeap) -1;

$6 = 0;$ 6 = 0;

ипзе1($та1с11);ipze1 ($ ta1s11);

χνΐύΐε ($з < соип!($теап)) {χνΐύΐε ($ s <soip! ($ teap)) {

ί£ (($зрасеаббгезз[$з+$д] = $теап[$д]) && ($та1сЬ 1= по)) $та1сЬ = уев;ί £ (($ zraseabbgezz [$ h $ + d] = $ TEAP [$ d]) && ($ 1 = ta1s)) = $ ta1s uev;

еке $та1сЬ = по;eke $ ta1cb = po;

$β++;$ β ++;

} ΐ£ ($та!сЬ == уез) {} ΐ £ ($ ta! cb == away) {

ίί (зД1еп($1оп§ез1о1ап§) < зД1еп(${$о1ап§})) $1оп§ез1о1ап§ = ${$о1апз); ίί (зД1еп($1оп£ез11ап£) < зД1еп(${$1ап£})) $1оп£езбап£ = ${$1ап£}; Ш1зе1(5оуег1ар);ίί (Д 1 еп оп ($ 1 § § 1 о ап §))) <Д 1 еп еп ($ {$ о ап §}})) $ оп § 1 1 о § § = = $ {$ 1 ап))); ίί (zD1ep ($ 1op £ e1111ap £) <zD1ep ($ {$ 1ap £})) $ 1op £ ezbap £ = $ {$ 1ap £}; Sh1ze1 (5oug1ar);

ипзе1($тах);ipze1 ($ max);

- 42 007776- 42 007776

Заггау=аггауО; $аггау-= оуег!ар($з,1 ,$ [$1апд] ,$1оз,$ {$о1ап§} ,$д,$б1скопагу_1,$1апд,$о1ап§,55расеаббге55,$1оп дез{о1апд);Zaggau = aggauO; $ agga- = ueeg! ar ($ s, 1, $ [$ 1apd], $ 1oz, $ {$ o1ap§}, $ d, $ b1scope_1, $ 1apd, $ o1ap§, 55seabbge55, $ 1op des {o1apd) ;

$тах = 5агтау[тах];$ tax = 5agtau [tax];

$1о1ащ» = $аггау['Чо1ап§];$ 1o1ash "= $ aggau ['Чо1ап§];

ϊί ($1о1ап§) Здаавок = йпе;ϊί ($ 1o1ap§) Sayings = ip;

νώΐβ ($аггау[оуег1ар] != Гаке && соипДЗзрасеаббгезз) > Зтах) {νώΐβ ($ гагага [[уегегег1]]!!!! = Gake && soipDZzraseabbgezz)> Ztah) {

Заггау = оуег1ар($аггау[8^п],$аггау[1пт],1пт($аггау[^птеап]),$аггау[1о5]_>Ь1т($аггау[о5теа п]),$&8б1сиопагу_к$1апд,$о1апд,$8расеаббге58,$1опде81о1апд);Zaggau = oueg1ar ($ array [8 ^n] $ array [1 Pet] 1 Pet ($ array ^[n TEAP]) $ array _[1o5]> 1t ($ array [o5tea n]) $ & 8b1siopagu_k $ 1apd, $ o1apd , $ 8raceabbge58, $ 1opde81o1apd);

ϊ£ (5аггау[оуег1ар] = ’Чгие) {ϊ £ (5aggau [oueg1ar] = ’Chgie) {

Зтах = $аггау[тах];Ztah = $ aggau [tah];

$1о1ап§ = $аггау[1о1апд];$ 1o1ap§ = $ aggau [1o1apd];

Ззуазок = ’Чгие;Zuazok = ’Chgie;

} }}}

ΐί ($тах > Зтахйпит && Зтах > 0) {ΐί ($ max> Ztahypit && Ztah> 0) {

Зтахппит = Зтах;Ztahppit = Ztah;

$£па1з = $1о1апд;$ £ pa1z = $ 1o1apd;

} ΐ£ ($\уазок != ίηιβ) {} ΐ £ ($ \ UAZ! = ίηιβ) {

ίΓ (81г1еп(${$1апд}) > Зтахппитг) {ίΓ (81g1ep ($ {$ 1ap})> Ztahppitg) {

Зтахппитг = з1г1е11(3{31ап§});Ztahppitg = z1g1e11 (3 {31ap§});

$§г = $К $£та1ет = $ {$о!ап§};$ §R = $ K $ £ ta1et = $ {$ o! Ap§};

} }}}

} $п++;} $ p ++;

} ίί (Зчгазок·*“ ’Чгие) {} ίί (Ззгазок · * “’ Чгие) {

$та1ск = ’Чгие;$ ta1sk = ’Chgie;

И (!&1г8|1($&1а18,$1оп§е51о1ап§) && Зтахпшпп <- (зиЪзР-соиЫС ,$1опде51о1ап2)+1)) {And (! & 1g8 | 1 ($ & 1a18, $ 1op§e51o1ap§) && Зтппппп - - (ЗиЗзР-соиЫС, $ 1пе51о1ап2) +1)) {

#ρηηί ϊί ($з = 0) Ззрасе - Ззрасе. $ореп. $1опдез1о1ап§. Зс1озе;# ρηηί ϊί ($ z = 0) Zrase - Zrase. $ yep. $ 1 despendo1ap§. 3c1ose;

еке Ззрасе = Ззрасе. . Зореп. $1оп£езГо1ап§. $с1озе;Eke Zraze = Zraze. . Zorep. $ 1op £ eGo1ap§. $ c1ose;

$з = $з + зиЪз1г_сошй(31опце811ап8, ) + 1;$ z = $ z + zi3z1g_so_ (31opts811ap8,) + 1;

- 43 007776 }- 43 007776}

е1зе {e1see {

ϊ£ ($8 = 0) Ззрасе = $5расе. Зореп. 5бпа1з . Зс1озе;ϊ £ ($ 8 = 0) Zrase = $ 5th race. Zorep. 5bpa1z. 3c1ose;

е1зе Ззрасе = Ззрасе. . Зореп. Зйпа1з. 5с1озе;e1ze Zraze = Zraze. . Zorep. Zypa1z. 5c1ose;

$8 = $з + Зтахппит;$ 8 = $ s + ztahppit;

} ипзеЦЗтахтит);} ipzezztahtit);

ипзеЦЗ'Уазок);IpzeTsZ'Uazok);

} είδβίί (Зйпа1зг) ### ΐβ5ίίη§ пе\у ώΐηβ, мгЫ Ьарреп8 νζΒεη а рагйа1 таек ν/аз /ла λ ΒΛΤνίηΐΙίΐηίΎ П ЛА лла+ 4*» +1ча вчг0Фа«*ч\} είδβίί (Зайп1зг) ### ΐβ5ίίη§ ne \ u ώΐηβ, mgЫ Larrep8 νζΒεη and ragya1 tayek ν / az / la λ ΒΛΤνίηΐΙίΐηίΎ LA LA + 4 * "+ 1h hhr0Fa" * h \

Аииии, α> оиш^иишц, иш α ю υνι ш шу {Aiiii, α> oish ^ ishts, ish α u υνι ш шу {

ϊί ($8 = 0) Ззрасе = Ззрасе. Зореп. $йпа1зг. Зс1озе;ϊί ($ 8 = 0) Zrase. Zorep. $ ipa1zg. 3c1ose;

е15е Ззрасе = Ззрасе. . Зореп. Зйпа1зг. 5с1озе;e15e Zrase = Zrase. . Zorep. Zypa1zg. 5c1ose;

Зз = $8 + Зет ип8е1(3тахппитг);Зз = $ 8 + Зет ип8е1 (3ahtpppp);

} е1зе # 8Й11Ϊ81ез£ рЬазе.} e1ze # 8Y11-81ez £ pbase.

{ ϊ£ (еге£([а-гА-г.. .-£],3зрасеа(1с1ге88[55])) Ззрасе = Ззрасе . . Зореп . сопуег1(8иЬ51г($8расеа(1с1гезз[5з],0,1),5Ьа8е1ап8). 5с1озе;{ϊ £ (е е £ (([a-gA-g .. .- £], 3pracea (1c1ge88 [55])) Zrase = Zrase. Zorep. ), 5La8e1ap8). 5c1ose;

е1зе Ззрасе = Ззрасе. Зореп. сопуег1(5иЬз!г(Ззрасеас1с1гез8[58],0,1)₎8Ьазе1ап8). $с1озе;e1ze Zraze = Zraze. Zorep. cofig1 (5b3b! r (Zcraceac1c1c8e [58], 0.1) ₎ 8cbc1c8). $ c1ose;

3зрасеас1<1ге88[35] = 8иЪзСг(38расеа<1(1ге8з[38],1);3racease1 <1gr88 [35] = 8b3Cr (38racea <1 (1gr8z [38], 1);

1£(!$8расеа(1(1ге8з[$з] || 3зрасеа<1<1гез8[35] — 0) Зз++; ипзе1(5та1сЬ);1 £ (! $ 8cea (1 (1e8e [$ 3] || 3eracea <1 <1e8 [35] - 0) 3a + +;

} }}}

е1зе {e1see {

ΐ£ (βτβ8([3-ζΑ-Ζ.. ЗзрасеадйгеззСЗз])) Ззрасе = Ззрасе. . Зореп. сопуег1(8иЬз11($8расеад(1ге88[58]_>0,1)_>5Ьа8е1ап§). $с1озе;ΐ £ (βτβ8 ([3-ζΑ-Ζ .. ZrasedeygezzzZZz])) Zrase = Zrase. . Zorep. cone1 (8 & b3e11 ($ 8sead (1ke88 [58] _> 0.1) _> 5ba8e1apg). $ c1ose;

е!зе Ззрасе = Ззрасе. Зореп. сопует£(8иЪз£г($5расеас1с1ге88[Зз],0,1),5Ьа5е1апд)e! ze Zrase = Zrase. Zorep. adheres to £ (8 & b3 £ r ($ 5pacac1c1cr88 [3c], 0.1), 5bc5c1cd)

А·BUT·

Ззрасеайбгеззфз] = зиЪз1г($8расеа<1(1ге88[$з],1);ZraSeibGezzFz] = ziBi1i ($ 8raea <1 (1r88 [$ z], 1);

1£(!$зрасеад<1ге88[58] || ЗзрасеайскеззСЗз] = 0) Зз++; ипзе!(8та!сЬ);1 £ (! $ Zrasead <1ge88 [58] || ЗзрасайайскеззЗЗз] = 0) Зз ++; Ipe! (8th! Cb);

}}

И (’Ззрасеайбгезз^з] || 5зрасеайдге88[$з]« О) $з++;And (’Zraseaybgesz ^ z] || 5 zraseidege88 [$ s]“ O) $ s ++;

) })}

е1зе {e1see {

ί£(βτββ([8-ζΑ-Ζ.$зрасеай<1ге88[$8])) {Ззрасе = Ззрасе. . Зореп. сопуег1(8иЪз£г($8расеа<1<1ге88[Зз]_>0,1)₎ЗЬазе1ап8). 5с1озе; рпп! }ί £ (βτββ ([8-ζΑ-Ζ. $ zraseai <1ge88 [$ 8])) {Zrase = Zrase. . Zorep. cofee1 (8 & b3 e g ($ 8cmea <1 <1e88 [3c] _> 0.1) ₎ 5c1ose; rpp! }

- 44 007776 βίδβΐί (ετβ§([3-ζΑ-Ζ.. .-£],$зрасеа(1<1гезз[($з-1)])) $драсе = $зрасе. . $ореп. сопуег1(зиЬз1г(55расеа<1агез8[$з],0,1),$Ьазе1ап_ё). $с1озе;- 44 007776 βίδβΐί (ετβ§ ([3-ζΑ-Ζ .. .- £], $ zraea (1 <1des [[$ s-1)])) $ drace = $ sra.. $ Orep. (55rasea <1agez8 [$ t], 0.1), $ aze1ap _g) $ s1oze.;

е1зе $зрасе = $зрасе . $ореп. сопуег4(8иЬзк($5расеааагезз[$8],0,1),$Ьазе1апё). $с1озе;e1ze $ race = $ race. $ yep. copeg4 (8 & bzk ($ 5thaaaaaaaaaa [$ 8], 0,1), $ baaaaaaaa). $ c1ose;

$5расеас1с1гезз[$8] = зиЪзк($8расеаа<кез8[$з],1);$ 5racea1c1guzz [$ 8] = ziBzk ($ 8caeaa <kez8 [$ z], 1);

$з++;$ s ++;

ипзе1($та1сЬ);ipze1 ($ ta1cb);

} }# епй о£ ν/огй ЬеРуееп..}} # й о £ £ ν / / Ь е Р Р ее п .. ..

$иг1 .= $зрасе;$ ig1. = $ race;

ипзе1($1етр);ipze1 ($ 1 meter);

$сошй++; #ηβχΐ хуогй.$ sosh ++; # ηβχΐ huogy.

ί£ (5ΪΓ5ΐΓ($ν/ΟΓ0,”@)) {ί £ (5ΪΓ5ΐΓ ($ ν / ΟΓ0, ”@)) {

$Γβνϊά = ЬеЬгеу($1<1_1);$ Γβνϊά = b e ге eу ($ 1 <1_1);

ίί (зкзк($иг1,.)) $иг1 = еге2_гер1асе(([а-гА-гО-9/-/_/ ])@(|>-ζΑ-Ζ0-9/-/_/ ]*)([/,]), \\1.\\2@тЬеЪгету.сод1\\3,5иг1);ίί (zkzk ($ ig1 ,.)) $ ig1 = ege2_ger1ase (([a-gA-gO-9 / - / _ /]) @ (|> -ζΑ-Ζ0-9 / - / _ /] *) ( [/,]), \\ 1. \\ 2@tЬёбетту.сод1 \\ 3,5иг1);

еке $иг1 = еге_ёргер1асе(([а-гА-гО-9/-/_/ ])@([η-ζΑ-Ζ0-9/-/_/ ]*)^и,\\1.\\2@1пЬеЪгелу.сол1_>$иг1);eke $ ig1 = ege _ery ger1ase (([[a-gA-gO-9 / - / _ /]) @ ([η-ζΑ-Ζ0-9 / - / _ /] *) ^and , \\ 1. \\ 2@1nLeGelu.Sol1 _> $ u1);

ипзе1($8у81ет8Йе);Ipze1 ($ 8y81et8Ye);

}}

1£(зкзк($\уогЛ@тЬеЬге\у.со.П)) {1 £ (zkzk ($ \ wGl @ tEbGe \ w.s.o.)) {

$Γβνϊά = ИеЪгеу($к1_1);$ Γβνϊά = е Ъ ге у у ($ k1_1);

$иг1 = егее_гер1асе(([. ..-£]).([/-/.. .-£/-/ ]*)@$етайепа,\\1@\\2$геУ1(1,$иг1);$ ig1 = eee_ger1ase (([[. ..- £]). ([/ - / .. .- £ / - /] *) @ $ etayepa, \\ 1 @ \\ 2 $ geU1 (1, $ ig1) ;

} ΐ£ ($зуз1етз11е — кие && !зк8к($\уога,@)) {} ΐ £ ($ зз1етз11е - кие &&! зк8к ($ \ уга, @)) {

ί£ ($епй) ге1ит 'Ъйр:// . зк_гер1асе( $епй) . .п±еЪге\УхолУшс1ех.Ька1?8иЪ= 8иЪзк($еп<1,1);ί £ ($ ep) ge1it 'bp: //. zk_ger1ase ($ ep). .n ± eLe \ CorollarySex.La1? 8uL = 8u3k ($ en <1,1);

е1зе гекип Икр:// . 8к_гер1асе( ”,,$иг1). лпкеЪгелу.со.П;e1ze gekip Ikr: //. 8k_ger1ase (”,, $ ig1). lpkeGelu.so.P;

} ί£ (еге§(1пЬеЬге^¥.сол1/([а-2А-20-9/-]*)/шдех.ЫтГ,$ууог(1) &&} ί ((е § Ь 1 ((Ь Ь ге ^ ^ с. sol1 / ([a-2A-20-9 / -] *) / shdeh.

! 8к8к($дуоп1,1пЬеЬге\у.со л1/затр1е/)) {! 8k8k ($ duop1,1nBeGe \ u.so l1 / zat1e /)) {

$епй = 5иЬзк($епа,1);$ epy = 5 & bk ($ epa, 1);

ДСзкзкфепа,”/)) {ДСзкзкфепа, ”/)) {

гйит еге§1_гер1асе([[:8расе:]]+, ,зк_гер1асе( -зк_гер1асе( @,@,($еп<1))));gyit ege§1_ger1ase ([[[: 8race:]] +,, Зк_гер1асе (-Зк_гер1асе (@, @, ($ en <1))));

} }}}

ге1ит еге§1_гер1асе([[:зрасе:]]+, ,8к_гер1асе( - зк_гер1асе( @,@,$иг1)));ge1g eeg§1_ger1ase ([[[:::]] +,, 8k_ger1ase (- zk_ger1ase (@, @, $ ig1)));

} } ?>}}?>

????

- 45 007776 >раска§е Βπιϊη;- 45 007776> statement Βπιϊη;

>>

>ппрог1₃ ауа.5ц1. *;> prog1 ₃ aua.5ts1. *;

>ίιηροΓί ]ауа.иН1. Уес1ог, >ϊιηροΓί )ауа.иН1.Назк1аЫе;> ίιηροΓί] aua.iH1. Weslaw,> ϊιηροΓί) aua.ni1.

>ппрог1 зауа.иШ.Мар;> prog1 zaua.iSh.Mar;

>ππροτί )ауа.и1й.Сотрага1ог;> ππροτί) aua.i1y.Sotragaog;

>1трог1 ]ауа.иШ.Аггауз;> 1trog1] aua.iSh.Aggauz;

>ппрог1 )ауа.иб1.81ппдТокеги2ег;> prog1) aua.ib1.81ppdTokegi2eg;

>>

>/** > * @аийюг№зсЬа1а > * @νβτδϊοη >*/ >риЬНс с1азз РЬгазеСо11ес1Веап { >> / **> * @ ийюгюгюг№№зсЬЬааа> * @ νβτδϊοη> * /> Ь Н с 1 аз аз з г г аз С С С С С С ес ап ап ап {{{>

> рпуа1е ϊηί тахКезиИз;> pnu1e ϊηί tahKeziiz;

> рпуа!е 8ίπη§ гедРйгазе1;> rpua! e 8ίπη§ hedRygase1;

> рйуа1е 8ίπη§ гецР11газе2;> йуауа1ίίίίίίηецηецηР11ец11аз2;

> рйуа1е 81ппд гедРйгазеЗ;> Riua1e 81ppd GedRegasEZ;

> рпуа1е 81йп§ гецРЬгазе4;> pnu1e 81yp§ gecPbgase4;

> рпуа!е ϊηί з1аг18е1Соип1;> rpua! e ϊηί s1ag18e1Soip1;

> рйуа!е ίη! епб8е!Соип1;> ryu! e ίη! epb8e! Soip1;

> ρπναΐβ ϊηί 51аг1МтЧ¥огб5;> ρπναΐβ ϊηί 51ag1MtCH ¥ ogb5;

> рпуа1е ϊηί епбМтЗУогбз;> rpu1e ϊηί epbMtZUogbz;

> рпуа1е Ъоо1еап 1зСоп1еп1Сгеа1еб = Гаке;> pnu1e boo1eap 1zSop1ep1Sgea1eb = Gake;

>>

> рпуа!е Уес1ог 51аг1РЬгз;> pnu! e Veslog 51ag1pbz;

> рпуа!е Уес1ог епбРЬгз;> rpua! e Ueslog epbrbs;

> ρπνβΐβ НазЫаЫе з1М1бРЫз = ηε\ν НазЫаЫе(Ю);> ρπνβΐβ CHARACTERISTICS s1M1bryz = ηε \ ν CHARACTERISTICS (10);

> рпуаГе НазЫаЫе епМлбРЫз = пе\у НазЫаЫе(Ю);> rPaGe nazyEe eMlbryz = ne \ y NazyEye (U);

> рпуа1е НазЫаЫе ιιηϊς8ΐΡ1ΐΓ8 = ηβιν НазЫаЫе(Ю);> пу 1 Наз Наз Ы Наз = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = = =;

> рпуа1е НазЫаЫе ишцЕпРЫз = пет/ НазЬ1аЪ1е(10);> пупу11 Наз Наз Наз Наз Наз Наз Наз Наз и и и и и и и иРЫРЫРЫ = = = = = = = pet / Naz / /Ь петее 10 (10);

>>

> рпуа1е Соппесйоп бЬСоппесйоп = пи11;> пу 1 Соп Соп Соп п п п б оп оп оп оп оп п = = = pi11;

>>

> /** Сгеа1ез ηβιν РЪгазеСоПесШеап > * апб пиНазНге Й'з ргорегНез ίο бе£аи1! уа1иез >*/ > риЬйс РЬгазеСо11ес1Веап0 { > тахКезиНз = 30;> / ** ге а ез ез η аз аз аз С С С С С С>>>>> * * * * * ап 1 1 б б б 1 1 1 1 1!! bailee> * /> billet bruceceo11eclBea0 {> maxxCeNe3 = 30;

>гсдРЬгазе1 => gcdbgase1 =

- 46 007776 > гечРйгазе2 = > гечРЬтазеЗ > гецРйгазе4 = > 81аг18е1Сошй = 4;- 46 007776> hechRygase2 => hechRygase3> hetRygase4 => 81ag18e1 Sochi = 4;

> епй8е1Сош11 = 4;> epy8e1Cosh11 = 4;

> 51аг1М1пАогЙ5 = 1;> 51ag1M1nAogY5 = 1;

> епйМтАогйз = 1;> epyMtAogyz = 1;

> йЬСоппесйоп = Вгаш.деЮВСоппесНопО; >) >> bSoppesyop = Vash.deyUVSoppesNopO; >)>

> риЬИс ίηΐ де1МахКезиИз θ { > геШш тахКезиНз;> Ь с ί ί ΐ ΐ ΐ 1 М М К К К з з θ>>> ге т т ах ез ез и;;;

>} >>}>

> риЬИс 8ΐτϊη§ 8еЩецРЬга8е1 0 { > ге1ит гецРЪга8е1;> bilobus 8thisnum 8echschrrb8e1 0 {> geelite hetrbr8e1;

>} >>}>

> риЪНс 8ΐπη§ §е1К.ечРЬга8е2 0 { > ге!ит гедРНгазе2;> ЪННΐΐΐΐηη § §ее11ечечечРЬЬ888ее 0 0 0 {{{{{>>>> ге ге!! гедедедедедедедедР22222;

>} >>}>

> риЬНс 8ίπη§ ееШеяРЪгазеЗ 0 { > гс1ит гэдРЬгазеЗ;> RiNs 8ίπη§ eeSheyaRgazeZ 0 {> gs1it gedRgazeZ;

>} >>}>

> риЬИс 8ΐπη§ §е1ЙэдРйгазе4 0 { > ге!ит гецРЬгазе4;> Ь И ΐ ΐ ΐ § е § § е 1 д 4 Р 4 4 4 4 0 0 {4;

>} >>}>

> риЫгс ίηΐ 8е181аг18е1Сошй О { > геШт &1аг(8е1Соип(;> Ы г с ί ΐ ΐ 8е181ΐ1818еСошеош О О О О {{

>} >>}>

> риЪНс ίηΐ §е1Епй8е1Сош110 { > гйит едй8е1Соип1;> ЪННί ίηΐ §е1Epy8e1Sosh110 {> gyit edy8e1Soip1;

>} >>}>

> риЪНс ίηΐ §е181айМтАогйз О { > ге1ит зкагИЛтАогйз;> Ъηΐ ΐηΐ §е181айМтАогйз О {> г1ит зкаГЛтАогйз;

>} >>}>

> риЪНс ίηΐ βεΐΕπάΜίπΑοτάδ 0 { > ге1ит епйМтАогйв;> RiNs ίηΐ βεΐΕπάΜίπΑοτάδ 0 {> ge1it epyMtAogyv;

>} >>}>

- 47 007776 > риЪНс 8ίπηβ[] §с1РйгазезО { > 8ίτίη§[] ап =~{гецРЬга5е1, гедРЬгаае2, геяРЪгазеЗ, гедРкгазе4}; >ге!игп ап;- 47 007776> ЪННίίίίηη []]] ]ссс11РРРРазООО {>>>>> >ίίίίίРί§§]]]]] ап ап = ~ ~ ~ ~ ~ ~ ~ гецРецРгагага55е,, гедедРЬгаа222, гея гедЪггЗЗ,, г гедедРк444}}; > ge! igp up;

>} >>}>

> риЬНс νοίά зеСМахКезиПз (ΐηί х) { > тахКеаиНа = х;> pbNs νοίά ССССахККезиППП (ΐηί x) {> max.

>} >>}>

> риЬНс νοίά 5β£Κ.βςΡ1ΐΓ88β1 (8ίτίη§ х) { >гецРЬгазе1 = х;> pbnc νοίά 5β £ ςΡ.βςΡ1ΐΓ88β1 (8ίτίη§ x) {> heptBlase1 = x;

> //8у81ет.оШ.рппип(Нету уа1ие-1 Ьетд зе!..);> //8u81et.oSh.rppip (No net-1-btd! ..);

>) >>)>

> риЪНс νοίά зе!К.еяРЬгазе2 (δίτίη® х) { > гедРЬгазе2 =х;> Ъ Н ίά ίά!!! K. ея Р Ь г 2 2 2 (х ί г ® ® х x) {> г ея Р аз аз 2 2 = x;

> //8уз1ет.ои1.рпп11п(Хету уа1ие-П Ьетд βει..);> //8uz1et.oi1.rpp11n(Hetu wa1ie-P bld βει ..);

>} >>}>

> риЪНс νοίά зе!КецРЬгазеЗ (81гт§ х) { > гедРЬгааеЗ = х;> ЪНН νν!!!!! !ецецРггазазЗЗЗ 81 81г 81гт 81 81 81 81 81 81 81 81 81г 81 х 81 х 81 81 81 81 81 81 81 81 81>>> >едедедедгагааз = = = x;

> //8уа1ет.ои1.ргтЙп(Ые«у уа1иеа-Ш Ьет§ ае1..);> //8ua1et.oi1.rhtnn («« «« «у § § § § § § .. .. .. .. ..);

>} >>}>

> риЪНс νοίά 8с£В.сцРИгазе4 (ЗШпд х) { > гедРЬгазе4 = х;> Ъ Н с ν ίά ίά с с с В. ц ц РИ РИ 4 4 4 ((З З п д д д х {{>> ед ед Р аз аз 4 4 4 4 4 = x;

> //8уа1ет.ои1.ргтНп(Ые\у уа1иеа-1У Ьетд зе!..);> //8ua1et.oi1.rgtnn (е у у у 1--ет д д!! ..);

>} >>}>

> риЪНс νοίά зе!81аг!8с1Сош11 (ΐηί х) { > з!аН8е1Соип1 = х;> ЪННс νίάίάίά!! !аг !агаг! 8ссссСошош1111 (ΐ (ΐηίί) {>!! аНН888оипип11 =;;

>} >>}>

> риЬНс νοίά βεΐΕηάδεΙΟοιιηΐ (ίηί х) { > εηάδείϋουηί = х;> ЬЬНс νοίά βεΐΕηάδεΙΟοιιηΐ (ίηί x) {> εηάδείϋουηί = x;

>} >>}>

> риЪНс νοίάεείδίβΓίΜίη'νν'ΟΓάΒ (ΐηί х) { > зШМтЮТяйз = х;> �� νοίάεείδίβΓίΜίη'νν'ΟΓάΒ (ΐηί х) {> с ШМтюТяйз = x;

>} >>}>

> риЬНс νοίά ββΐΕηάΜίηνΤοιάβ (ϊηΐ х) { > спНМт^Уогбз = х;> ЬЬНс νοίά ββΐΕηάΜίηνΤοιάβ (ϊηΐ x) {> cnnmt ^ Wogbz = x;

>} >>}>

> рпуа1е ΐηί §е1РйгазеИ(81лпд рЬг) {> pnu1e ΐηί §е1 РиггееИ (81лпд рБг) {

- 48 007776 >1Г(рЬг = пи11)рЬг = ;- 48 007776> 1r (pbr = pi11) pbr =;

>1гу { >1£(!(ркг = )) { > геШш ηενν Рйга8е(рйг).§е1Ш0;> 1 ^ {> 1 £ (! (Pkg =)) {>

>} е1зе геШт 0;>} e1see gest 0;

>} са1сЬ (Ехсерйоп е) { > 5уз1еп1.ои1.рпп11п(Ехсер11оп мгЬПе §ейш§ Ше рЪгазе ГО &от >Вгат.РЬгазе (РЬгазеСо11ес1Веап.§е1РЬгазе1с1): + е);>} ca1cb (Exseriop e) {> 5c1e1e1.o1.ppp11n (Exci11ci eGePeSeffe Sérgase GO & from> Brg.GeGe (PgaseCo11ec1Beap.Ge1PeGe1c1): + e);

> еггогз = ЕхсерНоп \уЫ1е деШпд Ше рЬгазе ГО &от >Вгат.РЪгазе (РЬгазеСоПесБВеап.^РйгазеМ): + е; >ге1ит 0;> г з = Е = сер сер = Н Н де де де де е ГО ГО ГО ГО ГО ГО ГО & от от>> В ат ат ((((((Р Р г е С С С ап ап ап ап))))))):: + e; > ge1it 0;

>} >} >>}>}>

> рпуа1е Мар.Еп1гу[] 80йВуУа1ие(НазЫаЫе Ы) { > ]ауа.иИ1.8е1 зе1 = Ё1.еп1гуБе1();> пу 1 Мар Мар Мар.... [[]]] 80 80 80 80 Наз Наз Наз Наз Наз Наз Наз Наз Наз Наз Наз Наз Наз Наз Наз>>>>>>> уа уа а .8 .8 .8 .8 .8 1 = = = = = = =.

> Мар.Еп1гу[] егйпез = (Мар.Еп1гу[])зе1.1оАггау(пе\у >Мар.Еп1гу[5е1.81геО]);> Mar. Ep1gu [] egipes = (Mar. Ep1gu []) e1.1oAggau (ne \ y> Mar. Ep1gu [5e1.81geO]);

> Атгауз.зогфепЫез, пе\у Сотрага1ог() { > риЬНс ϊηΐ сотраге(ОЪ]'ес1 о1, ОЪ]ес1 о2) { > О1уЪс1 оЪ)1 = ((Мар.Еп1гу)о1).2е1Уа1иеО;> Atgauz.zogfepyes, ne \ y Sotragaog () {> pbnc ϊηΐ on the side of the (O]] es1 o1, O]] es1 o2) {> O1ybc1 ob) 1 = ((Mar. Epnu) o1) .2e1Ua1ieO;

> ОЪ]ес1 о1ц2 = ((Мар.Еп1гу)о2).§е1Уа1иеО;> О1] es1 o1c2 = ((Mar. Ep1yu) o2) .§е1Уа1еО;

> ге!ит ((СотрагаЪ1е)оЬ]2).сотрагеТо(оЪ; 1);> he! um ((Sotraga1e) b] 2).

>} >});>}>});

> ге1ит епЫез;> hellit

>} >>}>

> риЬИс δΐτίης де1АззосВу1о1пз0 { > 1о§Мз§ = > еггогз = > Ргераге(181а1етеп1 р281т1, ρΐδϋπί;> Ь И с ΐ ΐ ί ί ос ς з 1 1 1 {ос ос 1 1 {{{>>> о § з з>>> 18 ге ге ге 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18 18

> К.ези118е1 р2К.ези11 = пи11, р1В.ези11 = пи11;> K. ezi118e1 p2K. Ezi11 = pi11, p1B. Ezi11 = pi11;

> з1М1с1РЬг8.с1еагО;> S1M1c1Pb8. c1eagO;

> епМк!Ркгз.с1еагО;> epMk! Rkgz.s1eagO;

> итц81РЬг8.с1еагО;> itz81Pbr8. s1eagO;

> итяЕпРЬгз.скагО;> ityaEpRgz.skagO;

> 81пп§Ви£Сег гези1181г = ηβιν δίπηβΒιιίϊβΓζ);> 81pp§Vi £ Sez gezi1181g = ηβιν δίπηβΒιιίϊβΓζ);

> δΐτίηβ ге1аЯуеК.ези11 = > зГаг1РЬг8 = пемг Уес1ог(з1аг18е1Сошй);> δΐτίηβ 1 Я Я Я е и 11 = 11 = = => Г аг аг 1 Ь г г = = pemg г 1 1 ог ог ((аг 18 18 е ош ош));

> епйРЬгз = печу Уес1ог(епс18е1Соип1);> epBr3 = oven Ueslog (enes18e1Coip1);

>>

> Соппесйоп бЬСоппесйоп = пи11;> Sopesyop bSoppesyop = pi11;

>>

> ΐηί ρϊά = 0;> ΐηί ρϊά = 0;

> δΐτϊηβΟ рЪгазез = аеФЬгазезО;> δΐτϊηβΟ pgasez = aeFbasezO;

- 49 007776 > 8ΐιϊη§ шргу = >ίοτ(ΐη1ΐ = 0;·ί); .- 49 007776> 8ΐιϊη§ srgu => ίοτ (ΐη1ΐ = 0; · ί); .

> ге8и1131г.аррепб( + ϊ + );> ge8i1131g.arrepb (+ ϊ +);

> гези1181г.аррепб( + ρίσηΐ + );> gezi1181 g.reprep (+ ρίσηΐ +);

> 8ίπη§ Ιβπιρδί = р1Рг;> 8ίπη§ Ιβπιρδί = р1Рг;

> ϊ£ζ(δί = з1аг(МтАог<1з)){ > ιηΐ ρΐΐά == §еТРЬгазе1б(р1Рг);> ϊ £ ζ (δί = s1ag (MtAog <1z)) {> ιηΐ ρΐΐά == § е Р аз аз аз 1 1 1 (p1Pr);

> ϊί(ρ1ϊά != 0) { > 81агЛ11гз.абсШ1етеп1(+р11с1);> ϊί (ρ1ϊά! = 0) {> 81agL11gz.absSh1etep1 (+ p11s1);

>8ί++;> 8ί ++;

> гезиИ81г.аррепб( +ρ1Ρτ >+ );> Gezi81g.arrepb (+ ρ1Ρτ> +);

>} > } е1зе { > гези1181г.арреп(1( + р1Рг + );>}>} e1ze {> gesi1181g. arrep (1 (+ p1Pr +);

>} > гезиИЗ&.аррепбС + (81пп8)з1М1бР11Г8.де1(р1Рг) + > гезиК8(г.арреш1(” ”);>}> heziZ & .arrepbS + (81pp8) s1M1bR11G8.de1 (p1Pg) +> heziK8 (g.arresh1 ("”);

> гези1181г.аррепб( + (8£гт§)епМ1<1РЬгз.§е1(р2Рг) + >”);> Gezi1181g. arrebp (+ (8 £ rt§) enM1 <1Pbzi§e1 (p2Pr) +> ”);

>>

> 8ίπη§ 1етрЕп = р2Рг;> 8ίπη§ 1eterEn = p2Pr;

> 1£((еп = епбМтАогбз)) { > ίηί ρ2ϊά == 8е1РЬгазе1<1(р2Рг);> 1 £ ((en = enbMtAogbz)) {> ίηί ρ2ϊά = 8e1Pbase1 <1 (p2Pr);

> ϊί(ρ2ϊά != 0) { > епбРЬгз,а<1бЕ1етеп1(+р21б);> ϊί (ρ2ϊά! = 0) {> б б г Ь г з, and <1bE1etep1 (+ p21b);

> еп++;> ep ++;

> гези1Й£г.аррепб( + р2Рг >+);> Gez1Y £ Arrepb (+ p2Pr> +);

>г ' л >} е1зе { > гезик81г.аррепб( + р2Рг + );> r 'l>} e1ze {> hezik81g.arrepb (+ p2Pr +);

>} > гезик8ь-.аррепб( * + р2сп1+ );>}> hezik8b-.arrepb (* + p2sp1 +);

> гези1181г.аррепб(п);> gezi1181g.arrepb (p);

>ί++;> ί ++;

>} >т++;>}> t ++;

>} >>}>

>ϊί<ϊ> 1) { > сгеа1еАззхдпе(1ВтО;> ϊί <ϊ> 1) {> sgea1eAzskhdpe (1WO;

> стеа1еЦа1аВт(з1Еп1пе8, епЕпЫез, зЛИбРЬгз, елМкИиз);> sta1eTsa1aW (s1e1n1e8, eniLe, zlibrz, elMkIiz);

> 1зСоп(еп1Сгеа1еб = Га1зе;> 1sCop (en1Crea1eb = Ga1ze;

>}>}

- 50 007776 >/**/ > } са1сЬ(Ехсерйоп е) { > гезиИ81г.арреп<1( Ехсерйоп τνΐιίΐβ τβΐπβνΐη^ Ле гезиНз >(РйгазеСо11ес1Веап.§е(АззосВуГо1пз): + е + . СЬеск Ле 1о§ Гог еггогз);- 50 007776> / ** />} ca1cb (Exseriop e) {> geziu81g.arrep <1 (Exseriopi ΐ ΐ ίΐ>>> ((г аз е С 11 ес ес ес ап) ((Ле 1 1 + 1 + + ;

> //8уз1еш.ои1.ргшЙп(Ехсерйоп λνΐύΐβ геЬпеут§ Ле гезиНз >(РйгазеСо11ес1Веап.де1Аз80сВу1о1П8)+ е);> //8uz1esh.oi1.rgJn (Exeriop λνΐύΐβ ге пе ут ут § § г г>>>>> (RygaseSo11es1Beap.de1Az80sVu1o1P8) + e);

> еггогз += Ехсербоп уЛПе Γβΐπβνίηβ Ле гезиКз >(РйгазеСо11ес1Веап.де1Аз5осВу1ошз)+ е;> оггогогз + + = сссербербоп у у ЛП Γβΐπβνίηβ г Ле г г>>>>> (RigaseCo11ec1Beap.de1Az5ocBu1occ) + e;

> е.рпп181аскТгасе();> e.rpp181askTgase ();

>} > ге1ит гезиИЗДАоЗЛтдО ί >ί >>}> ge1it gesiISDAAOZLtdO ί> ί>

> риЬНс 8ίπη§ де1Ке1аЙУез(т1 тахЗЪочу) { > еггогз = >1о§Мз§ = ;> Ь Н ί ί § η η § де 1 К т 1 ез ез ез ((1 1 ах З оч у у {) {> г ог з = => 1 § § з § § =;

> 81лп§ 5ΐΓ1 = 3ΐτ2 = зДЗ = > Ргерагеб81а1етеп1 р1Ке18Л>1 = пи11;> 81lp§ 5ΐΓ1 = 3ΐτ2 = zDZ => Rgerageb81a1etep1 p1Ke18L> 1 = pi11;

> ίηΐ пеу/Зсоге = 0;> ίηΐ peu / Ssoge = 0;

> НазЬлЫе 1пйцМ1бРйгз = пе\¥ НазЫаЫеО;> REAL 1pcM1bRiggs = ne \ ¥ NazYaEeO;

> НазЫаЫе рЬгПбз ^β пеу/ НазЫаЫеО;> CHAIN RbPbz ^β peu / CHARACTER;

> НазкСаЫе рЬг21<18 » πβνν НазЫаЫеО;> NazKePb21 <18 »πβνν NazKaEeO;

> ЗЫпдВиДег ге1Кези118Д = ηβιν > ЗЫпдВийегС’Соттоп РЬгазез Ьт зихгопбшд ге1абуе1у соттоп ιηίάάΐβ рЬгазе > 8. ΝΟΤοΛΙ ЗсогерЬгазе 2);> OpenGuideGe1Kezi118D = ηβιν> OpenGuideS ’Sottop Rgasez т zihgopbshd ge1abue1u sottop ιηίάάΐβ Ьgase> 8. ΝΟΤοΛΙ ЗсогерГгазе 2);

>ίηί зло = 1;> ίηί evil = 1;

>>

>1гу { > 1Г(бЬСоппес11оп ««» пиП) { > //8уз1ет.ои1.рппЛ1(’Т>В Согт Ϊ8 Νιιΐΐ ϊη де(К.е1аЙуез!'');> 1gu {> 1G (bSoppes11op "" "piP) {> //8uz1et.oi1.rppL1(’Т>В Согт Ϊ8 Νιιΐΐ ϊη де (К.е1аУюез! '');

> бЪСоппесйоп = Вгат.деЮВСоппесйопО;> bSoppesyop = Vgat.deyuVSoppesyopO;

>} > } са1сЬ(Ехсерйоп е) { > //8уз1ет.ои1.рппЛ1(Ехсер1юп у/ВДе дейшд соппесЕоп Дот >Вгат: + е);>}>} sa1cb (Exseriop e) {> //8uz1et.oi.rppL1 (Exser1yup y / Vdedeysd sopeseop Dot> Vgat: + e);

>} >>}>

> й((з1аг1РЪг8 = пи11) || (э1аг1Р11Г8.8ЙеО = 0) || (епбРЬгз — >пи11) || (βηάΡΗτβ.είζβΟ = 0)) геГит ге!К.е8и118Д.1о81ппдО;> u ((s1ag1Pbg8 = pi11) || (e1ag1P11G8.8YeO = 0) || (ebpBbz -> pi11) || (βηάΡΗτβ.είζβΟ = 0))

> 8ΐπη§ 51аг1Сопб = > Гог (ϊηί ΐ = 0; ΐ + зпо + );> 8ΐπη§ 51ag1Sopb => Gog (ϊηί ΐ = 0; ΐ + Зпо +);

> 8ΐπη§ УЙпЦате = ηβνπνΐη + т;> 8ΐπη§ Й§ЦЦЦ = ηβνπν =η + т;

> ге1Ве8и118Д.аррепс1('Ч рЪгЗсоге + + рйгКеу + );> ge1Be8i118D.arreps1 ('H rbgZsoge + + rrgKeu +);

> зпо-Н-;> zpo-n-;

>} >//8уз1 еп!.ои{.ρπιιΐ1η(”Ι8 СопГепГ Сгеа1еб?? : +>}> // 8v1 en!! And {.ρπιιΐ1η (”Ι8 СпГепГ Сеа1еb ??: +

- 51 007776 >15Соп!еп!Сгеа!еб);- 51 007776> 15Sop! Ep! Sgea! Eb);

> ΐί( (! 1зСоп!егйСгеакеб) && (тахЗЬсж != 50) && (зло > 1)) { > сгеа!еСоп1еп1Вт(еп!пе8);> ΐί ((! 1cSoop! eGeSgeakeb) && (тахЗЬсж! = 50) && (evil> 1)) {> srea! eSop1ep1vt (en! ne8);

>} >} са1сЬ(Ехсер!1оп е) { > //8уз!ет.ои1.рпп11п(Ехсерйоп у/Ы1е ехесийп§ чиегу: + е);>}>} sa1cb (Exser! 1op e) {> //8uz!et.oi.rpp11n (Exseriop y / b1e exesialpiguet: + e);

>) > ге1ит ге1Кези118й.1о81ппёО ⁺ >} >>)> ge1it ge1Kesi118y.1o81ppёO ⁺ >}>

> ρπνβίβ νοίά сгеа1еАз81§пебВт0 { > ϊί(! азз1§пебНазЬлзЕтр1уО) аз51§пе<1На8Ь.с1еаг0;> ρπνβίβ νοίά сеа1еАз81§пебВ0 {> ϊί (! азз1§бeнзлзETр1уО) аз51§пе <1На8Ь.с1еаг0;

> а85А8пебНаа!1.р\1!(тахВ.ез, пет/ Ьке§ег(тахК.езиН8)У, > 8(ппд рЬгазеЗД = > 8ίπη§[] аггау = де1Рйга8е5();> a85A8pebNaa! 1. p \ 1!

> £οτ(ΐηί ί = 0; ϊ> £ οτ (ΐηί ί = 0; ϊ

Claims

CLAIM

1. A method for associating words in a language, comprising the steps of creating a fund of documents, said fund comprising at least one document; choose the first word or phrase and the second word or phrase;

find many occurrences of the first word or phrase and the second word or phrase in said fund;

specify in the said fund the first intervals and second intervals, while the first intervals contain the first word or phrase, and the second intervals contain the second word or phrase;

searching for said first intervals and second intervals for common words or phrases, wherein said common words or phrases appear in a plurality of intervals; and associate the first word or phrase and the second word or phrase with common words or phrases based on the frequency of occurrence of common words or phrases within, respectively, the first intervals and second intervals.

2. The method according to claim 1, in which the said association of the first word or phrase and the second word or phrase is improved by a higher frequency of occurrence of common words or phrases.

3. The method according to claim 1, wherein said association of the first word or phrase and the second word or phrase is improved by a lower frequency of occurrence of common words or phrases.

4. The method according to claim 1, further comprising the step that the first word and / or phrase is replaced with a substantially semantically equivalent word or phrase.

5. A method of associating words in a language, comprising the steps of creating a fund of documents, said fund comprising at least one document; choose the first word or phrase and the second word or phrase;

find all documents containing a plurality of occurrences of the first word or phrase within a predetermined proximity interval of the second word and / or phrase, wherein said predetermined proximity interval is bounded by an upper limit and a lower limit;

set the interval in the documents found, while this interval contains the first word or phrase and the second word or phrase;

search for said intervals for common words or phrases; and associating the first word or phrase and the second word or phrase with common words or phrases based on the frequency of occurrence of common words or phrases within the above-mentioned intervals.

6. The method according to claim 5, in which said association of the first word or phrase and the second word or phrase is improved by a higher frequency of occurrence of common words or phrases.

7. The method according to claim 5, in which said association of the first word or phrase and the second word or phrase is improved by lowering the frequency of occurrence of common words or phrases.

8. The method of claim 5, wherein said upper and said lower limit of said predetermined proximity interval are equal.

9. A method of creating an associative database in one language, containing the stages at which

- 52 007776 create a fund of documents, while said fund contains at least one document; choose the first word or phrase;

find many occurrences of the first word or phrase;

specify intervals in said fund, wherein said intervals occur depending on each of the plurality of occurrences of the first word or phrase;

searching for said intervals in relation to common words or phrases, wherein said common words or phrases appear in a plurality of intervals; and associating the first word or phrase with common words or phrases based on the frequency of occurrence of common words or phrases within the above-mentioned intervals.

INTERCONNECTIVE DATABASE one 2 3 4 Segments Segments Direct Frequencies after system A systems B ranked by frequency after subtraction frequencies subtraction 0a1 OY + OZ + O4 25 25 0a1 O9 + OYO nineteen nineteen Oa1 ϋΜ 35 10 Oa1 OY + OZ thirty 5 Oa2 0b2 + 0b6 twenty twenty Oa2 ϋΜ2 fifteen fifteen 0a2 0b2 25 5 OaZ + OaD b5 + b7 fifteen fifteen OaZ + Oa4 B5 25 10