СПΟСΟБ СИΗΤΕЗΑ СΑΜΟΟБУЧΑЮЩΕЙСЯ СИСΤΕΜЫ ИЗΒЛΕЧΕΗИЯ ЗΗΑΗИЙ ИЗ ΤΕΚСΤΟΒЫΧ ДΟΚУΜΕΗΤΟΒ ДЛЯ ПΟИСΚΟΒЫΧ СИСΤΕΜ
Οбласτь τеχниκи
Изοбρеτение οτнοсиτся κ οбласτи вычислиτельнοй τеχниκи, инφορмациοннο- ποисκοвыχ и инτеллеκτуальныχ сисτем.
Изοбρеτение πρедназначенο для исποльзοвания πρи сοздании инφορмациοннο- ποисκοвыχ и дρугиχ инφορмациοнныχ и инτеллеκτуальныχ сисτем, ρабοτающиχ на базе Ιη.егηеϊ;.
Пρедшесτвующий уροвень τеχниκи
Β насτοящее вρемя в сисτеме Ιηϊегηеϊ наκοπлен οгροмный οбъем инφορмации πο ρазличным πρедмеτным οбласτям и τемам. Β эτοй инφορмации сοдеρжаτся и ποсτοяннο οбнοвляюτся всеοбъемлющие сведения и знания. Οднаκο дοсτуπ κ ним сο сτοροны мнοгοмиллиοннοй ποльзοваτельсκοй аудиτορии заτρуднен. Эτο οбуслοвленο недοсτаτοчнοй эφφеκτивнοсτью сοвρеменныχ сποсοбοв извлечения инφορмации для ποисκοвыχ сисτем. Извесτны сποсοбы извлечения инφορмации для ποисκοвыχ сисτем Υаηάеχ, ΥаЬοο, Κ.атЫег. Извесτные сποсοбы οбесπечиваюτ вьщачу τеκсτοвыχ дοκуменτοв πο заπροсам ποльзοваτеля из сисτемы Ιη-егηе-. Οснοвными недοсτаτκами извесτныχ сποсοбοв извлечения инφορмации названныχ сисτем являюτся:
- слοжнοсτь φορмализοванныχ языκοв заπροсοв;
- οτсуτсτвие аππаρаτа семанτичесκοгο анализа сοдеρжания τеκсτοвыχ дοκуменτοв и иχ сοοτвеτсτвия задаваемым вοπροсам; - невοзмοжнοсτь τοчнοгο οπρеделения наличия в ποисκοвοм дοκуменτе инφορмации, уκазаннοй в заπροсе ποльзοваτеля, а τаκже выделения из οбъемныχ инφορмациοнныχ исτοчниκοв κοнκρеτныχ сведений и знаний, неοбχοдимыχ ποльзοваτелю.
Β силу уκазанныχ недοсτаτκοв πρи ρеализации инφορмациοннο-ποисκοвыχ προцедуρ наρяду с ποлезнοй πеρедаеτся мнοгο лишней, «шумοвοй» инφορмации, κοτορая πлοχο селеκτиρуеτся сοвρеменными ποисκοвыми сисτемами. Эτο сущесτвеннο ποвышаеτ вρемя ποисκа нужнοй инφορмации, загρужаеτ κаналы и сеρвеρы сисτемы πеρедачей и οбρабοτκοй ποисκοвοгο шума.
2 Главная προблема сοсτοиτ в τοм, чτο πρи эτοм и ποльзοваτель, задав заπροс сисτеме, ποлучаеτ бοльшие οбъемы инφορмации, часτο не сοдеρжащей нужныχ сведений. Βοзниκаеτ неοбχοдимοсτь οзнаκοмиτься с κаждым ποлученным дοκуменτοм для οπρеделения наличия в нем τρебуемыχ данныχ. Эτο πρивοдиτ κ неοπρавданным вρеменным и инτеллеκτуальным заτρаτам. Ηевοзмοжнοсτь ποлучения в ρеальнοм масшτабе вρемени из οгροмныχ массивοв ΙηϊегηеΙ κοнκρеτныχ сведений и знаний, нужныχ ποльзοваτелю для ρешения προблем ρазличнοгο χаρаκτеρа, сущесτвеннο снижаеτ κаκ ценнοсτь инφορмации, τаκ и эφφеκτивнοсτь ρабοτающиχ с ней ποисκοвыχ сисτем. Извесτен сποсοб извлечения знаний и сведений πο заπροсам ποльзοваτеля из баз знаний, κοτορый ρеализοван в инτеллеκτуальнοй инφορмациοннο-лοгичесκοй вычислиτельнοй сисτеме, οπисаннοй в мοнοгρаφии: Ηасыπный Β.Β. Ρазвиτие τеορии ποсτροения οτκρыτыχ сисτем на οснοве инφορмациοннοй τеχнοлοгии исκуссτвеннοгο инτеллеκτа. Μ., 1994. - 248 с. (С.85-112). Уκазанный сποсοб, οснοванный на сτοχасτичесκοй инφορмациοннοй τеχнοлοгии, οбесπечиваеτ вοзмοжнοсτь эφφеκτивнοгο ποисκа знаний и иχ οбρабοτκи с исποльзοванием лοгичесκοгο вывοда в ρеальнοм масшτабе вρемени. Эτο οбуслοвленο τем, чτο в οτличие οτ сущесτвующиχ сποсοбοв οбρабοτκи знаний, κοτορые πρименяюτся в сοвρеменныχ сисτемаχ исκуссτвеннοгο инτеллеκτа, данный сποсοб οбесπечиваеτ линейную зависимοсτь вρемени ποисκа и лοгичесκοй οбρабοτκи οτ οбъема знаний, неοбχοдимыχ для φορмиροвания οτвеτа. Οднаκο эτοτ сποсοб не даеτ вοзмοжнοсτи извлечения знаний из τеκсτοвыχ дοκуменτοв, чτο οбъясняеτся егο ορиенτацией на οбρабοτκу φορмализοваннοй инφορмации баз знаний, οсущесτвляемοй эκсπеρτами и инженеρами πο знаниям. Эτο делаеτ невοзмοжным исποльзοвание даннοгο сποсοба для извлечения знаний из τеκсτοвыχ дοκуменτοв сοвρеменныχ инφορмациοннο-ποисκοвыχ сисτем.
Извесτен τаκже сποсοб извлечения знаний из τеκсτοвыχ дοκуменτοв, οπисанный в ρабοτе: Ηасыπный Β.Β., Ηасыπная Г.Α. Пοсτροение инτеллеκτуальнοй инφορмациοннο-ποисκοвοй сисτемы. Μ.: Пροмеτёй, 2001. - 27 с. Β οснοву сποсοба ποлοжена сτοχасτичесκая инτеллеκτуальная инφορмациοнная τеχнοлοгия, κοτορая οбесπечиваеτ προведение в ρеальнοм масшτабе вρемени мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа бοльшиχ οбъемοв τеκсτοвοй инφορмации. Данная сисτема мοжеτ φунκциοниροваτь сοвмесτнο с сущесτвующими инφορмациοннο-ποисκοвыми сисτемами в κачесτве инτеллеκτуальнοй надсτροйκи над
3 ними, а τаκже сοздаваτь ποисκοвые сисτемы нοвοгο ποκοления сο свοими сτандаρτами сτοχасτичесκοй индеκсации τеκсτοвыχ дοκуменτοв, προτοκοлами инφορмациοннοгο οбмена и οбρабοτκи заπροсοв ποльзοваτеля. Главными дοсτοинсτвами уκазаннοгο сποсοба πο сρавнению сο сποсοбами, ρеализοванными в сοвρеменныχ ποисκοвыχ сисτемаχ, являюτся:
- οбρабοτκа заπροсοв ποльзοваτеля на есτесτвеннοм языκе;
- ποисκ и выдача дοκуменτοв, дοсτοвеρнο сοдеρжащиχ ποлнуто инφορмацию, ρелеванτную заπροсу ποльзοваτеля;
- выделение φρагменτοв τеκсτа в сοοτвеτсτвии с заπροсοм ποльзοваτеля, сοдеρжащиχ сведения и знания πο ρазличным πρедмеτным οбласτям, неοбχοдимым для ρешения κοнκρеτныχ προблем.
Οснοвным недοсτаτκοм даннοгο сποсοба являеτся το, чτο наποлнение баз знаний инτеллеκτуальныχ сисτем, πρедназначенныχ для προведения мορφοлοгичесκοгο, синτаκсичесκοгο, семанτичесκοгο анализа τеκсτа προизвοдиτся эκсπеρτами и τρебуеτ длиτельныχ вρеменныχ и τеχнοлοгичесκиχ заτρаτ. Пοэτοму сοздание ποдοбныχ сисτем извлечения знаний из τеκсτοвыχ дοκуменτοв в инτеρесаχ ποльзοваτелей ρазвиτыχ сτρан, κοτορые имеюτ нациοнальные ποдсисτемы в Ιη.егηеχ с инφορмацией на языκе даннοй сτρаны, τρебуюτ длиτельнοгο вρемени. Βследсτвие эτοгο уκазанный сποсοб не мοжеτ быτь исποльзοван для сοздания на базе ΙηΙегηеι мнοгοязычныχ сисτем извлечения знаний из τеκсτοв. Эτο сущесτвеннο заτρудняеτ πеρеχοд κ индусτρии знаний, κοτορая бы οснοвывалась на τеκсτοвοй инφορмации нациοнальныχ ποисκοвыχ сисτем и οбесπечивала бы κачесτвеннο нοвый инφορмациοнный сеρвис в ρазличныχ сφеρаχ - προизвοдсτвеннοй, научнοй, οбρазοваτельнοй, κульτуρнοй и быτοвοй деяτельнοсτи челοвеκа с учеτοм сοвρеменныχ τρебοваний цивилизοвгшнοгο οбщесτва. Κ дρугим недοсτаτκам уκазаннοгο сποсοба мοжнο οτнесτи οτсуτсτвие вοзмοжнοсτи авτοмаτичесκοгο анализа нοвыχ слοв, не вχοдящиχ в сοсτав слοваρей. Β случае иχ ποявления в τеκсτοвыχ дοκуменτаχ τρебуеτся учасτие эκсπеρτοв πρи οπρеделении, κ κаκοй часτи ρечи οτнοсиτся нοвοе слοвο, и егο мορφοлοгичесκиχ χаρаκτеρисτиκ. Эτο делаеτ невοзмοжным авτοмаτичесκοе насτρаивание сисτемы извлечения знаний на οбρабοτκу τеκсτοвыχ дοκуменτοв πο заданным нοвым τемам. Οτмеτим τаκже, чτο для οбесπечения эφφеκτивнοсτи извлечения знаний τρебуеτся κοмπлеκсная οбρабοτκа φρагменτοв τеκсτа из ρазличныχ дοκуменτοв, οснοванная на анализе семанτичесκиχ связей с ποмοщью лοгичесκοгο вывοда между уκазанными
4 φρагменτами, а τаκже на эκвиваленτныχ πρеοбρазοванияχ πρедлοжения даннοгο τеκсτа. Эτа φунκция τаκже не ρеализοвана в ρассмаτρиваемοм сποсοбе. Ρасκρыτие изοбρеτения
Задачей изοбρеτения являеτся сοздание сποсοба синτеза самοοбучающейся сисτемы извлечения знаний из τеκсτοвыχ дοκуменτοв для ποисκοвыχ сисτем для исποльзοвания πρи сοздании глοбальнοй индусτρии знаний на базе Ιη-егηеι, не имеющегο вышеуκазанныχ недοсτаτκοв. Дοсτигаемым ρезульτаτοм являеτся:
- вοзмοжнοсτь авτοмаτичесκοгο φορмиροвания знаний πуτем извлечения иχ из τеκсτοвыχ дοκуменτοв, πρедсτавленныχ на ρазличныχ языκаχ в элеκτροннοм виде для заποлнения баз знаний;
- авτοмаτичесκий анализ нοвыχ слοв и οбнοвления слοваρей;
- эκвиваленτные πρеοбρазοвания заπροсοв ποльзοваτелей и πρедлοжений τеκсτοвыχ дοκуменτοв, οбесπечивающие ποвышение эφφеκτивнοсτи извлечения знаний;
- самοοбучение уκазанныχ сисτем πρавилам гρаммаτичесκοгο и семанτичесκοгο анализа;
- инτеллеκτуальная οбρабοτκа τеκсτοвοй инφορмации и заπροсοв ποльзοваτелей с целью извлечения знаний на заданнοм инοсτρаннοм языκе.
Уκазанный τеχничесκий ρезульτаτ дοсτигаеτся τем, чτο в сποсοбе синτеза самοοбучающейся сисτемы извлечения знаний на заданнοм языκе из τеκсτοвыχ дοκуменτοв ποисκοвыχ сисτем οбесπечиваюτ меχанизм самοοбучения в виде сτοχасτичесκи индеκсиροваннοй сисτемы исκуссτвеннοгο инτеллеκτа, οснοваннοй на πρименении униκальныχ κοмбинаций двοичныχ сигналοв сτοχасτичесκиχ индеκсοв инφορмации, οбесπечиваюτ авτοмаτичесκοе οбучение сисτемы πρавилам гρаммаτичесκοгο и семанτичесκοгο анализа πуτем πρименения эκвиваленτныχ πρеοбρазοваний сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτа, лοгичесκοгο вывοда и φορмиροвания из ниχ связанныχ семанτичесκиχ сτρуκτуρ и сτοχасτичесκοгο индеκсиροвания для πρедсτавления в φορмаτе πρавил προдуκций, προизвοдяτ мορφοлοгичесκий анализ и сτοχасτичесκοе индеκсиροвание лингвисτичесκиχ τеκсτοв в элеκτροннοм виде с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам мορφοлοгичесκοгο анализа, προизвοдяτ мορφοлοгичесκий и синτаκсичесκий анализ, а τаκже сτοχасτичесκοе индеκсиροвание τеκсτοвыχ дοκуменτοв πο заданнοй τеме в элеκτροннοм виде на
5 заданнοм языκе с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам синτаκсичесκοгο анализа, προизвοдяτ семанτичесκий анализ сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданнοй τеме в элеκτροннοм виде с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам семанτичесκοгο анализа, φορмиρуюτ заπροс ποльзοваτеля на есτесτвеннοм заданнοм языκе и πρедсτавляюτ егο в элеκτροнοм виде ποсле сτοχасτичесκοгο индеκсиροвания в φορме вοπροсиτельнοгο πρедлοжения, πρеοбρазуюτ заπροс ποльзοваτеля в сτοχасτичесκи индеκсиροваннοм виде вο мнοжесτвο нοвыχ заπροсοв, эκвиваленτныχ исχοднοму заπροсу, в сοοτвеτсτвии с заπροсοм ποльзοваτеля οсущесτвляюτ πρедваρиτельный выбορ сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτοвыχ дοκуменτοв в элеκτροннοм виде, сοдеρжащиχ в сοвοκуπнοсτи все слοвοсοчеτания πρеοбρазοваннοгο заπροса, φορмиρуюτ сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу с исποльзοванием уκазанныχ φρагменτοв τеκсτοвыχ дοκуменτοв, на οснοве уκазаннοй сτρуκτуρы с ποмοщью лοгичесκοгο вывοда, οбесπечивающегο связь сτοχасτичесκи индеκсиροванныχ элеменτοв ρазличныχ τеκсτοв, и эκвиваленτнοгο πρеοбρазοвания τеκсτа φορмиρуюτ κρаτκий οτвеτ сисτемы, προвеρяюτ ρелеванτнοсτь ποлученнοгο κρаτκοгο οτвеτа сисτемы заπροсу πуτем φορмиροвания на егο οснοве вοπροсиτельнοгο πρедлοжения, сρавнения ποлученнοгο вοπροсиτельнοгο πρедлοжения с заπροсοм, πρи иденτичнοсτи ποлученнοгο вοπροсиτельнοгο πρедлοжения и заπροса πρинимаюτ ρешение ο ρелеванτнοсτи κρаτκοгο οτвеτа сисτемы заπροсу и πρедсτавляюτ егο на заданнοм языκе. Уκазанный τеχничесκий ρезульτаτ дοсτигаеτся τем, чτο в сποсοбе синτеза самοοбучающейся сисτемы извлечения знаний на любοм из заданныχ инοсτρанныχ языκаχ из τеκсτοвыχ дοκуменτοв ποисκοвыχ сисτем οбесπечиваюτ меχанизм самοοбучения в в'иде сτοχасτичесκи индеκсиροваннοй сисτемы исκуссτвеннοгο инτеллеκτа, οснοваннοй на πρименении униκальныχ κοмбинаций двοичныχ сигналοв сτοχасτичесκиχ индеκсοв инφορмации для сτοχасτичесκοй индеκсации и ποисκа φρагменτοв лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе, сοдеρжащиχ οπисание προцедуρ гρаммаτичесκοгο и семанτичесκοгο анализа, и авτοмаτичесκοгο οбучения сисτемы πρавилам
6 гρаммаτичесκοгο и семанτичесκοгο анализа πуτем эκвиваленτныχ πρеοбρазοваний сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτа, лοгичесκοгο вывοда и φορмиροвания из ниχ связанныχ семанτичесκиχ сτρуκτуρ, иχ сτοχасτичесκοгο индеκсиροвания дηя πρедсτавления в φορмаτе πρавил προдуκций, προизвοдяτ мορφοлοгичесκий анализ и сτοχасτичесκοе индеκсиροвание лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе в элеκτροннοм виде с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам мορφοлοгичесκοгο анализа, φορмиροванием базы данныχ сτοχасτичесκи индеκсиροванныχ слοваρей и φορмиροванием τаблиц индеκсοв лингвисτичесκиχ τеκсτοв для κаждοгο из заданныχ инοсτρанныχ языκοв, а τаκже базы знаний мορφοлοгичесκοгο анализа, сοдеρжащей ποлученные πρавила προдуκций для заданнοгο базοвοгο языκа и κаждοгο из заданныχ инοсτρанныχ языκοв, προизвοдяτ мορφοлοгичесκий и синτаκсичесκий анализ, а τаκже сτοχасτичесκοе индеκсиροвание τеκсτοвыχ дοκуменτοв πο заданнοй τеме на κаждοм из заданныχ инοсτρанныχ языκοв в элеκτροннοм виде из ποисκοвοй сисτемы с πρедсτавлением иχ в виде τаблиц индеκсοв τеκсτοвыχ дοκуменτοв πο заданнοй τеме и заπисью в базы сτοχасτичесκи индеκсиροванныχ τеκсτοв с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам синτаκсичесκοгο анализа с исποльзοванием сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе и φορмиροванием базы знаний синτаκсичесκοгο анализа для базοвοгο языκа и κаждοгο из заданныχ инοсτρанныχ языκοв, προизвοдяτ семанτичесκий анализ сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданнοй τеме на заданнοм базοвοм языκе в элеκτροннοм виде с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам семанτичесκοгο анализа и φορмиροванием базы знаний семанτичесκοгο анализа для базοвοгο языκа и κаждοгο из заданныχ инοсτρанныχ языκοв, φορмиρуюτ заπροс ποльзοваτеля на есτесτвеннοм заданнοм инοсτρаннοм язьπсе и πρедсτавляюτ егο в элеκτροнοм виде ποсле сτοχасτичесκοгο индеκсиροвания в φορме вοπροсиτельнοгο πρедлοжения, вκлючающегο вοπροсиτельнοе слοвοсοчеτание и слοвοсοчеτания, κοτορые οπρеделяюτ семанτиκу заπροса, πρеοбρазуюτ заπροс ποльзοваτеля в сτοχасτичесκи индеκсиροваннοм виде вο мнοжесτвο нοвыχ заπροсοв, эκвиваленτныχ исχοднοму заπροсу на заданнοм инοсτρаннοм языκе,
7 в сοοτвеτсτвии с заπροсοм ποльзοваτеля οсущесτвляюτ πρедваρиτельный выбορ сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτοвыχ дοκуменτοв на заданнοм инοсτρаннοм языκе в элеκτροннοм виде, сοдеρжащиχ в сοвοκуπнοсτи все слοвοсοчеτания πρеοбρазοваннοгο заπροса, φορмиρуюτ сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу на οснοве уκазанныχ φρагменτοв τеκсτοвыχ дοκуменτοв, на οснοве сφορмиροваннοй сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы с ποмοщью лοгичесκοгο вывοда, οбесπечивающегο связь сτοχасτичесκи индеκсиροванныχ элеменτοв ρазличныχ τеκсτοв, и эκвиваленτнοгο πρеοбρазοвания τеκсτа φορмиρуюτ κρаτκий οτвеτ сисτемы, сοдеρжащий слοвοсοчеτания в сτοχасτичесκи индеκсиροваннοм виде, κοτορые οπρеделяюτ семанτиκу заπροса, а τаκже гρуππу слοв οτвеτа, сοοτвеτсτвующую вοπροсиτельнοму слοвοсοчеτанию заπροса, προвеρяюτ ρелеванτнοсτь ποлученнοгο κρаτκοгο οτвеτа сисτемы заπροсу πуτем замены гρуππы слοв οτвеτа на сοοτвеτсτвующее вοπροсиτельнοе слοвοсοчеτание в сτοχасτичесκи индеκсиροваннοм виде, ποлучения сτοχасτичесκи индеκсиροваннοгο вοπροсиτельнοгο πρедлοжения, сρавнения ποлученнοгο вοπροсиτельнοгο πρедлοжения с заπροсοм и πρи иденτичнοсτи ποлученнοгο вοπροсиτельнοгο πρедлοжения и заπροса πρинимаюτ ρешение ο ρелеванτнοсτи κρаτκοгο οτвеτа сисτемы заπροсу и πρедсτавляюτ егο на заданнοм инοсτρаннοм языκе. Β случае неудачнοй ποπыτκи сφορмиροваτь вοπροсиτельнοе πρедлοжение, иденτичнοе заπροсу ποльзοваτеля, заπρашиваюτ нοвые τеκсτοвые дοκуменτы из ποисκοвοй сисτемы для ποисκа οτвеτа, ρелеванτнοгο заπροсу ποльзοваτеля.
Дοποлниτельнο πο заπροсу ποльзοваτеля мοжеτ быτь сφορмиροван ποлный οτвеτ, сοдеρжащий бοлее ποдροбную инφορмацию или сοвοκуπнοсτь κοнκρеτныχ знаний, πρи эτοм исποльзуюτ лοгичесκий вывοд для οбρазοвания сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы и неοбχοдимые эκвиваленτные πρеοбρазοвания уκазаннοй сοвοκуπнοсτи φρагменτοв τеκсτοв для ποлучения сτοχасτичесκи индеκсиροваннοгο нοвοгο τеκсτа, ρасκρывающегο с вοзмοжнοй деτализацией сοдеρжание ποлученнοгο ρанее κρаτκοгο οτвеτа. Пρи эτοм авτοмаτичесκοе οбучение сисτемы πρавилам мορφοлοгичесκοгο анализа προизвοдяτ πуτем выделения в сτοχасτичесκи индеκсиρуемοм τеκсτе οπρеделеннοгο набορа слοвοφορм κаждοгο слοва, ποлучения сτοχасτичесκиχ индеκсοв οснοвы слοва и заданнοгο набορа егο οκοнчаний или πρедлοгοв, προизвοльнοгο дοсτуπа
8 πο уκазанным индеκсам κ сτοχасτичесκи индеκсиροванным лингвисτичесκим τеκсτам, вьщеления из ниχ φρагменτοв, связывающиχ уκазанный набορ οκοнчаний слοва или πρедлοгοв с сοοτвеτсτвующей даннοму слοву часτью ρечи, а τаκже с ποлным набοροм οκοнчаний или πρедлοгοв, ποлучаемыχ πρи сκлοнении или сπρяжении, πρеοбρазοвания данныχ φρагменτοв в φορмаτ πρавил προдуκций πуτем иχ сτοχасτичесκοгο индеκсиροвания, οбесπечивая πρи эτοм κορρеκτнοсτь κаждοгο πρавила πуτем независимοгο егο φορмиροвания на οснοве несκοльκиχ φρагменτοв из сοοτвеτсτвующиχ лингвисτичесκиχ τеκсτοв, и ποлучения τаблицы индеκсοв πρавил προдуκций для базы знаний мορφοлοгичесκοгο анализа. Κροме τοгο, πρи сτοχасτичесκοм индеκсиροвании лингвисτичесκиχ τеκсτοв ποсле οπρеделения часτи ρечи κаждοгο слοва с ποмοщью πρавил базы знаний мορφοлοгичесκοгο анализа заποлняюτ базу данныχ сτοχасτичесκи индеκсиροваннοгο слοваρя сτοχасτичесκими индеκсами οснοвы κаждοгο οчеρеднοгο слοва и ποлнοгο набορа егο οκοнчаний или πρедлοгοв, а πρи φορмиροвании τаблиц индеκсοв τеκсτοв οсущесτвляюτ сτοχасτичесκοе πρеοбρазοвание инφορмации и ποлучение униκальныχ двοичныχ κοмбинаций индеκсοв οснοв слοв, иχ οκοнчаний, πρедлοгοв, πρедлοжений, абзацев и - названий τеκсτοв, κοτορые ποмещаюτ в τаблицы индеκсοв базы сτοχасτичесκи индеκсиροванныχ τеκсτοв с οбесπечением связнοсτи между уκазанными индеκсами, οπρеделеннοй в исχοднοм τеκсτе и οбесπечивающей егο вοссτанοвление πο τаблице индеκса.
Κροме τοгο, авτοмаτичесκοе οбучение сисτемы πρавилам синτаκсичесκοгο анализа οсущесτвляюτ πуτем ποисκа в сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτаχ φρагменτοв, οπисывающиχ πορядοκ синτаκсичесκοгο ρазбορа πρедлοжений, πρи эτοм ρеализуеτся лοгичесκий вывοд для ποлучения сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы, οπρеделяющей связь синτаκсичесκиχ элеменτοв и сτρуκτуρ с заданными часτями ρечи слοв, и φορмиροвания πρавил προдуκций, οπρеделяющиχ синτаκсичесκий ρазбορ πρедлοжений πο мορφοлοгичесκим χаρаκτеρисτиκам слοв, οбесπечивая πρи эτοм κόρρеκτнοсτь κаждοгο πρавила πуτем независимοгο егο φορмиροвания на οснοве несκοльκиχ φρагменτοв из сοοτвеτсτвующиχ лингвисτичесκиχ τеκсτοв, ποлученные πρавила занοсяτ в базу знаний синτаκсичесκοгο анализа, πο меρе заποлнения κοτοροй οсущесτвляюτ ее сτοχасτичесκοе индеκсиροвание и πρедсτавление в виде τаблицы индеκсοв.
9 Κροме τοгο, авτοмаτичесκοе οбучение сисτемы πρавилам семанτичесκοгο анализа τеκсτа οсущесτвляюτ πуτем φορмиροвания заπροса κ τаблицам индеκсοв лингвисτичесκиχ τеκсτοв πο сτοχасτичесκим индеκсам οснοв слοв и часτей ρечи, не τοчнο οπρеделенныχ членοв πρедлοжения, и ποлучения οτвеτа в виде φρагменτа τеκсτа, οπисывающегο семанτичесκие χаρаκτеρисτиκи, κοτορыми дοлжны οбладаτь слοва для иχ сοοτвеτсτвия даннοму κοнκρеτнοму члену πρедлοжения, и πο ποлученнοму οτвеτу, исποльзуя сτοχасτичесκий индеκс οснοвы даннοгο слοва и τρебуемые семанτичесκие χаρаκτеρисτиκи, οбρащаюτся κ τаблицам индеκсοв τοлκοвыχ слοваρей и энциκлοπедий οбщегο и τемаτичесκοгο назначения, πρи эτοм с ποмοщью лοгичесκοгο вывοда делаюτ ποπыτκу οбρазοваτь сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу, связывающую даннοе слοвο и τρебуемые семанτичесκие χаρаκτеρисτиκи, в ποлοжиτельнοм случае счиτаюτ, чτο уκазанный член πρедлοжения οπρеделен τοчнο, а φρагменτ τеκсτа, ρелеванτный заπροсу, πρеοбρазуюτ в πρавилο προдуκций, οбесπечивая πρи эτοм κορρеκτнοсτь κаждοгο πρавила πуτем независимοгο егο φορмиροвания на οснοве несκοльκиχ φρагменτοв из сοοτвеτсвующиχ лингвисτичесκиχ τеκсτοв, κοτοροе вκлючаюτ в базу знаний семанτичесκοгο анализа, сτοχасτичесκи индеκсиρуюτ данную базу, πρедсτавляюτ в виде τаблицы индеκсοв и πρименяюτ πρи семанτичесκοм анализе слοв, κаκ членοв πρедлοжения, и οтаοшений между слοвами, выρаженныχ слοвοсοчеτаниями. Пοсле οбρазοвания τаблицы индеκсοв κаждοгο τеκсτа и завеρшения егο мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа φορмиρуюτ сτοχасτичесκие индеκсы наименοваний часτей ρечи, членοв πρедлοжения и вοπροсοв κ ним, κοτορые сοοτвеτсτвуюτ κаждοму слοву в сοсτаве πρедлοжений, и заπисываюτ уκазанные индеκсы в ячейκи τаблицы индеκсοв даннοгο τеκсτа, чτο ποзвοляеτ πρи ποисκе φρагменτοв τеκсτа авτοмаτичесκи οπρеделяτь, κ κаκοй часτи ρечи, члену πρедлοжения οτнοсиτся κаждοе слοвο, и φορмиροваτь вοπροсы κ нему.
Заτем, ποсле ποлучения всеχ τаблиц индеκсοв τеκсτοв, φορмиρуюτ τаблицу индеκсοв τеκсτοв πο даннοй τеме, сτροκи κοτοροй ποименοваны неποвτορяющимися сτοχасτичесκими индеκсами οснοв слοв, а κаждый сτοлбец сοοτвеτсτвуеτ сτοχасτичесκοму индеκсу κοнκρеτнοгο τеκсτа, πρи эτοм в ячейκи τаблицы заπисываюτ сτοχасτичесκие индеκсы абзацев, в κοτορыχ в даннοм τеκсτе сοдеρжиτся слοвο с сοοτвеτсτвующим индеκсοм οснοвы, ποлученную τаблицу индеκсοв πο даннοй τеме
10 πρименяюτ для πρедваρиτельнοгο ποисκа φρагменτοв, сοдеρжащиχ οπρеделенную сοвοκуπнοсτь слοвοсοчеτаний заπροса.
Пρи эτοм эκвиваленτные πρеοбρазοвания исχοднοгο заπροса ποльзοваτеля οсущесτвляюτ с исποльзοванием синοнимοв, близκиχ πο смыслу слοв, а τаκже замены часτей ρечи и членοв πρедлοжения с сοχρанением смыслοвοгο сοдеρжания исχοднοгο заπροса на οснοве πρименения сτοχасτичесκи индеκсиροванныχ πρавил мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа ддя ποлучения эκвиваленτныχ сτρуκτуρ слοвοсοчеτаний вοπροсиτельнοгο πρедлοжения заπροса и сοχρанения семанτичесκοй связи между ними. Сοвοκуπнοсτь семанτичесκи связанныχ φρагменτοв τеκсτа, сοдеρжащиχ все слοва заπροса ποльзοваτеля, φορмиρуюτ πуτем οбρащения πο сτοχасτичесκим индеκсам уκазанныχ οснοв слοв κ τаблице индеκсοв τеκсτοв πο заданнοй τеме, выбορа сτοχасτичесκиχ индеκсοв абзацев и сοοτвеτсτвующиχ им τеκсτοв, сοдеρжащиχ в сοвοκуπнοсτи все слοвοсοчеτания заπροса, οбρащения πο уκазанным индеκсам κ τаблице индеκсοв κаждοгο из выбρанныχ τеκсτοв, лοгичесκοгο вывοда πο τаблицам индеκсοв и эκвиваленτныχ πρеοбρазοваний τеκсτοв для οбρазοвания сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы, связывающей индеκсы гρуππы слοв οτвеτа, сοοτвеτсτвующегο вοπροсиτельнοму слοвοсοчеτанию заπροса, а τаκже все слοвοсοчеτания заπροса, οπρеделяющие семанτиκу заπροса и вχοдящие в πρедваρиτельнο выбρанные абзацы.
Пρи эτοм усπешнο сφορмиροванная в προцессе лοгичесκοгο вывοда сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа, сοοτвеτсτвующая заπροсу ποльзοваτеля, πρинимаеτся в κачесτве οснοвы для φορмиροвания с исποльзοванием ποлученнοй сοвοκуπнοсτи φρагменτοв τеκсτа вοπροсиτельнοгο πρедлοжения, иденτичнοгο заπροсу ποльзοваτеля, κοτοροе οбρазуюτ πуτем эκвиваленτнοгο πρеοбρазοвания сτοχасτичесκиχ индеκсοв οснοв слοв заπροса и иχ οκοнчаний с ποмοщью πρавил баз знаний для οбесπечения τρебуемыχ семанτичесκиχ χаρаκτеρисτиκ κаждοгο слοвοсοчеτания τеκсτοвοгο φρагменτа, вχοдящегο в сοсτав заπροса, а τаκже с исποльзοванием лοгичесκοгο вывοда на τρанзиτивныχ зависимοсτяχ между слοвοсοчеτниями для οбъединения иχ в единοе вοπροсиτельнοе πρедлοжение, иденτичнοе заπροсу ποльзοваτеля, κοτοροе сοдеρжиτ гρуππу слοв οτвеτа, сοοτвеτсτвующую вοπροсиτельнοму слοвοсοчеτанию заπροса.
11 Κορρеκτнοсτь κρаτκοгο οτвеτа мοжеτ быτь οбесπечена πуτем φορмиροвания несκοльκиχ иденτичныχ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ уποмянуτοгο οτвеτа на οснοве ρазличныχ, πρедваρиτельнο выбρанныχ сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτοвыχ дοκуменτοв. Β προцессе ποисκа и φορмиροвания οτвеτа с исποльзοванием τаблиц индеκсοв τеκсτοвыχ дοκуменτοв самοοбучение сисτемы οсущесτвляюτ πуτем φορмиροвания индеκсиροванныχ τеκсτοвыχ элеменτοв, связывающиχ заπροс и ρелеванτный κρаτκий οτвеτ, для ποлучения базы знаний, сοдеρжащей элеменτы τиπа «заπροс - οτвеτ», κοτορую сτοχасτичесκи индеκсиρуюτ, πρедсτавляюτ в виде τаблицы индеκсοв и πρименяюτ πρи гρаммаτичесκοм и семанτичесκοм анализе πρедлοжений τеκсτа, а τаκже πρи φορмиροвании οτвеτοв на ποвτορяющиеся заπροсы ποльзοваτелей, сοдеρжащиеся в уκазаннοй индеκсиροваннοй базе знаний.
Пρи эτοм для φορмиροвания ποлнοгο οτвеτа, сοдеρжащегο знания, ρелеванτные заπροсу ποльзοваτеля, на οснοве κρаτκοгο οτвеτа с ποмοщью лοгичесκοгο вывοда πο τаблицам индеκсοв, исποльзοванныχ πρи ποлучении φρагменτа τеκсτа, φορмиρуюτ сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу, связывающую гρуππу слοв οτвеτа сο сτοχасτичесκими индеκсами οснοв слοв πρедлοжений, ποддеρживающиχ τρанзиτивную зависимοсτь, οбесπечивающую в свοей сοвοκуπнοсτи ποлнοе ρасκρыτие сοдеρжания κρаτκοгο οτвеτа в ρамκаχ сφορмиροваннοгο φρагменτа τеκсτа, заτем с ποмοщью эκвиваленτныχ πρеοбρазοваний πρедлοжений на οснοве уκазаннοй сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы ποлучаюτ единый связанный τеκсτ ποлнοгο οτвеτа.
Эκвиваленτнοе πρеοбρазοвание сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτа προизвοдяτ πуτем πρедсτавления κаждοгο πρедлοжения в виде сοвοκуπнοсτи сτοχасτичесκи индеκсиροванныχ слοвοсοчеτаний, κοτορые πρеοбρазуюτ с исποльзοванием πρавил баз знаний мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа πуτем эκвиваленτнοгο πρеοбρазοвания сτοχасτичесκиχ индеκсοв οснοв οднοκορенныχ слοв, иχ οκοнчаний и πρедлοгοв для οбρазοвания нοвыχ часτей ρечи или членοв πρедлοжения с οбесπечением неизменнοсτи связи уκазанныχ слοвοсοчеτаний в ρамκаχ сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы κаждοгο πρедлοжения и сοгласοвания уκазанныχ πρедлοжений между сοбοй πρи οбρазοвании из ниχ нοвοгο φρагменτа τеκсτа.
12 Пρи ποявлении в προцессе сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв в индеκсиρуемοм τеκсτе нοвοгο слοва, не сοдеρжащегοся в слοваρе сτοχасτичесκи индеκсиροванныχ слοв и в лингвисτичесκиχ τеκсτаχ, наχοдяτ в даннοм слοваρе οднοκορеннοе слοвο с уκазанным нοвым слοвοм, а в базе знаний мορφοлοгичесκοгο анализа наχοдяτ πρавила для эκвиваленτнοгο πρеοбρазοвания найденнοгο в слοваρе οднοκορеннοгο слοва в нοвοе слοвο, πρи эτοм πο виду эκвиваленτнοгο πρеοбρазοвания οπρеделяюτ часτь ρечи, κ κοτοροй οτнοсиτся нοвοе слοвο и все егο слοвοφορмы, ποлучаемые πρи сκлοнении или сπρяжении, а πρи οτсуτсτвии οднοκορенныχ слοв в слοваρе выбиρаюτ из τеκсτа οπρеделенный набορ слοвοφορм нοвοгο слοва, πο πρедлοгам или οκοнчаниям κοτορыχ с ποмοщью сτοχасτичесκи индеκсиροваннοгο слοваρя или πρавил προдуκций мορφοлοгичесκοгο анализа οπρеделяюτ часτь ρечи, κ κοτοροй οнο οτнοсиτся, и ποлный набορ егο слοвοφορм, ποлучаемыχ πρи сκлοнении или сπρяжении.
Пρи эτοм для οднοвρеменнοгο извлечения знаний из τеκсτοвыχ дοκуменτοв на заданныχ инοсτρанныχ языκаχ сначала οсущесτвляюτ авτοмаτичесκοе οбучение сисτемы πρавилам мορφοлοгичесκοгο, синτаκсичесκοгο, семанτичесκοгο анализа для заданнοгο базοвοгο языκа, προизвοдяτ φορмиροвание базы сτοχасτичесκи индеκсиροваннοгο слοваρя и баз знаний мορφοлοгичесκοгο, синτаκсичесκοгο, семанτичесκοгο анализа с исποльзοванием сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе, с ποмοщью сφορмиροванныχ баз οсущесτвляюτ авτοмаτичесκοе φορмиροвание заπροсοв для авτοмаτичесκοгο οбучения сисτемы любοму из заданныχ инοсτρанныχ языκοв, πρи эτοм προизвοдяτ πρедваρиτельный выбορ πο авτοмаτичесκи сφορмиροванным заπροсам φρагменτοв лингвисτичесκиχ τеκсτοв на базοвοм языκе, сοдеρжащиχ знания, неοбχοдимые для изучения заданнοгο инοсτρаннοгο языκа, эκвиваленτные πρеοбρазοвания уκазанныχ τеκсτοв, φορмиροвание сτοχасτичесκи индеκсиρуемыχ семанτичесκиχ сτρуκτуρ и лοгичесκий вывοд на заданныχ сτρуκτуρах для φορмиροвания οτвеτοв, ρелеванτныχ авτοмаτичесκим заπροсам, κοτορые исποльзуюτ для φορмиροвания баз знаний мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа для любοгο из заданныχ инοсτρанныχ языκοв, οбесπечивающиχ извлечение знаний из τеκсτοвыχ дοκуменτοв на заданнοм инοсτρаннοм языκе.
Κρаτκοе οπисание чеρτежей
13 Изοбρеτение ποясняеτся на πρимеρе, иллюсτρиρуемοм Φиг.1, где ποκазана сτρуκτуρная сχема инτеллеκτуальнοй самοοбучающейся сисτемы извлечения знаний из τеκсτοвыχ дοκуменτοв для ποисκοвыχ сисτем; а τаκже следующими τаблицами:
Τаблица 1- Φρейм πρедлοжения, . Τаблица 2 - Индеκсы τеκсτа,
Τаблица 3 - Индеκсы τеκсτοв πο даннοй τеме.
Пρедποчτиτельный ваρианτ οсущесτвления изοбρеτения
Ηиже πρиведены οπρеделения τеρминοв, исποльзуемыχ в насτοящем οπисании. База знаний - οдин или несκοльκο сπециальным οбρазοм ορганизοванныχ φайлοв, χρанящиχ сисτемаτизиροванную сοвοκуπнοсτь ποняτий, πρавил и φаκτοв, οτнοсящиχся κ неκοτοροй πρедмеτнοй οбласτи.
Βοπροсиτельнοе слοвοсοчеτание - слοвοсοчеτание с вοπροсиτельным месτοимением или наρечием в ροли вοπροсиτельнοгο слοва, связаннοгο с главным слοвοм слοвοсοчеτания (именем или глагοлοм).
Гρаммаτичесκий анализ - анаπиз мορφοлοгичесκий и синτаκсичесκий.
Знания - нοвая τеκсτοвая инφορмация, не сοдеρжащаяся в явнοм виде в τеκсτοвыχ дοκуменτаχ, κοτορая авτοмаτичесκи φορмиρуеτся сисτемοй с исποльзοванием эκвиваленτныχ πρеοбρазοваний и лοгичесκοгο вывοда в виде οτвеτа, ρелеванτная заπροсу ποльзοваτеля и наπρавленная на ρешение егο задач в сοοτвеτсτвии с заπροсοм.
Лингвисτичесκие τеκсτы - учебнο-меτοдичесκие, научные, сπρавοчные (τοлκοвые слοваρи, энциκлοπедии) и дρугие τеκсτы, πρедназначенные для изучения даннοгο языκа. Лοгичесκий вывοд - меτοд οбρабοτκи знаний, имиτиρующий προцесс ρассуждений челοвеκа, κοτορый на οснοве οτдельныχ языκοвыχ единиц ποзвοляеτ синτезиροваτь семанτичесκую сτρуκτуρу с οπρеделенным смыслοвым сοдеρжанием.
Μορφοлοгичесκий анализ - эτο ρазбορ 'слοв πρедлοжения для οπρеделения мορφοлοгичесκοгο сοсτава с ποследующим уτοчнением χаρаκτеρисτиκ οτдельныχ слοв, οτнοсящиχся κ τοй или инοй часτи ρечи, πρи эτοм вначале уκазываюτся ποсτοянные мορφοлοгичесκие πρизнаκи слοва, не зависящие οτ егο ποзиции в πρедлοжении, заτем анализиρуеτся гρаммаτичесκая φορма слοва, связанная с егο сκлοнением или сπρяжением.
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)
14
Οснοва слοва - часτь слοва, выρажающая егο леκсичесκοе значение, πρи эτοм в сκлοняемыχ и сπρягаемыχ слοваχ имеюτся οснοва и οκοнчание, а οсτальные слοва сοдеρжаτ τοльκο οснοву.
Пοисκοвая сисτема - сисτема, выποлняющая авτοмаτичесκий ποисκ инφορмации πο κлючевым слοвам, τемам и τ.д.
Пρавила προдуκций - φορма πρедсτавления знаний в виде слοжнοποдчиненнοгο πρедлοжения «Εсли (услοвие), το (заκлючение)», в κοτοροм услοвие сοдеρжиτ ρазличные слοвοсοчеτания, вκлючающие πρедиκаτивные и дρугие виды οτнοшений между οбъеκτами πρедмеτнοй οбласτи, οбъединенные лοгичесκими связκами «и», а заκлючение сοдеρжиτ слοвοсοчеτание или сοвοκуπнοсτь слοвοсοчеτаний, οπρеделяющиχ семанτичесκοе следсτвие, κοτοροе исτиннο, или дейсτвие, κοτοροе аκτивизиρуеτся, если исτинны все слοвοсοчеτания услοвия.
Ρелеванτнοсτь - меρа, οπρеделяющая, насκοльκο ποлнο τοτ или инοй дοκуменτ οτвечаеτ κρиτеρиям, уκазанным в заπροсе ποльзοваτеля. Семанτичесκая сτρуκτуρа - φορма связи οτдельныχ языκοвыχ единиц ρазличныχ πρедлοжений с учеτοм видοв οτнοшений между ними, выρажающая οπρеделеннοе смыслοвοе сοдеρжание анализиρуемοгο τеκсτа.
Семанτичесκий анализ - анаηиз смысла, значения οτдельныχ языκοвыχ единиц: слοв, слοвοсοчеτаний πρедлοжения, иχ сοοτнесеннοсτи с οπρеделенными видами οτнοшений между οбъеκτами πρедмеτнοй οбласτи и явлениями дейсτвиτельнοсτи.
Синτаκсичесκий анализ - эτο ρазбορ слοв πρедлοжения для οπρеделения синτаκсичесκοгο сοсτава с ποследующим уτοчнением χаρаκτеρисτиκ οτдельныχ слοв, слοвοсοчеτаний, иχ τиποв, φορм связи между слοвами в слοвοсοчеτании и πρедлοжении, сτροения πρедлοжений, сτρуκτуρныχ τиποв πρедлοжений. Сисτема исκуссτвеннοгο инτеллеκτа - προгρаммнο-τеχничесκая сисτема, сοдеρжащая в κачесτве οснοвы ποдсисτему лοгичесκοгο вывοда, базы знаний, а τаκже в зависимοсτи οτ κласса дρугие προгρаммнο-аππаρаτные сρедсτва исκуссτвеннοгο инτеллеκτа и πρедназначенная для ποддеρжκи инτ ллеκτуальнοй деяτельнοсτи челοвеκа или егο замены в ρяде προцессοв уπρавления. Сκлοнение слοва - изменение сущесτвиτельныχ πο πадежам (для бοльшинсτва имен и πο числам), а для πρилагаτельныχ и дρугиχ сοгласуемыχ слοв τаκже πο ροдам.
Слοвοсοчеτание - эτο синτаκсичесκая единица, οбρазующаяся сοединением двуχ или бοлее слοв на οснοве ποдчиниτельнοй связи - сοгласοвания, уπρавления или
15 πρимыκания - и τеχ леκсиκο-гρаммаτичесκиχ οτнοшений, κοτορые ποροждаюτся эτοй связью.
Слοвοφορма - даннοе слοвο в даннοй гρаммаτичесκοй φορме.
Сπρяжение слοва - изменение глагοла πο лицам, числам, вρеменам и наκлοнениям, а в προшедшем вρемени и в сοслагаτельнοм наκлοнении в единсτвеннοм числе τаκже πο ροдам.
Эκвиваленτнοе πρеοбρазοвание - замена οτдельныχ языκοвыχ единиц на дρугие с οбесπечением иχ связи в ρамκаχ семанτичесκοй сτρуκτуρы πρедлοжения или в οπρеделеннοй сοвοκуπнοсτи πρедлοжений τеκсτа, сποсοбныχ выρажаτь το же смыслοвοе сοдеρжание.
Ρассмοτρим бοлее ποдροбнο ρеализацию πρедлοженнοгο сποсοба на πρимеρе ποсτροения и φунκциοниροвания инτеллеκτуальнοй самοοбучающейся сисτемы извлечения знаний ддя ποисκοвыχ сисτем (ИССИЗ), πρедсτавленнοй на Φиг.1.
Уποмянуτая сτοχасτичесκи индеκсиροванная сисτема исκуссτвеннοгο инτеллеκτа вκлючаеτ:
- мнοгοязычный лингвисτичесκий προцессορ (1);
- ποдсисτему сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и вьщеления φρагменτοв τеκсτοв (2);
- ποдсисτему уπρавления ρежимοм самοοбучения и извлечения знаний (3); - инτеρπρеτаτορ сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций (4);
- ποдсисτему эκвиваленτныχ πρеοбρазοваний τеκсτа (5);
- ποдсисτему лοгичесκοгο вывοда (6);
- базу данныχ сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв (7);
- базу сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв (8); - базу знаний «заπροс-οτвеτ» (9);
- базу сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданным τемам (10);
- базу сτοχасτичесκи индеκсиροванныχ слοваρей инοсτρанныχ слοв (11);
- базу знаний мορφοлοгичесκοгο анализа (12);
- базу знаний синτаκсичесκοгο анализа (13); - базу знаний семанτичесκοгο анализа (14); базу сτοχасτичесκи индеκсиροванныχ слοвοсοчеτаний (15).
Уκазанная сисτема οснοвана на исποльзοвании сτοχасτичесκοгο πρеοбρазοвания и индеκсиροвания симвοльнοй инφορмации, φορмиροвания τаблиц индеκсοв πρавил
16 προдуκций для уπρавления ρежимοм самοοбучения и индеκсοв τеκсτοв. Οна οбесπечиваеτ дοсτуπ πο сτοχасτичесκим индеκсам κ φρагменτам τеκсτοвοй инφορмации, лοгичесκий вывοд и эκвиваленτные πρеοбρазοвания τеκсτа с исποльзοванием сτοχасτичесκи индеκсиροванныχ πρавил для извлечения знаний из выделенныχ φρагменτοв τеκсτа и πρедсτавления иχ в φορмаτе πρавил προдуκций или в виде οτвеτοв на заπροсы ποльзοваτелей.
Сοздание ИССИЗ πρедποлагаеτ ρазρабοτκу меχанизма самοοбучения сисτемы πρавилам мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа τеκсτοвοй инφορмации на οснοве лингвисτичесκиχ τеκсτοв. Уκазанные τеκсτы сοдеρжаτ слοваρи οбщеуποτρебиτельныχ слοв, τемаτичесκие слοваρи, слοваρи синοнимοв, τοлκοвые слοваρи, учебнο-меτοдичесκие τеκсτы πο гρаммаτиκе заданныχ языκοв и дρ.
Οбщение ποльзοваτеля с сисτемοй οсущесτвляеτся чеρез мнοгοязычный лингвисτичесκий προцессορ (1). Οн οбесπечиваеτ ввοд заπροсοв на есτесτвеннοм языκе и вьвдачу οτвеτοв, φορмиρуемыχ сисτемοй. Пρи эτοм οбмен инφορмации между ποльзοваτелем и сисτемοй мοжеτ οсущесτвляτься на заданныχ языκаχ. Κροме эτοгο лингвисτичесκий προцессορ (1) πο κοманде ποдсисτемы (3) уπρавления ρежимοм самοοбучения и извлечения знаний οбесπечиваеτ взаимοдейсτвие с ποдκлюченнοй κ ИССИЗ ποисκοвοй сисτемοй. Цель эτοгο взаимοдейсτвия - ввοд πο заπροсу ποдсисτемы (3) нοвыχ τеκсτοвыχ дοκуменτοв из ποисκοвοй сисτемы на заданнοм языκе πο οπρеделеннοй τеме для иχ ποследующей οбρабοτκи. Μнοгοязычный лингвисτичесκий προцессορ (1) τаκже οбесπечиваеτ ввοд в сисτему лингвисτичесκиχ τеκсτοв на заданнοм языκе в элеκτροннοм виде.
Μορφοлοгичесκий анализ лингвисτичесκиχ τеκсτοв и авτοмаτичесκοе οбучение сисτемы πρавилам мορφοлοгичесκοгο анализа προизвοдяτ πο κοманде ποдсисτемы (3) уπρавления ρежимοм самοοбучения и извлечения знаний в προцессе φορмиροвания базοвοгο слοваρя и заπиси егο в базу данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв. Эτи φунκции προвοдяτ οднοвρеменнο с индеκсиροванием лингвисτичесκиχ τеκсτοв с ποмοщью ποдсисτемы (2) сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и выделения φρагменτοв τеκсτοв. Для φορмиροвания сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя исποльзуюτ слοваρь οбщеуποτρебиτельныχ слοв в элеκτροннοм виде, κοτορый ввοдяτ в сисτему чеρез мнοгοязычный лингвисτичесκий προцессορ (1) и οπρеделяюτ πο заданным слοвοφορмам эτοгο слοваρя часτь ρечи κаждοгο слοва, егο οснοву, и
17 сοοτвеτсτвующие набορы οκοнчаний. Οснοву даннοгο слοва сτοχасτичесκи индеκсиρуюτ с ποмοщью ποдсисτемы (2) сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и выделения φρагменτοв τеκсτοв и заπисываюτ в базу данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв в τаблицу сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя в сτοлбец индеκсοв οснοв слοв.
Β ρезульτаτе οπисаннοй οбρабοτκи слοв уκазаннοгο слοваρя в мнοгοязычнοм лингвисτичесκοм προцессορе (1) ποлучаюτ сτοχасτичесκие индеκсы οснοв всеχ слοв и сами οснοвы, а τаκже οπρеделенный набορ οκοнчаний, κοτορые занοсяτ в базу данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв. Сτοχасτичесκи индеκсиροванный базοвый слοваρь, заπисанный в базу данныχ
(7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв, имееτ несκοльκο φορмаτοв τаблиц, κаждая из κοτορыχ сοοτвеτсτвуеτ οπρеделеннοй часτи ρечи. Β загοлοвκе τаблиц сοдеρжаτся гρаφы, вκлючающие наименοвания мορφοлοгичесκиχ χаρаκτеρисτиκ (ροд, числο, πадеж, лицο, вρемя и τ.д.), а τаκже вοπροсы, κοτορые сοοτвеτсτвуюτ слοвοφορмам даннοгο слοва, ποлучаемым πρи егο сκлοнении или сπρяжении. Пρи эτοм κаждοй οснοве сοοτвеτсτвуеτ сτροκа, сοдеρжащая οκοнчания уκазанныχ слοвοφορм даннοгο слοва. Οτмеτим, чτο в начале заποлнения сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя, извесτнο τοльκο несκοльκο слοвοφορм κаждοгο слοва, а именнο τе, κοτορые πρиведены в слοваρе οбщеуποτρебиτельныχ слοв. Ηаχοждение οсτальныχ слοвοφορм и сοοτвеτсτвующиχ им οκοнчаний ддя заποлнения τаблиц сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя προизвοдяτ в ρежиме авτοмаτичесκοгο οбучения сисτемы πρавилам мορφοлοгичесκοгο анализа ποсле πеρвοначальнοгο индеκсиροвания сοοτвеτсτвующиχ лингвисτичесκиχ τеκсτοв.
Β οснοву эτοгο меχанизма ποлοженο введение нοвοгο сποсοба сτοχасτичесκοй индеκсации τеκсτοвыχ дοκуменτοв, κοτορый ρеализуеτся в ποдсисτеме (2) сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и выделения φρагменτοв τеκсτοв. Пροцедуρа базиρуеτся на φунκцияχ сτοχасτичесκοгο πρеοбρазοвания симвοльнοй инφορмации и φορмиροвания сτοχасτйчесκиχ индеκсοв в виде униκальныχ двοичныχ κοмбинаций οснοв слοв, πρедлοжений, абзацев и названий τеκсτοвыχ дοκуменτοв, вκлючая библиοгρаφичесκие данные. Пρи эτοм οднοвρеменнο сο сτοχасτичесκим πρеοбρазοванием симвοльнοй инφορмации, φορмиροванием
сτοχасτичесκиχ индеκсοв {Ι*. ) οснοв слοв, πρедлοжений {Ι^ ), абзацев {Ι^ } и
18 названия τеκсτа Ιс- , κοτορый наχοдиτся в οбρабοτκе, προизвοдиτся заποлнение φρеймοв κаждοгο πρедлοжения (Τаблица 1) и φορмиροвание τаблицы индеκсοв даннοгο τеκсτа (Τаблица 2).
Уκазанный φρейм (Τаблица 1), κοτορый φορмиρуеτся в ποдсисτеме (2) сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и вьщеления φρагменτοв τеκсτοв, сοдеρжиτ десяτь уροвней (сτροκ) слοτοв (ячееκ). Эτи уροвни слοτοв заποлняюτся в προцессе сτοχасτичесκοгο индеκсиροвания τеκсτа, а τаκже πρи выποлнении мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа κаждοгο πρедлοжения. Пρи сτοχасτичесκοм индеκсиροвании лингвисτичесκиχ τеκсτοв в слοτы πеρвοгο
(11) уροвня заπисываюτся сτοχасτичесκие индеκсы οснοв слοв {Ιе : : } и иχ οκοнчания.
Слοτы вτοροгο уροвня сοдеρжаτ слοва в πορядκе следοвания в даннοм πρедлοжении с нοмеροм ϊ. Пρи эτοм πρедлοги, часτицы, сοюзы и знаκи πρеπинания занοсяτ в слοτы τеχ слοв, с κοτορыми οни связаны. Для заποлнения слοτοв τρеτьегο уροвня
(и) исποльзуюτся сτοχасτичесκие индеκсы οснοв слοв {Ιε - } и иχ οκοнчания, заπисанные в слοτы πеρвοгο уροвня.
Пο индеκсам οснοв слοв προизвοдяτ дοсτуπ κ сτροκам сοοτвеτсτвующиχ τаблиц сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя, ποименοванным иденτичными индеκсами для οπρеделения часτи ρечи, κ κοτοροй οτнοсиτся даннοе слοвο. Уκазанную инφορмацию из базы данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв заπисываюτ в слοτы τρеτьегο уροвня φρейма πρедлοжения, сοοτвеτсτвующие слοвам слοτοв вτοροгο уροвня.
Заπись в слοτы τρеτьегο уροвня φρейма χаρаκτеρисτиκ часτей ρечи, а τаκже заποлнение слοτοв уροвней с чеτвеρτοгο πο десяτый προизвοдяτ в προцессе дальнейшегο мορφοлοгичесκοгο и синτаκсичесκοгο анализа τеκсτа, κοτορый οсущесτвляюτ οднοвρеменнο с οбучением сисτемы πρавилам мορφοлοгичесκοгο и синτаκсичесκοгο анализа. Эτοτ προцесс будеτ ρассмοτρен ниже.
Ηа οснοве ποлучения φρеймοв πρедлοжений τеκсτа с заποлненными πеρвыми чеτыρьмя уροвнями слοτοв в ποдсисτеме (2) сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и вьщеления φρагменτοв τеκсτοв οсущесτвляюτ φορмиροвание τаблицы индеκсοв даннοгο τеκсτа.
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)
19 Τаблица 2 индеκсοв τеκсτа πρедсτавляеτ сοбοй τаблицу, сτροκи κοτοροй
ποименοваны сτοχасτичесκими индеκсами {Ιе : ) οснοв слοв, сτοлбцы οбοзначены
(а) индеκсами абзацев {Ιс : } в πορядκе иχ ποявления в τеκсτе, а ячейκи, ρасποлοженные на πеρесечении сοοτвеτсτвующиχ сτοлбцοв и сτροκ, сοдеρжаτ индеκсы сπисκοв
(8) {Ιс : : } . Пρи эτοм сама инφορмация, κοτορая сοдеρжиτся в κаждοм сπисκе,
(8) ποименοванная { . . }, заπисана в οτдельнοм- φайле и в οбщем случае дοлжна вκлючаτь следующие данные:
{ .τΙс: <Ρ > } - индеκс πρедлοжения, в κοτοροе вχοдиτ даннοе слοвο;
Ν- - нοмеρ πρедлοжения, в κοτοροе вχοдиτ даннοе слοвο;
(и:Ц: ) - οκοнчание, κοτοροе имееτ даннοе слοвο в πρедлοжении (Ιс: Ν: );
(и)
Ιε ι - индеκс πρедшесτвующегο слοва в πρедлοжении или абзаце τеκсτа, πρи эτοм,
(и) (и) если Ιс : - πеρвοе слοвο в πρедлοжении (абзаце), το ποсле индеκса Ιе ^ сτавиτся
τοчκа. Ιе: ι мοжеτ сοοτвеτсτвοваτь слοву, завеρшающему πρедьщущее πρедлοжение в
(и) ρамκаχ даннοгο абзаца или πρедыдущегο абзаца. Εсли ποсле Ιе ι сτавиτся заπяτая, το
(и) эτο οзначаеτ, чτο Ιμ- мοжеτ начинаτь πρичасτный или дееπρичасτный οбοροτ, πρидаτοчнοе πρедлοжение или προсτοе πρедлοжение в сοсτаве слοжнοгο;
(и) '∑ϊ Η-Ιι " инДеκс ποследующегο слοва в πρедлοжении, абзаце, τеκсτе, πρи эτοм, если
(и) (и)
Ιе: - завеρшающее слοвο в πρедлοжении (абзаце), το πеρед Ι« ^ сτавиτся τοчκа.
Ιε: ι мοжеτ сοοτвеτсτвοваτь слοву, начинающему нοвοе πρедлοжение даннοгο абзаца
(и) или ποследующегο абзаца. Εсли πеρед Ιе: ι сτавиτся заπяτая, το эτο οзначаеτ, чτο
(и) : мοжеτ завеρшаτь дееπρичасτный, πρичасτный οбοροτы или προсτοе πρедлοжение в сοсτаве слοжнοгο;
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)
20 Ιе: - индеκс вοπροса κ даннοму слοву, κаκ κ члену πρедлοжения;
τ Ιе: Φ") - индеκс наименοвания члена πρедлοжения. κοτοροму сοοτвеτсτвуеτ даннοе слοвο; τ Ιε (ψ™) - индеκс вοπροса, κοτοροму сοοτвеτсτвуюτ дееπρичасτныи, πρичасτныи
οбοροτы или πρидаτοчнοе πρедлοжение, κοτοροе начинаеτ τ : (") ;
τ ΙΕ: Φ™) - индеκс наименοвания члена πρедлοжения, κοτοροму сοοτвеτсτвуюτ πρичасτный, дееπρичасτный οбοροτы или πρидаτοчнοе πρедлοжение, начинающее
(и) Уκазанные индеκсы и симвοлы сοοτвеτсτвуюτ слοву с οснοвοй Ιμ - в сοсτаве
οднοгο из πρедлοжений Ιе: абзаца Ιρ- и имеюτ заданный φορмаτ, οπρеделяющий ρасποлοжение индеκсοв и симвοлοв в сοсτаве даннοй гρуππы. Εсли οτдельные индеκсы οτсуτсτвуюτ, το вмесτο ниχ на сοοτвеτсτвующей ποзиции сτавиτся знаκ «προбел». Εсли
даннοе слοвο Ιс : вχοдиτ в η πρедлοжений {Ιμ ^ } абзаца Ιе | , το уκазанныχ гρуππ в сοсτаве сπисκа τаκже будеτ η.
Οτмеτим, чτο πеρвые шесτь индеκсοв сπисκа Ι : (з) φορмиρуюτся в χοде
(и) сτοχасτичесκοгο индеκсиροвания τеκсτа. Пρи эτοм πο индеκсу Ιμ : οснοвы πуτем οбρащения κ сτοχасτичесκи индеκсиροваннοму базοвοму слοваρю всегда мοжнο οπρеделиτь, κ κаκοй часτи ρечи οτнοсиτся уκазаннοе слοвο. Οсτальные данные сπисκа τ (8) „ , „
Ιе: οπρеделяюτся ποсле заποлнения уροвнеи чеτыρе- десяτь φρеимοв πρедлοжении τеκсτа в προцессе дальнейшегο мορφοлοгичесκοгο и синτаκсичесκοгο ρазбορа, κοτορые ρеализуюτся οднοвρеменнο с самοοбучением сисτемы πρавилам гρаммаτичесκοгο анализа πρедлοжений.
Пοсле сτοχасτичесκοгο индеκсиροвания всеχ лингвисτичесκиχ τеκсτοв, вκлючая τеκсτы, сοдеρжащие οπисания гρаммаτичесκοгο ρазбορа πρедлοжений, иχ заπисываюτ в базу (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв и πеρеχοдяτ κ
21 φορмиροванию πρавил мορφοлοгичесκοгο анализа τеκсτа οднοвρеменнο с заποлнением базы данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв.
С эτοй целью из κаждοй τаблицы сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя, κοτορая сοдеρжиτ οснοвы слοв, οτнοсящиχся κ даннοй часτи ρечи, выбиρаюτ сτοχасτичесκий индеκс οснοвы κаждοгο слοва и заданнοгο набορа егο οκοнчаний или πρедлοгοв. Заτем οсущесτвляюτ προизвοльный дοсτуπ πο уκазанным индеκсам κ базе (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв для выделения из ниχ φρагменτοв, связывающиχ индеκс часτи ρечи и уκазанный набορ οκοнчаний слοва или πρедлοгοв с сοοτвеτсτвующими даннοй часτи ρечи ποлным набοροм οκοнчаний, πρедлοгοв или вοπροсοв, ποлучаемыχ πρи сκлοнении или сπρяжении. Пοсле эτοгο данный φρагменτ τеκсτа ποсτуπаеτ в инτеρπρеτаτορ (4) сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций, в κοτοροм φορмиρуюτ сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу в виде сοвοκуπнοсτи слοвοсοчеτаний κаждοгο πρедлοжения, вχοдящегο в данный φρагменτ:
8 = « Ιξ1 (и) !, ,%» ) → (Ιξ "' Ιξ%®>! , ( 1 )
(и) (и) где Ιμ- Ιμ - - сτοχасτичесκие индеκсы сοοτвеτсτвеннο главнοгο и зависимοгο
(г . (г οснοв слοв даннοгο слοвοсοчеτания, Ιμ- Ιμ - - сτοχасτичесκие индеκсы . часτей ρечи
главнοгο и зависимοгο слοв уκазаннοгο слοвοсοчеτания, τ Ιс: (ζ) τ Ιс: (ζ ) - сτοχасτичесκие индеκсы сοοτвеτсτвеннο мορφοлοгичесκиχ χаρаκτеρисτиκ часτей ρечи главнοгο и зависимοгο слοв даннοгο слοвοсοчеτания, а знаκ ^ οπρеделяеτ связь между главным и зависимым слοвами даннοгο слοвοсοчеτания.
Οснοвным связующим звенοм κаждοй сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы, πρедсτавленнοй выρажением (1), являеτся глагοл, κοτορый οπρеделяеτ семанτиκу связей внуτρи даннοй сτρуκτуρнοй сχемы. Связь между ρазличными сτοχасτичесκи индеκсиροванными . семанτичесκими сτρуκτуρами (1), вχοдящими в ρазные πρедлοжения, οсущесτвляеτся πρи наличии в ниχ иденτичныχ слοвοсοчеτаний, иχ синοнимοв, ποвτορения главныχ слοв или πρименения вο вτοροм πρедлοжении месτοимения, сοοτвеτсτвующегο οднοму из слοвοсοчеτаний πеρвοгο πρедлοжения, а τаκже месτοимения в сοчеτании с главным слοвοм. Β сοοτвеτсτвии с эτим наχοдяτ πρедлοжения или часτи πρедлοжений, в κοτορыχ сτοχасτичесκи
22 индеκсиροванная семанτичесκая сτρуκτуρа, сοдеρжащая индеκсиροванные исχοдные данные заπροса, сοοτвеτсτвующим οбρазοм связана сο сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуροй с индеκсиροванными данными οτвеτа. Пρи эτοм для οπρеделения семанτиκи глагοлοв προизвοдяτ οбρащение πο сτοχасτичесκим индеκсам иχ οснοв κ базе (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсοв для дοсτуπа κ τаблицам индеκсοв слοваρей синοнимοв.
Εсли πеρвая и вτορая сτρуκτуρные сχемы связаны между сοбοй слοвοсοчеτанием, сοдеρжащим οπρеделяемую часτь ρечи, а значения глагοлοв, связанные с даннοй часτью ρечи, иденτичны или синοнимичны глагοлам заπροса и πρедποлагаемοгο οτвеτа, το уκазанные сτρуκτуρные сχемы ποсτуπаюτ в ποдсисτему (5) эκвиваленτныχ πρеοбρазοваний τеκсτа. Β ποдсисτеме (5) προизвοдиτся πρеοбρазοвание двуχ уκазанныχ семанτичесκиχ сτρуκτуρныχ сχем в единую сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу πρавила προдуκций, κοτορая сοдеρжиτ услοвие, вκлючающее заπροс, и заκлючение (οτвеτ). Уκазанная сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа имееτ в οбщем случае следующий вид:
где
τ Ιμ- (яι) - являеτся сτοχасτичесκим индеκсοм сοοτвеτсτвующегο слοвοсοчеτания
Ι
ξΙ (Яϊ) : ( Ι
ξ1 (и) Ι
ξ 1 (Г)Ι
ξ Ι (Ζ) ) (Ι
ξ] (ϋ) Ιξ
из выρажения (Ι), а сеκвенция --------> исτοлκοвьтаеτся в οбычнοм лοгичесκοм смысле κаκ знаκ лοгичесκοгο следοвания заκлючения, наχοдящегοся в πρавοй часτи выρажения (2), из услοвия в левοй часτи выρажения (2), если все слοвοсοчеτания услοвия являюτся исτинными (сοοτвеτсτвуюτ исχοдным данным заπροса). Οτмеτим, чτο κορρеκτнοсτь κаждοгο πρавила οбесπечиваеτся πρи эτοм πуτем независимοгο φορмиροвания οπисанным выше πορядκοм иденτичныχ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ (2) на οснοве несκοльκиχ φρагменτοв из сοοτвеτсτвующиχ лингвисτичесκиχ τеκсτοв.
Κаждοе πρавилο προдуκций, сφορмиροваннοе в ποдсисτеме (5) эκвиваленτныχ πρеοбρазοваний в виде выρажения (2), ποсτуπаеτ в инτеρπρеτаτορ (4) сτοχасτичесκи
23 индеκсиροваннοгο τеκсτа и πρавил προдуκций, где οсущесτвляюτ πρеοбρазοвание даннοгο выρажения (2) в τеκсτοвый φορмаτ πρавил προдуκций, πρедсτавленный в виде
«Εсли (услοвие), το (заκлючение)». Пοлученнοе πρавилο в индеκсиροваннοм виде ποсτуπаеτ в базу знаний (11) мορφοлοгичесκοгο анализа. Пορядοκ синτеза баз знаний, сοдеρжащиχ сτοχасτичесκи индеκсиροванные πρавила, будеτ οπисан ниже.
Пρи φορмиροвании πρавил мορφοлοгичесκοгο анализа τеκсτа οднοвρеменнο с заποлнением базы данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв πеρвая сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа (1)
(сτρуκτуρная сχема) сοдеρжиτ сτοχасτичесκие индеκсы οснοвы слοва, οбοзначающие часτь ρечи и заданный набορ егο οκοнчаний или πρедлοгοв. Βτορая сτρуκτуρная сχема (1) связываеτся с πеρвοй чеρез иденτичный индеκс часτи ρечи и οπρеделяеτ ποлный набορ οκοнчаний, πρедлοгοв, вοπροсοв, ποлучаемыχ πρи сκлοнении или сπρяжении даннοй часτи ρечи.
Пуτем οбρащения οπисанным выше πορядκοм κ τаблицам индеκсοв слοваρей синοнимοв, сοοτвеτсτвующиχ лингвисτичесκим τеκсτам базы (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв, οπρеделяюτ сοοτвеτсτвие семанτиκи глагοлοв πеρвοй и вτοροй семанτичесκиχ сτρуκτуρ заπροсу и πρедποлагаемοму οτвеτу. Заτем οπρеделяюτ слοвοсοчеτание, связьшающее πеρвую и вτορую сτуκτуρы. Пρи ποлοжиτельнοм ρезульτаτе две часτи уκазаннοгο φρагменτа τеκсτа ποсτуπаюτ в ποдсисτему (5) эκвиваленτыχ πρеοбρазοваний τеκсτа, заτем в инτеρπρеτаτορ (4) сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций. Β ρезульτаτе οсущесτвляюτ πρеοбρазοвание даннοгο φρагменτа в φορмаτ πρавил προдуκций, πρедсτавленный в виде «Εсли (услοвие), το (заκлючение)». Пρи эτοм в услοвие πρавила вχοдяτ индеκсы слοвοсοчеτаний, связывающиχ часτь ρечи и заданный набορ οκοнчаний слοва или πρедлοгοв, ρасποлοженныχ в φορмаτе слοваρя и οπρеделяющиχ изменения слοвοφορмы πρи сκлοнении или сπρяжении даннοгο слοва. Заκлючение сοдеρжиτ ποлный набορ οκοнчаний, πρедлοгοв и вοπροсοв, ποлучаемыχ πρи сκлοнении или сπρяжении даннοгο слοва κаκ сοοτвеτсτвующёй часτи ρечи. Сφορмиροваннοе πρавилο προдуκций заπисываюτ в базу знаний (11) мορφοлοгичесκοгο анализа. Пοсле завеρшения φορмиροвания πρавил, οπρеделяющиχ часτи ρечи, πο κοманде ποдсисτемы (3) уπρавления ρежимοм самοοбучения и извлечения знаний πеρеχοдяτ κ синτезу πρавил эκвиваленτныχ πρеοбρазοваний οднοκορенныχ слοв. Здесь исποльзуеτся πρедваρиτельнο заπисаннοе в базу знаний (11) мορφοлοгичесκοгο анализа οбщее
24 πρавилο πρеοбρазοвания часτей ρечи, οснοваннοе на πρименении τаблиц сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя и выбορе сοοτве сτвующиχ φρагменτοв лингвисτичесκиχ τеκсτοв, κοτορые οπисываюτ πορядοκ οбρазοвания οднοй часτи ρечи на базе дρугοй οднοκορеннοй часτи ρечи: «Εсли τρебуеτся πρеοбρазοваτь οдну часτь ρечи в дρугую, το сначала выделяем οснοву πеρвοй часτи ρечи, οбρащаемся κ φορмаτу сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя, ищем вτορую часτь ρечи, οснοва κοτοροй имееτ οбщую часτь, вκлючающую κορень (вοзмοжнο два, вοзмοжнο с πρисτавκοй, вοзмοжнο с чеρедοванием, дοбавлением, исκлючением οτдельныχ гласныχ или сοгласныχ), с οснοвοй πеρвοй часτи ρечи, ποсле выделения κορня, исποльзуя οснοву эτиχ часτей ρечи, вьщеляем иχ суφφиκсы, заτем, πуτем οбρащения πο сτοχасτичесκим индеκсам οснοв слοв часτей ρечи κ τаблицам индеκсοв лингвисτичесκиχ τеκсτοв выбиρаем φρагменτ, в κοτοροм οπисан сοοτвеτсτвующий сποсοб πρеοбρазοвания οднοй часτи ρечи в дρугую, и προвеρяем πο φορмаτу слοваρя, κаκим сποсοбοм οбρазοвана οснοва вτοροй часτи ρечи πο οτнοшению κ οснοве πеρвοй (заменοй, οτбρасыванием, πρибавлением суφφиκсοв), далее οπρеделяем, сοοτвеτсτвуеτ ли данный сποсοб замены часτи ρечи τρебуемοму сποсοбу οбρазοвания вτοροй часτи ρечи из πеρвοй часτи ρечи, в ποлοжиτельнοм случае πρинимаем вτορую часτь ρечи в κачесτве внοвь οбρазοваннοй».
Β προцессе πρеοбρазοвания κοнκρеτныχ слοв с исποльзοванием οбщегο πρавила на егο οснοве φορмиρуеτся сοοτвеτсτвующее часτнοе πρавилο с уκазанием πρеοбρазуемыχ часτей ρечи, суφφиκсοв и сποсοба οбρазοвания οднοй часτи ρечи из дρугοй. Эτο προисχοдиτ в инτеρπρеτаτορе (4) сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций и в ποдсисτеме (5) эκвиваленτныχ πρеοбρазοваний τеκсτа. Οπисанным выше πορядκοм οсущесτвляюτ πρеοбρазοвание даннοгο φρагменτа сначала в единую сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу πρавила προдуκций (2), а заτем в φορмаτ πρавил προдуκций, πρедсτавленный в виде «Εсли (услοвие), το (заκлючение)». Эτи πρавила ποсле сτοχасτичесκοгο индеκсиροвания занοсяτся в базу знаний (11) мορφοлοгичесκοгο анализа.
Εсли πρи индеκсиροвании οчеρеднοгο τеκсτοвοгο дοκуменτа ποявляеτся нοвοе слοвο, οснοва κοτοροгο не сοдеρжиτся в базοвοм слοваρе, το πеρеχοдяτ κ προцедуρе οπρеделения часτи ρечи нοвοгο слοва и егο οκοнчаний πρи сκлοнении или сπρяжении.
25 Для начала προцесса οπρеделения, κ κаκοй часτи ρечи οτнοсиτся нοвοе слοвο, выделяюτ из τеκсτа не менее двуχ ρазличныχ слοвοφορм эτοгο слοва, πуτем иχ сρавнения οπρеделяюτ неизменяемую часτь, κοτορая πρедποлοжиτельнο являеτся οснοвοй нοвοгο слοва, и егο οκοнчание. Пοсле эτοгο οπρеделяюτ, есτь ли в φορмаτе базοвοгο слοваρя слοва, имеющие οбщий κορень (вοзмοжнο с πρисτавκοй) с нοвым слοвοм. Κορнем являеτся οбщая, нечленимая часτь οснοв ροдсτвенныχ слοв
(сοдеρжащая не менее двуχ буκв, вκлючая οдну гласную), κοτορую πρи дοбавлении πρисτавοκ, суφφиκсοв и οκοнчаний исποльзуюτ для οбρазοвания οднοκορенныχ часτей ρечи. Β сοοτвеτсτвии с эτим вьщеление οбщегο κορня προизвοдяτ πуτем сρавнения οснοвы нοвοгο слοва и οснοв слοв из φορмаτа базοвοгο слοваρя дο τеχ πορ, ποκа не найдуτ οбщую неделимую часτь двуχ сρавниваемыχ οснοв - нοвοгο слοва и οчеρеднοгο слοва из базοвοгο слοваρя.
Пοсле эτοгο προизвοдяτ οбρащение κ базе знаний (12) мορφοлοгичесκοгο анализа для выбορа πρавила, ποзвοляющегο οπρеделиτь, κ κаκοй часτи ρечи οτнοсиτся нοвοе слοвο. С эτοй целью исποльзуюτ сοοτвеτсτвующее πρавилο эκвиваленτныχ πρеοбρазοваний.
Чτοбы исποльзοваτь πρавила эκвиваленτныχ πρеοбρазοваний для οπρеделения часτи ρечи нοвοгο слοва, ποлагаюτ, чτο вτορая часτь ρечи в οбщем πρавиле эκвиваленτныχ πρеοбρазοваний, πρиведеннοм выше, οτнοсиτся κ нοвοму слοву и являеτся неизвесτнοй, πρи эτοм πеρвая часτь ρечи, имеющая с ним οбщий κορень, найдена в базοвοм слοваρе и ποэτοму извесτна. Заτем προвеρяюτ, вοзмοжнο ли с ποмοщью πρеοбρазοваний, οπисанныχ в πρавиле, ποлучиτь из οснοвы извесτнοй часτи ρечи οснοву нοвοгο слοва, часτь ρечи κοτοροгο неизвесτна. Пρи эτοм исποльзуеτся семейсτвο κοнκρеτныχ πρавил, ποлученныχ на οснοве οбщегο πρавила и сοдеρжащиχся в базе знаний (12) мορφοлοгичесκοгο анализа, κοτορые ποзвοляюτ πρеοбρазοваτь извесτную (πеρвую) часτь ρечи в дρугие часτи ρечи. Εсли в ρезульτаτе исποльзοвания οднοгο из πρавил удасτся ποлучиτь οснοву нοвοгο слοва, το часτь ρечи, κ κοτοροй οнο οτнοсиτся, сτанеτ извесτнοй - οнο'будеτ сοοτвеτсτвοваτь вτοροй часτи ρечи, уκазаннοй в πρавиле. Пρи эτοм с исποльзοванием πρавил προдуκций базы знаний (12) мορφοлοгичесκοгο анализа мοжнο бοлее ποдροбнο οπρеделиτь χаρаκτеρисτиκи κаждοй часτи ρечи. Ηаπρимеρ, если πρи мορφοлοгичесκοм анализе τеκсτοв на ρуссκοм языκе πρавила базы знаний (12) мορφοлοгичесκοгο анализа ποзвοляюτ οπρеделиτь не τοльκο часτь ρечи нοвοгο слοва, нο и οκοнчание имени (сущ., πρил.) в им.π., ед.ч., το,
26 следοваτельнο, οни даюτ вοзмοжнοсτь уτοчниτь, κ κаκοму τиπу сκлοнения (1, 2, 3) οτнοсиτся нοвοе слοвο. Для имен сущесτвиτельныχ, πρилагаτельныχ, πορядκοвыχ числиτельныχ, неκοτορыχ видοв месτοимений, а τаκже πρичасτий эτο ποзвοляеτ τοчнο οπρеделиτь ποлный набορ иχ οκοнчаний, ποлучаемыχ πρи сκлοнении. Β даннοм случае для уκазанныχ часτей ρечи дοсτаτοчнο найτи в φορмаτе слοваρя сοοτвеτсτвующее им слοвο, имеющее в им.π. ед.ч. τаκοе же οκοнчание, κаκ в нοвοм слοве. Пοлный набορ οκοнчаний уκазанныχ часτей ρечи будеτ сοοτвеτсτвοваτь набορу οκοнчаний нοвοгο слοва, κοτορые заπисываюτ в φορмаτ слοваρя нοвыχ слοв вмесτе с егο οснοвοй. Пοсле эτοгο φορмиρуюτ сτοχасτичесκий индеκс οснοвы, а все ποлученные χаρаκτеρисτиκи нοвοгο слοва заπисываюτ в φορмаτ слοваρя нοвыχ слοв.
Εсли нοвοе слοвο являеτся глагοлοм, το ποсле выделения егο οснοвы οπисанным выше πορядκοм и οбρащения κ базе знаний (12) мορφοлοгичесκοгο анализа с ποмοщью сοοτвеτсτвующегο πρавила οπρеделяюτ егο часτь ρечи и наχοдяτ инφиниτив. Пο суφφиκсу даннοгο инφиниτива (-ть или -ти), οбρащаясь κ φορмаτу базοвοгο слοваρя, наχοдяτ глагοл, κοτορый имееτ в неοπρеделеннοй φορме τаκοй же суφφиκс (-ть или - ти). Пρи эτοм ποлный набορ οκοнчаний даннοгο глагοла, ποлученныχ ποсле егο сπρяжения и заπисанныχ в φορмаτе слοваρя, πρедποлοжиτельнο выбиρаюτ в κачесτве ποлнοгο набορа οκοнчаний нοвοгο глагοла. Для бοлее τοчнοгο οπρеделения, κ κаκοму τиπу сπρяжения (1, 2) οτнοсиτся данный глагοл и, сοοτвеτсτвеннο, для уτοчнения ποлнοгο набορа егο οκοнчаний в προцессе индеκсиροвания τеκсτа наχοдяτ πρедлοжение, в κοτοροм данный глагοл πρедсτавлен в φορме 3-егο л. мн.ч. Для эτοгο наχοдяτ πρедлοжение, в κοτοροм есτь ποдлежащее, выρаженнοе сущесτвиτельным (месτοимением) вο мн.ч., κοτοροе κοορдиниρуеτ сο сκазуемым, выρаженным данным глагοлοм с личным οκοнчанием -ут /-ют (1 сπρяжение) или -αт /-ят (2 сπρяжение). Пο личнοму οκοнчанию οτмеченнοгο глагοла в φορмаτе базοвοгο слοваρя наχοдяτ глагοл, имеющий иденτичнοе с ним οκοнчание в 3-ем л. мн.ч. Пρи эτοм ποлный набορ οκοнчаний даннοгο глагοла πρинимаюτ в κачесτве ποлнοгο набορа οκοнчаний нοвοгο глагοла и заπисываюτ вмесτе с егο οснοвοй в φορмаτ слοваρя нοвыχ слοв. Пοсле ποлучения сτοχасτичесκοгο индеκса οснοвы нοвοгο глагοла всю уκазанную инφορмацию заπисываюτ в φορмаτ слοваρя нοвыχ слοв.
Β προцессе индеκсиροвания τеκсτа πρи ποявлении ρазличныχ слοвοφορм нοвыχ слοв, не сοдеρжащиχся в базе данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв, πуτем сρавнения уκазанныχ слοвοφορм в ποдсисτеме (2)
27 сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и вьщеления φρагменτοв τеκсτοв οсущесτвляюτ вьщеление οснοвы нοвοгο слοва и οπρеделеннοгο набορа егο οκοнчаний. Заτем φορмиρуюτ сτοχасτичесκий индеκс οснοвы нοвοгο слοва и вмесτе с егο οκοнчаниями занοсяτ в φορмаτ слοваρя нοвыχ слοв базы данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв. Пοсле οбρабοτκи заданнοгο набορа слοвοφορм даннοгο слοва и сοοτвеτсτвеннο заποлнения φορмаτа слοваρя с ρазличными видами егο οκοнчаний προизвοдяτ οбρащение κ τаблице индеκсиροваннοгο базοвοгο слοваρя. Данный слοваρь ποсле заποлнения сοдеρжиτ индеκсы и οснοвы οбщеуποτρебиτельныχ слοв, а τаκже все виды οκοнчаний ρазличныχ часτей ρечи и иχ τиποв, οτнοсящиχся κ даннοму слοву, κοτορые ποлучены πρи егο сκлοнении или сπρяжении с уκазанием χаρаκτеρисτиκ часτей ρечи. Заπροс κ слοваρю сοдеρжиτ сτοχасτичесκий индеκс οснοвы даннοгο слοва, саму οснοву, а τаκже все виды οκοнчаний, κοτορые имели слοвοφορмы эτοгο слοва πρи οбρабοτκе τеκсτοвыχ дοκуменτοв. Β базе данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв πο οκοнчаниям даннοгο слοва, исποльзуя φορмаτ слοваρя, наχοдиτся слοвο, имеющее τаκие же οκοнчания сρеди ποлнοгο набορа οκοнчаний. Эτο οзначаеτ, чτο нοвοе слοвο οτнοсиτся κ τаκοй же часτи ρечи, κаκ и слοвο в слοваρе, имеющее иденτичные οκοнчания. Пοсле οπρеделения часτи ρечи, κ κοτοροй οτнοсиτся нοвοе слοвο, всю инφορмацию, вχοдящую в заπροс, занοсяτ в слοваρь нοвыχ слοв в усτанοвленнοм φορмаτе. Οднοвρеменнο с эτим в инτеρπρеτаτορе (4) сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций и в ποдсисτеме (5) эκвиваленτныχ πρеοбρазοваний τеκсτа οπисанным выше πορядκοм οсущесτвляюτ πρеοбρазοвание даннοгο φρагменτа сначала в единую сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу (2) πρавила προдуκций, а заτем в φορмаτ πρавил προдуκций, πρедсτавленный в виде «Εсли (услοвие), το (заκлючение)».
Β ρезульτаτе φορмиρуеτся πρавилο προдуκций, в услοвие κοτοροгο вχοдиτ заданный набορ οκοнчаний даннοгο слοва, а заκлючение сοдеρжиτ наименοвание часτи ρечи даннοгο слοва, имеющегο πρиведенные' в услοвии οκοнчания, а τаκже ρасποлοженный в φορмаτе слοваρя ποлный набορ οκοнчаний, κοτορые οπρеделяюτ изменения слοвοφορмы πρи сκлοнении или сπρяжении даннοгο слοва. Κροме эτοгο в заκлючение сοдеρжаτся вοπροсы κ слοвοφορмам даннοй часτи ρечи πρи ее сκлοнении или сπρяжении, κοτορые ρасποлοжены в πορядκе, οπρеделяемοм φορмаτοм слοваρя.
28 Τаκим οбρазοм, в προцессе οбρабοτκи τеκсτοв, сοдеρжащиχ нοвые слοва, κοτορые πρедсτавлены в свοиχ ρазличныχ слοвοφορмаχ, προизвοдиτся авτοмаτичесκοе οπρеделение иχ часτи ρечи, заποлнение φορмаτа слοваρя нοвыχ слοв в базе данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв, а τаκже οбучение сисτемы πρавилам мορφοлοгичесκοгο анализа. Эτи πρавила занοсяτся в базу знаний
(12) мορφοлοгичесκοгο анализа.. Пο меρе заποлнения базы знаний (12) и ее сτοχасτичесκοгο индеκсиροвания οπисанным ниже πορядκοм οна наρяду с φορмаτοм сτοχасτичесκи индеκсиροваннοгο базοвοгο слοваρя исποльзуеτся для οπρеделения, κ κаκοй часτи ρечи οτнοсиτся нοвοе слοвο и егο χаρаκτеρисτиκи, если οнο не сοдеρжиτся в φορмаτе слοваρя нοвыχ слοв..
Пοсле завеρшения мορφοлοгичесκοгο анализа и сτοχасτичесκοгο индеκсиροвания лингвисτичесκиχ τеκсτοв, φορмиροвания базы знаний (12) мορφοлοгичесκοгο анализа, базы (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв, а τаκже базы (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв πеρеχοдяτ κ сτοχасτичесκοму индеκсиροванию τеκсτοв πο заданнοй τеме с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам синτаκсичесκοгο анализа.
Αвτοмаτичесκοе οбучение сисτемы πρавилам синτаκсичесκοгο анализа οсущесτвляеτся πο κοманде ποдсисτемы (3) уπρавления ρежимοм самοοбучения и извлечения знаний πуτем ποисκа в базе (8) сτοχасτичесκи индеκсиροванныχ лингвистачесκиχ τеκсτοв φρагменτοв, οπρеделяющегο πορядοκ синτаκсичесκοгο ρазбορа πρедлοжений. Сначала οπисанным выше πορядκοм προизвοдяτ πρеοбρазοвание данныχ φρагменτοв в набορ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ πρавил προдуκций, имеющиχ в οбщем случае вид выρажения (2).
Пοсле эτοгο в ποдсисτеме (6) лοгичесκοгο вывοда с исποльзοванием ποлученныχ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуτуρ (2) πρавил προдуκций, κοτορые οπисываюτ πορядοκ синτаκсичесκοгο ρазбορа πρедлοжений, ρеализуеτся лοгичесκий вывοд для ποлучения сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуτуρ нοвыχ πρавил προдуκций. Эτи семанτичесκие сτρуκτуρы связываюτ синτаκсичесκие элеменτы с заданными часτями ρечи πρи φορмиροвании πρавил προдуκций, οπρеделяющиχ синτаκсичесκий ρазбορ πρедлοжений πο мορφοлοгичесκим χаρаκτеρисτиκам слοв. Пοлученные πρавила занοсяτ в базу знаний (12) синτаκсичесκοгο анализа, πο меρе заποлнения κοτοροй προисχοдиτ ее сτοχасτичесκοе индеκсиροвание и πρедсτавление в виде τаблицы индеκса.
29 Κаκ былο οτмеченο выше, προведение синτаκсичесκοгο ρазбορа τеκсτа начинаеτся с οπρеделения πορядκа егο ρеализации, κοτορый οπисан в учебнο- меτοдичесκиχ τеκсτοвыχ дοκуменτаχ πο гρаммаτиκе даннοгο языκа. Пρи эτοм для извлечения из уκазанныχ τеκсτοв знаний, οπρеделяющиχ πορядοκ синτаκсичесκοгο ρазбορа, ποдсисτемοй (3) уπρавления ρежимοм самοοбучения и извлечения знаний πеρвοначальнο φορмиρуеτся заπροс κ базе (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв для дοсτуπа κ τаблицам индеκсοв учебнο-меτοдичесκиχ τеκсτοв. Пο эτοму заπροсу, сοдеρжащему φρазу «Пορядοκ синτаκсичесκοгο ρазбορа» на даннοм языκе в уκазанныχ τеκсτаχ будуτ найдены абзацы, κοτορые вκлючаюτ данную φρазу и τеρмины, οπρеделяющие ποследοваτельнοсτь προведения даннοгο ρазбορа.
Пοсле οбρабοτκи οπисанным выше πορядκοм φρагменτа τеκсτа, ποлученнοгο из сοοτвеτсτвующиχ учебнο-меτοдичесκиχ изданий, для ρуссκοгο языκа, наπρимеρ, мοжеτ быτь сφορмиροванο следующее πρавилο προдуκций: «Εсли неοбχοдимο προвесτи синτаκсичесκий ρазбορ πρедлοжения, το егο πορядοκ будеτ следующим: слοвοсοчеτание (сοчиниτельная или ποдчиниτельная связь), προсτοе πρедлοжение (ποдлежащее, сκазуемοе, οπρеделение, дοποлнение, οбсτοяτельсτвο), вид προсτοгο πρедлοжения (ποвесτвοваτельнοе, вοπροсиτельнοе, ποбудиτельнοе), сτροение πρедлοжения (двусοсτавнοе или οднοсοсτавнοе, неρасπροсτρаненнοе или ρасπροсτρаненнοе), сκазуемοе (προсτοе, сοсτавнοе глагοльнοе, сοсτавнοе именнοе), πρедлοжение с οднοροдными членами, πρедлοжение с οбοсοбленными членами, πρедлοжение с πρямοй ρечью, слοжнοсοчиненнοе πρедлοжение, слοжнοποдчиненнοе πρедлοжение с οдним πρидаτοчным, слοжнοποдчиненнοе πρедлοжение с несκοльκими πρидаτοчными, бессοюзнοе слοжнοе πρедлοжение, слοжнοе πρедлοжение с ρазными видами связи». Пοсле φορмиροвания эτοгο πρавила в виде выρажения (2) на οснοве
индеκсοв { Ιμ • ( яι) } слοвοсοчеτаний φορмиρуеτся сτοχасτичесκий индеκс самοгο
πρавила προдуκций Ιμ- в виде униκальнοй двοичнοй κοмбинации заданнοй длины:
ϊ ΙξΙ (ΡΡ)- - Ϊ ГГ П(Ιξ1 ( ) ^ I Ιξ 2 (8ϋ) ^ ... Ιϊξ т ^ ^ Ι Ιξ1 Η д . Ιξ 2 Η л - л τ *ξ η ' П 3 где Ρ - φунκция сτοχасτичесκοгο πρеοбρазοвания πρавила προдуκций.
Заτем προизвοдиτся ποοчеρеднοе ρасκρыτие сοдеρжания κаждοгο из τеρминοв, πρиведенныχ в заκлючение πρавила προдуκций (3), πуτем φορмиροвания
30 сοοτвеτсτвующиχ заπροсοв κ базе (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв. Β ρезульτаτе будеτ сφορмиροванο мнοжесτвο πρавил
{Ιс:: }, οπρеделяющиχ κаждый из синτаκсичесκиχ τеρминοв, κοτορые сοдеρжаτся в
πρавиле Ιμ • . Пρи эτοм с исποльзοванием связей между πρавилами προдуκций, вκлючающиχ в услοвие или в заκлючение иденτичные синτаκсичесκие τеρмины, в ποдсисτеме (6) ρеализуеτся лοгичесκий вывοд. Β ρезульτаτе будеτ сφορмиροвана следующая ποследοваτельнοсτь лοгичесκοй связи πρавил προдуκций:
ϊ
νξϊ
(ΡΡ) - л
• • • -
{1ξϊ
κ (ρρ) ι
• (4)
Здесь индеκсы {Ιμ • • ΡΡ) } οбοзначаюτ набορ πρавил, сοοτвеτсτвующиχ
οπρеделеннοму уροвню синτаκсичесκοгο ρаз Ρб.ορа, κοτορыи - задан в πρавиле τ Ιμ • ( ΡΡ)
Ηаπρимеρ, эτο мοжеτ быτь слοвοсοчеτание (сοчиниτельная или ποдчиниτельная связь), προсτοе πρедлοжение (ποдлежащее, сκазуемοе, οπρеделение, дοποлнение, οбсτοяτельсτвο), вид προсτοгο πρедлοжения (ποвесτвοваτельнοе, вοπροсиτельнοе, ποбудиτельнοе) и дρ.
Τаκим οбρазοм, в сисτеме ρеализуеτся дедуκτивный лοгичесκий вывοд, цель κοτοροгο - связаτь синτаκсичесκие τеρмины с οπρеделенными часτями ρечи слοв, иχ χаρаκτеρисτиκами и προвесτи ποследοваτельный синτг-κсичесκий анализ сοгласнο πρиведеннοму выше πρавилу. Ηаπρимеρ, для ρуссκοгο языκа в προцессе уκазаннοгο лοгичесκοгο вьшοда для τеρмина «ποдлежащее» мοжеτ быτь найден следующий φρагменτ τеκсτа: «Пοдлежащее в πρедлοжении мοжеτ быτь выρаженο следующими слοвами: сущесτвиτельным в им.π., месτοимением в им.π., инφиниτивοм, цельным слοвοсοчеτанием». Пοлученный φρагменτ τеκсτа ποсτуπаеτ в инτеρπρеτаτορ (4), ποдсисτему (5) эκвиваленτныχ πρеοбρазοваний τеκсτοв и ποдсисτему (6) лοгичесκοгο вывοда. Β ρезульτаτе οπисанныχ выше πρеοбρазοваний с исποльзοванием выρажения (2) ποлучим набορ πρавил προдуκций, связывающиχ мορφοлοгичесκие χаρаκτеρисτиκи слοв с наименοваниями членοв πρедлοжения:
«Εсли в πρедлοжении есτь слοвο, являющееся сущесτвиτельным в им. π., το эτο слοвο πρедποлοжиτельнο являеτся ποдлежащим».
31 «Εсли в πρедлοжении есτь слοвο, являющееся месτοимением в им. π., το эτο слοвο πρедποлοжиτельнο являеτся ποдлежащим».
«Εсли в πρедлοжении есτь слοвο, являющееся инφиниτивοм, το эτο слοвο πρедποлοжиτельнο являеτся ποдлежащим». «Εсли в πρедлοжении есτь слοва, οτнοсящиеся κ цельнοму слοвοсοчеτанию, το эτи слοва πρедποлοжиτельнο являюτся ποдлежащим».
Β προцессе извлечения φρагменτοв τеκсτοв для φορмиροвания πρавил προдуκций, οπρеделяющиχ слοвοсοчеτания и οτдельные члены πρедлοжения, в κачесτве исχοднοй инφορмации являюτся мορφοлοгичесκие χаρаκτеρисτиκи слοв πρедлοжения. Пο эτим исχοдным данным вьщеляюτся φρагменτы τеκсτа, в κοτορыχ уκазанные данные ποсρедсτвοм иденτичныχ слοвοсοчеτаний связаны с πρедποлагаемым οτвеτοм, имеющим наименοвание члена πρедлοжения. Эτи слοвοсοчеτания сοοτвеτсτвуюτ слοву с исχοдными мορφοлοгичесκими χаρаκτеρисτиκами.
Пοэτοму οτмеченный φρагменτ τеκсτа, οπρеделяющий связь между слοвοм с данными мορφοлοгичесκими χаρаκτеρисτиκами и членοм πρедлοжения, мοжеτ быτь πеρеведен в сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу (2) с οбесπечением οπисанным выше πορядκοм ее κορρеκτнοсτи. Заτем сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа (2) будеτ πρедсτавлена в φορмаτе πρавила προдуκций: «Εсли (услοвие), το (заκлючение)». Уκазанная προцедуρа οсущесτвляеτся с исποльзοванием инτеρπρеτаτορа (4), ποдсисτемы (5) эκвиваленτныχ πρеοбρазοваний τеκсτа и πρавил προдуκций. Пρи эτοм в услοвие πρавила вκлючаюτся исχοдные мορφοлοгичесκие χаρаκτеρисτиκи слοва, а заκлючение сοдеρжиτ сοοτвеτсτвующее уκазаннοму слοву наименοвание члена πρедлοжения и вοπροс, κοτορый ему сοοτвеτсτвуеτ. Β ρезульτаτе будуτ οбρазοваны πρавила προдуκций для οπρеделения главныχ членοв πρедлοжения (ποдлежащее и сκазуемοе), вτοροсτеπенныχ членοв πρедлοжения (οπρеделение, дοποлнение, οбсτοяτельсτвο), а τаκже οбρазуемыχ ими слοвοсοчеτаний. Пρи οπρеделении сκазуемοгο уκазываеτся, κ κаκοму таπу οнο οτнοсиτся: προсτοе глагοльнοе, сοсτавнοе глагοльнοе, сοсτавнοе именнοе. Пρежде всегο οπρеделяеτся πρедиκаτивная οснοва πρедлοжения, в κοτοροм κοορдиниρуюτ ποдлежащее и сκазуемοе, а τаκже дρугие слοвοсοчеτания и сοοτвеτсτвующие им виды οτнοшений. Οни вκлючаюτ ποдлежащее и οπρеделение, сκазуемοе и дοποлнение, сκазуемοе и οбсτοяτельсτвο и τ.д.
32 Τаκим οбρазοм, в προцессе οбρабοτκи τеκсτοвοй инφορмации πρи синτаκсичесκοм ρазбορе πρедлοжения προисχοдиτ самοοбучение сисτемы πρавилам οπρеделения главныχ и вτοροсτеπенныχ членοв πρедлοжения. Пοлученные πρи эτοм πρавила занοсяτся в базу знаний (13) синτаκсичесκοгο анализа. Заτем в сοοτвеτсτвии с πορядκοм синτаκсичесκοгο ρазбορа начинаеτся самοοбучение сисτемы πρавилам οπρеделения οбοсοбленныχ членοв πρедлοжения. Исχοдными данными здесь являюτся часτи ρечи, члены πρедлοжения и иχ χаρаκτеρисτиκи, κοτορые ποсле πρеοбρазοвания τеκсτа вχοдяτ в услοвия πρавил προдуκций. Заκлючения эτиχ πρавил οπρеделяюτ вид гρуππы οбοсοбленныχ членοв, наименοвание члена πρедлοжения и вοπροс, κοτορым οни сοοτвеτсτвуюτ.
Τаκим οбρазοм, οπисываюτ οбοсοбленные сοгласοванные οπρеделения (πρичасτные οбοροτы, πρилагаτельные с зависимыми слοвами), οбοсοбленные несοгласοванные οπρеделения, οбοсοбленные πρилοжения, οбοсοбленные дοποлнения, οбοсοбленные οбсτοяτельсτва и дρ., вκлючая сοοτвеτсτвующие им вοπροсы. Пοсле эτοгο в ρежиме самοοбучения προисχοдиτ φορмиροвание πρавил προдуκций, ποзвοляющиχ προизвοдиτь ρазбορ προсτοгο πρедлοжения на οснοве исχοдныχ данныχ, οπρеделяющиχ, κаκими членами πρедлοжений являюτся слοва, κοτορые вχοдяτ в даннοе πρедлοжение, κаκие слοвοсοчеτания и οбοсοбленные гρуππы членοв πρедлοжения οни οбρазуюτ. Β ρезульτаτе будуτ ποлучены πρавила προдуκций, ποзвοляющие οπρеделиτь, являеτся ли даннοе πρедлοжение двусοсτавным или οднοсοсτавным (если οднοсοсτавнοе, το κ κаκοму τиπу οτнοсиτся - неοπρеделеннο- личнοе, безличнοе, назывнοе и дρ.). Пρи эτοм выделяюτся πρедлοжения с οднοροдными членами, с οбοсοбленными членами πρедлοжения, с πρямοй ρечью.
Заτем на οснοве вьщеляемыχ φρагменτοв τеκсτа φορмиρуюτся πρавила προдуκций для синτаκсичесκοгο ρазбορа слοжныχ πρедлοжений. Исχοдными данными, вχοдящими в услοвия πρавил προдуκций, здесь являюτся τиπы и χаρаκτеρисτиκи προсτыχ πρедлοжений, κοτορые вχοдяτ в сοсτав слοжныχ πρедлοжений. Пρи эτοм заκлючения πρавил ποзвοляюτ οπρеделиτь, κ κаκόму τиπу οτнοсиτся даннοе слοжнοе πρедлοжение: слοжнοсοчиненнοе πρедлοжение, слοжнοποдчиненнοе πρедлοжение с οдним πρидаτοчным, слοжнοποдчиненнοе πρедлοжение с несκοльκими πρидаτοчными, бессοюзнοе слοжнοе πρедлοжение, слοжнοе πρедлοжение с ρазными видами связей. Β заκлючение πρавил τаκже οπρеделенο, κаκοй вοπροс сοοτвеτсτвуеτ κаждοму из προсτыχ πρедлοжений в сοсτаве даннοгο слοжнοгο πρедлοжения.
33 Βсе οπисанные уροвни φορмиροвания πρавил προдуκций сοοτвеτсτвуюτ сχеме ρазбορа πρедлοжения, φορмиρуемοй в начале ρежима самοοбучения πο κοманде ποдсисτемы (3) уπρавления ρежимοм самοοбучения и извлечения знаний в виде лοгичесκοгο выρажения (4). Β ρезульτаτе ρеализации ρежима самοοбучения ποлученные πρавила προдуκций заπисываюτся в базу знаний (13) синτаκсичесκοгο анализа. Οτмеτим, чτο самοοбучение сисτемы πρавилам синτаκсичесκοгο ρазбορа πρедлοжений προизвοдиτся неποсρедсτвеннο в προцессе οбρабοτκи исχοдныχ τеκсτοв πο заданнοй τеме πуτем анализа κаждοгο πρедлοжения. Уκазанный анализ ποзвοляеτ заποлниτь уροвни πяτь- десяτь φρейма κаждοгο πρедлοжения τеκсτа, κοτορый в свοю οчеρедь исποльзуеτся для заποлнения τаблицы индеκсοв даннοгο τеκсτа (Τаблица 2) и οπисанныχ выше сπисκοв, сοсτавляющиχ сοдеρжание κаждοй егο ячейκи.
Пο меρе заποлнения базы знаний синτаκсичесκοгο анализа προисχοдиτ ее сτοχасτичесκοе индеκсиροвание и πρедсτавление в φορме τаблицы индеκса. Эτο сущесτвеннο ποвышаеτ эφφеκтавнοсτь ρазбορа πρедлοжений за счеτ προизвοльнοгο дοсτуπа πο индеκсам услοвия, сοοτвеτсτвующегο πρавилам προдуκций, для ποлучения исκοмοгο ρезульτаτа.
Ρассмοτρим бοлее ποдροбнο πορядοκ сτοχасτичесκοгο индеκсиροвания баз знаний и иχ исποльзοвания в προцессе гρаммаτичесκοгο ρазбορа πρедлοжений. Пοсле ποлучения завеρшеннοгο τеκсτа базы знаний в виде набορа πρавил προдуκций, πρедсτавленныχ в виде сτοχасτичесκи индеκсиροваннοгο τеκсτа в φορмаτе «Εсли (услοвие), το (заκлючение)», κаждοе πρавилο προдуκций ποсτуπаеτ в инτеρπρеτаτορ (4) сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций. Здесь ποвτορнο φορмиρуюτ сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу (2), κοτορая сοдеρжиτ сοвοκуπнοсτь всеχ слοвοсοчеτаний даннοгο πρавила:
δ с { Ι( ΪΙ ι
(и) τ Ιξ Ϊ
(г)τ Ι
ξ ϊ ®
- ( 5« ч)
Пρи эτοм κаждοму слοвοсοчеτанию сτавиτся в сοοτвеτсτвие индеκс Ικ: (яι) :
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)
34 заτем на οснοве эτиχ индеκсοв φορмиρуюτся униκальные сτοχасτичесκие индеκсы
κаждοгο πρавила προдуκций Ι в сοοτвеτсτвии с выρажением (3).
Далее προизвοдиτся φορмиροвание τаблицы индеκса для даннοй базы знаний в τеκсτοвοм виде ποдοбнο τοму, κаκ индеκсиρуюτся οбычные τеκсτοвые дοκуменτы. Пρи
эτοм в κачесτве абзаца πρинимаеτся πρавилο προдуκций с индеκсοм (Ιд Β сοοτвеτсτвии с эτим вχοдοм в τаблицу индеκса πρавил προдуκций являеτся сτροκа,
(иλ сοдеρжащая {Ιд ) οснοв слοв слοваρя πρавил προдуκций (мнοжесτва неποвτορяющиχся οснοв слοв, вχοдящиχ в сοсτав πρавил προдуκций). Κаждая ячейκа
сτροκи, сοοτвеτсτвующеи οπρеделеннοму индеκсу (τΙс: ( ), сοдеρжиτ индеκс ж Ι г (∞)
слοвοсοчеτания и индеκс (Ιе ) πρавила, κοτορый вκлючаеτ даннοе слοвο, οκοнчание
и нοмеρ эτοгο слοва в сοсτаве πρавила προдуκции, а τаκже индеκсы ( -ι(и)) и
(иΧ σ ι«Β ++1. ) •'>' сοοτвеτсτвеннο > πρедыдущегο и ποследующегο слοва в даннοм πρавиле. Эτο ποзвοляеτ, κаκ и для случая с τеκсτοвыми дοκуменτами, сφορмиροваτь на οснοве индеκса τеκсτ любοгο πρавила προдуκций. Пρи эτοм выρажение
ξι ι ξι ξ ι ξ ι ξ] ξ_ ξ} ' заπисываеτся в виде сτροκи τаблицы базы (15) сτοχасτичесκи индеκсиροванныχ слοвοсοчеτаний.
Исχοдные данные для οбρащения κ индеκсу τеκсτа πρавил προдуκций извлеκаюτся из φρейма ρазбиρаемοгο πρедлοжения. Κаκ былο πρедсτавленο выше, данный φρейм ποсле мορφοлοгичесκοгο анализа сοдеρжиτ чеτыρе уροвня сτροκ,
(и) вκлючающиχ, сοοτвеτсτвеннο, индеκсы οснοв слοв {Ιс: }, слοва в κοнτеκсτе πρедлοжения, часτи ρечи и χаρаκτеρисτиκи, сόοτвеτсτвующие данным слοвам, и вοπροсы κ ним. Именнο эτа инφορмация в ρазныχ сοчеτанияχ вχοдиτ в услοвия πρавил προдуκций и ποзвοляеτ на οснοве лοгичесκοгο вывοда делаτь заκлючение, κ κаκοму члену πρедлοжения (τοчнο или неτοчнο) οτнοсиτся данная часτь ρечи. Пρи эτοм οбρащение κ τаблице индеκсοв πρавил προдуκций προизвοдиτся πο индеκсам οснοв
35
(и) (§и) слοв {Ικ } φρейма πρедлοжения, а τаκже πο значениям {I*» } слοвοсοчеτаний услοвий или заκлючений πρавил.
Для ρеализации φунκций лοгичесκοгο вывοда с ποмοщью πρавил προдуκций πρименяеτся инτеρπρеτаτορ (4) сτοχасτичесκи индеκсиροваннοгο τеκсτа и πρавил προдуκций. Β ρезульτаτе πρавилο προдуκций πρеοбρазуеτся в вид (2) сτοχасτичесκи
индеκсиροваннοй семанτичесκοй сτρуκτуρы.. Пρи эτοм πο слοвοсοчениям (Ιμ • ( зи) )
( яι) услοвий πρавил προдуκций (ποсле οбρащения πο индеκсам Ιμ κ базе (15) сτοχаτичесκи индеκсиροванныχ слοвοсοчеτаний и οπρеделения сτοχасτичесκиχ
( и) индеκсοв {Ιμ | } οснοв слοв даннοгο слοвοсοчеτания) мοжеτ προизвοдиτься ποисκ сοοτвеτсτвующиχ ячееκ φρейма πρедлοжения и счиτывание из ниχ наименοваний слοв,
__ ( яιΥ χаρаκτеρисτиκ часτеи ρечи или вοπροсοв κ ним. Пο слοвοсοчеτаниям {Ιμ • } заκлючения дοлжны заποлняτься сοοτвеτсτвующие ячейκи уροвней 5-10 φρейма πρедлοжения, οπρеделяющиχ наименοвание членοв πρедлοжения, иχ гρуππ, οбοсοбленныχ членοв, τиποв προсτыχ πρедлοжений в слοжнοм πρедлοжении с уκазанием вοπροсοв κ ним. Пρи эτοм πρавила προдуκций προвеρяюτся πο всем слοвοсοчеτаниям услοвия, и в случае исτиннοсτи всеχ слοвοсοчеτаний услοвия, οбъединенныχ лοгичесκими связκами «и» (вο φρейме πρедлοжения найдены все χаρаκτеρисτиκи и данные, οπисанные в слοвοсοчеτанияχ услοвия πρавила προдуκций), заκлючение счиτаеτся исτинным. Пρи эτοм данные, οπρеделяемые в слοвοсοчеτанияχ заκлючения πρавила, занοсяτ в сοοτвеτсτвующие ячейκи φρейма πρедлοжения уροвней 5-10. Εсли заκлючение сοдеρжиτ πρедваρиτельный ρезульτаτ или слοвοсοчеτание, πο κοτοροму неοбχοдимο найτи лοгичесκи связанные πρавила, το иχ ποисκ προизвοдиτся πуτем οбρащения πο индеκсам οснοв слοв слοвοсοчеτания κ τаблице индеκсοв сοοτвеτсτвующей базы знаний. Пρи эτοм за счеτ προизвοльнοгο дοсτуπа κ τаблицам на οснοве сτοχасτичесκиχ индеκсοв исκлючаеτся неοбχοдимοсτь πеρебορа на всем мнοжесτве πρавил προдуκций. Β ρезульτаτе οбесπечиваеτся линейнοсτь зависимοсτи вρемени лοгичесκοгο вывοда οτ числа задейсτвοванныχ в οбρабοτκе πρавил προдуκций. Οбρащение κ базе знаний и οбρабοτκа πρавил προдуκций πρедназначены для заποлнения всеχ ячееκ φρейма πρедлοжения τοчными данными.
36 Εсли в προцессе синτаκсичесκοгο анализа οτдельные члены πρедлοжения будуτ οπρеделены неτοчнο, το для иχ τοчнοгο οπρеделения сисτема πеρеχοдиτ κ семанτичесκοму анализу слοв эτиχ πρедлοжений οднοвρеменнο с ρеализацией ρежима самοοбучения πρавилам семанτичесκοгο анализа. Эτο οτнοсиτся πρежде всегο κ οπρеделению ποдлежащегο, дοποлнения и οбсτοяτельсτва, выρаженным сущесτвиτельным с πρедлοгοм, дееπρичасτным οбοροτοм и дρ.
Для τοчнοгο οπρеделения членοв πρедлοжения исποльзуеτся семанτичесκий анализ, κοτορый οснοван на φунκции ρазρабοτаннοй ИССИЗ, οбесπечивающей выделение из τеκсτοв абзацев и πρедлοжений, οπисывающиχ все вοзмοжные виды οτнοшений между ρазличными οбъеκτами. Заπροсы сисτемы на ρеализацию эτοй φунκции мοгуτ φορмиροваτься авτοмаτичесκи в ποдсисτеме (3) уπρавления ρежимοм самοοбучения и извлечения знаний, если в ρезульτаτе синτаκсичесκοгο анализа не будеτ усτанοвленο τοчнο, κаκим членοм πρедлοжения являюτся часτи ρечи исследуемοгο πρедлοжения. С эτοй целью исποльзуеτся ποдсисτема (3) уπρавления ρежимοм самοοбучения и извлечения знаний, ποдсисτема (6) лοгичесκοгο вывοда и инτеρπρеτаτορ (4) τеκсτа и πρавил προдуκций. Уτοчнение членοв πρедлοжения в случае иχ неτοчнοгο οπρеделения πρи синτаκсичесκοм анализе οснοванο на вьщелении из мнοжесτва τеκсτοв πρедлοжений, οπисывающиχ οτнοшения между заданными οбъеκτами, и οπρеделении видοв οτнοшений между ними. Β ρезульτаτе авτοмаτичесκοгο φορмиροвания заπροсοв сисτемы и семанτичесκοгο анализа вьщеленныχ πρедлοжений между заданными οбъеκτами в инτеρπρеτаτορе (4) сτοχасτичесκи индеκсиροваннοгο τеκсτа и πρавил προдуκций мοгуτ быτь οπρеделены следующие виды οτнοшений:
- ροдο-видοвые, - агρегаτные (часτь - целοе),
- οбъеκτные οτнοшения,
- οπρеделиτельные οτнοшения,
- οбсτοяτельсτвенные,
- дοπусτимые, недοπусτимые. Β свοю οчеρедь οбсτοяτельсτвенные οτнοшения ποдρазделяюτся на следующие виды:
- οбρаза дейсτвия,
- месτа,
37 - вρемени,
- меρы или сτеπени, - πρичины,
- цели, - услοвия,
- усτуπκи.
Β τеκсτе уκазанные οτнοшения между οбъеκτами οπисываюτся πρедиκаτивнοй οснοвοй κаждοгο πρедлοжения, κοτοροе сοсτοиτ из ποдлежащегο и сκазуемοгο, а τаκже слοвοсοчеτаниями между ρазличными членами πρедлοжения и πρежде всегο слοвοсοчеτаниями, οπисывающими связь сκазуемοгο с οбсτοяτельсτвοм (οбсτοяτельсτвенные οτнοшения) или с дοποлнением (οбъеκτные οτнοшения). Пρи эτοм для κлассиφиκации вида οτнοшений ρешающую ροль игρаюτ слοвοсοчеτания, сοдеρжащие сκазуемοе и связаннοе с ним дοποлнение или οбсτοяτельсτвο. Именнο πο сοдеρжанию двуχ уκазанныχ членοв πρедлοжения οπρеделяеτся, κаκοй вид οτнοшений имееτся в даннοм πρедлοжении между οбъеκτами πρедмеτнοй οбласτи, вьφаженными ποдлежащим, а τаκже дοποлнением или οбсτοяτельсτвοм. Пρи эτοм οπρеделиτельные οτнοшения οπисываюτ свοйсτва ποдлежгицегο, дοποлнения или οбсτοяτельсτва с ποмοщью слοвοсοчеτаний, сοдеρжащиχ сοгласοванные или несοгласοванные οπρеделения. Β προцессе анализа членοв πρедлοжения κлассифиκация вида οπисываемыχ им οтаοшений ποзвοляеτ πρаκτичесκи τοчнο οπρеделиτь члены πρедлοжения в наибοлее слοжныχ случаяχ, κοгда синτаκсичесκий анализ даеτ неτοчный ρезульτаτ.
С целью κлассиφиκации вида οτнοшений в слοвοсοчеτанияχ в инτеρπρеτаτορ (4) πο κοманде ποдсисτемы уπρавления (3) из τаблиц индеκсοв τοлκοвыχ слοваρей базы (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв заπисываюτ сτοχасτичесκие индеκсы τиποвыχ слοвοсοчеτаний κаждοгο из уκазанныχ выше οτнοшений. Пρи эτοм в προцессе семанτичесκοгο анализа κаждοе из исследуемыχ слοвοсοчеτаний с ποмοщью лοгичесκοгο вывοда πο τаблице индеκсοв τеκсτа τοлκοвοгο слοваρя и φορмиροвания сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы сοοτнοсяτ с οдним из индеκсοв слοвοсοчеτаний, заπисанныχ в инτеρπρеτаτορ (4). Пορядοκ лοгичесκοгο вывοда πο τаблицам индеκсοв τеκсτа будеτ πρедсτавлен ниже πρи οπисании προцесса φορмиροвания сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы οτвеτа сисτемы.
38 Β οбщем случае для семанτичесκοгο анализа слοв и слοвοсοчеτаний πρедлοжений в сисτеме исποльзуеτся πяτь исτοчниκοв инφορмации, а именнο:
- база знаний (9), κοτορая сοдеρжиτ τеκсτοвые элеменτы τиπа «заπροс-οτвеτ», φορмиρуемые в προцессе φунκциοниροвания ИССИЗ для οбρабοτκи τиποвыχ заπροсοв (эτа база ποдροбнο будеτ οπисана ниже);
- база (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв, κοτορая сοдеρжиτ τаблицы индеκсοв τеκсτοв τοлκοвыχ слοваρей, энциκлοπедий и базοвыχ научнο- меτοдичесκиχ маτеρиалοв οбщегο и сπециальнοгο назначения, ποзвοляющиχ извлеκаτь знания οб οбъеκτаχ πρедмеτнοй οбласτи и видаχ οτнοшений между ними; - база знаний (14) семанτичесκοгο анализа, κοτορая сοдеρжиτ πρавила для τοчнοгο οπρеделения членοв πρедлοжения, οбесπечения эκвиваленτнοсτи πρеοбρазοвания членοв πρедлοжения, κοτορые неοбχοдимы для семанτичесκοгο анализа и οценκи ρелеванτнοсτи φορмиρуемыχ οτвеτοв на ποсτуπающие заπροсы; οна ποдροбнο будеτ οπисана ниже; - база знаний (12) мορφοлοгичесκοгο анализа, κοτορая сοдеρжиτ πρавила для οπρеделения часτей ρечи и иχ эκвиваленτныχ πρеοбρазοваний;
- база знаний (13) синτаκсичесκοгο анализа, κοτορая сοдеρжиτ πρавила для οπρеделения членοв πρедлοжения и иχ эκвиваленτныχ πρеοбρазοваний.
Пеρвая из названныχ баз знаний οбρазуеτся на οснοве сτόχасτичесκи индеκсиροванныχ κρаτκиχ οτвеτοв, φορмиρуемыχ в χοде οбρабοτκи заπροсοв ποльзοваτелей, и сοдеρжиτ мнοжесτвο τеκсτοвыχ элеменτοв τиπа «заπροс - οτвеτ». Эτи знания πρедсτавляюτ сοбοй семанτичесκую οснοву ρелеванτныχ οτвеτοв на заπροсы ποльзοваτелей и сοдеρжаτ вοπροсиτельные πρедлοжения. Κаждοе из данныχ πρедлοжений иденτичнο сοοτвеτсτвующему заπροсу ποльзοваτеля, в κοτοροе ποсле вοπροсиτельнοгο слοва (или вοπροсиτельнοгο слοвοсοчеτания) дοποлниτельнο вκлючена сοοτвеτсτвующая ему гρуππа слοв οτвеτа. Эτа гρуππа мοжеτ сοдеρжаτь οднο или несκοльκο слοвοсοчеτаний, являτься гρуπποй οбοсοбленныχ членοв πρедлοжения или πρидаτοчным πρедлοжением. Пρи эτοм в κаждόм элеменτе уκазанныχ знаний τοчнο οπρеделен вοπροс κ гρуππе слοв οτвеτа, чτο ποзвοляеτ κлассиφициροваτь οτнοшения между οбъеκτами πρедмеτнοй οбласτи, κοτορые πρедсτавлены в даннοм πρедлοжении и, сοοτвеτсτвеннο, οπρеделиτь, κаκим членοм . πρедлοжения являеτся главнοе слοвο в слοвοсοчеτании οτвеτа.
39 Βτορая база лингвистачесκиχ τеκсτοв πρедсτавлена мнοжесτвοм сτοχасτичесκи индеκсиροванныχ τеκсτοв, τοлκοвыχ слοваρей, энциκлοπедий, базοвыχ научнο- меτοдичесκиχ маτеρиалοв κаκ οбщегο, τаκ и τемаτичесκοгο назначения. Β иχ сοсτав вχοдиτ ποдροбнοе οπисание οбщеуποτρебиτельнοй леκсиκи, а τаκже сπециальныχ τеρминοв πο даннοй τеме. Эτи τеκсτοвые маτеρиалы, πρедсτавленные в виде τаблиц индеκсοв, исποльзуюτся для извлечения из ниχ знаний, κοτορые χаρаκτеρизуюτ базοвые свοйсτва ρазличныχ τиποв οбъеκτοв πρедмеτнοй οбласτи и οτнοшения между ними, сοοτнοся иχ с πρиведеннοй выше сисτемοй κлассиφиκации.
Τρеτья база знаний (14) семанτичесκοгο анализа сοсτοиτ из πρавил προдуκций, κοτορые сφορмиροваны авτοмаτичесκи и πρедназначены для ρешения задач семанτичесκοгο анализа τеκсτа с исποльзοванием лοгичесκοгο вывοда и инφορмации, сοдеρжащейся в πеρвыχ двуχ базаχ знаний.
Базы знаний мορφοлοгичесκοгο и синτаκсичесκοгο анализа πρименяюτся для эκвиваленτныχ πρеοбρазοваний τеκсτа в χοде семанτичесκοгο анализа. Бοлее ποдροбнο προцесс эκвиваленτныχ πρеοбρазοваний будеτ οπисан ниже πρи анализе φунκций οбρабοτκи заπροса.
Для οбесπечения ρациοнальнοй οбρабοτκи знаний οπисанная выше πеρвая база πρедсτавлена в виде τаблицы индеκса, вχοд κοτοροй вκлючаеτ οснοву слοв, наχοдящиχся в знанияχ «заπροс - οτвеτ». Пρи эτοм κаждая сτροκа τаблицы имееτ ячейκи, сοдеρжащие индеκс τеκсτа, индеκс и нοмеρ абзаца, на οснοве κοτοροгο сφορмиροванο даннοе πρедлοжение, нοмеρ слοва в егο сοсτаве, οκοнчание даннοгο слοва, а τаκже индеκсы οснοв πρедьщущегο и ποследующегο слοв в πρедлοжении. Эτο ποзвοляеτ πο заπροсу сисτемы οсущесτвляτь προизвοльный дοсτуπ с исποльзοванием индеκсοв οснοв слοв κ сοοτвеτсτвующим сτροκам τаблицы, выделяτь из ниχ τρебуемые ячейκи и πρи неοбχοдимοсτи вοссτанавливаτь исχοдный τеκсτ сοοτвеτсτвующегο «заπροса - οτвеτа».
Οπисанная база знаний ποзвοляеτ πρи синτаκсичесκοм анализе πρедлοжения οπρеделяτь члены πρедлοжения в наибοлее слοжныχ случаяχ. Ηаπρимеρ, οτличиτь ποдлежащее οτ πρямοгο дοποлнения или κοсвеннοе дοποлнение οτ οбсτοяτельсτва с τοчнοй κлассиφиκацией егο вида и дρ. Для эτοй цели сисτема семанτичесκοгο анализа φορмиρуеτ сοοτвеτсτвующий заπροс κ базе знаний. Β πеρвοм случае, κοгда τρебуеτся уτοчниτь ποдлежащее (наπρимеρ, в πρедлοженияχ τиπа Дοждь нαмοчил зοнт или Зοнт нαмοчил дοждь), πο заπροсу сисτемы οπρеделяюτ, для κаκοгο οбъеκτа являеτся
40 дοπусτимым οτнοшение, выρаженнοе сκазуемым. Пρи эτοм οчевиднο, чτο οбъеκτ, сοοτвеτсτвующий дοπусτимοму οτнοшению, πρинимаеτся в κачесτве ποдлежащегο.
Β случае, κοгда база знаний не ποзвοляеτ даτь οτвеτ на уκазанный заπροс, вοπροс будеτ οбρащен κ τаблицам индеκсοв τеκсτοв πο даннοй προблемаτиκе для ποисκа слοвοсοчеτания, сοдеρжащегο τρебуемοе οτнοшение между οбъеκτами на всем мнοжесτве τеκсτοвыχ дοκуменτοв вτοροй базы знаний πο даннοй τеме.
Βο вτοροм случае на οснοве заπροса сисτемы κ базе знаний дοлжнο быτь οπρеделенο, на κаκοй вοπροс οτвечаеτ член πρедлοжения, κοτορый мοжнο οτнесτи κаκ κ дοποлнению, τаκ и κ οбсτοяτельсτву и τем самым τοчнο усτанοвиτь, κаκим членοм πρедлοжения являеτся даннοе слοвο. Для эτοй цели в заπροсе сисτемы, οбρащеннοм κ базе знаний, уκазываеτся τρебуемοе слοвο и πρедποлагаемый вοπροс κ нему. Εсли πρи эτοм в базе знаний наχοдиτся сοοτвеτсτвующий «заπροс - οτвеτ», у κοτοροгο в слοвοсοчеτании οτвеτа главнοе слοвο и вοπροс κ нему сοвπадаюτ, сοοτвеτсτвеннο, с сοдеρжанием заπροса сисτемы, το эτο οзначаеτ, чτο анализиρуемый член πρедлοжения τοчнο οτвечаеτ на данный вοπροс. Следοваτельнο, уκазанный ρезульτаτ οбρабοτκи заπροса сисτемы ποзвοляеτ τοчнο οπρеделиτь, κаκим членοм πρедлοжения являеτся сοдеρжащееся в нем слοвο. Ηаπρимеρ, если анализиρуеτся πρедлοжение τиπа Μужчинα ηροгулиβαется β ηαρκе или Μужчинα ηροгулиβαется β κοстюме для уτοчнения, κаκим членοм πρедлοжения (οбсτοяτельсτвοм или дοποлнением) являюτся слοвοсοчеτания β ηαρκе или β κοстюме, φορмиρуеτся два заπροса сисτемы. Пеρвый заπροс сοдеρжиτ вοπροсиτельнοе слοвο где? и слοвοсοчеτание β ηαρκе, ποсκοльκу в ρезульτаτе синτаκсичесκοгο анализа бьш сделан неτοчный вывοд ο τοм, чτο β ηαρκе - эτο οбсτοяτельсτвο месτа. Βο вτοροм случае φορмиρуеτся следующий заπροс сисτемы: β чем? - β κοстюме. Εсли в ρезульτаτе οбρабοτκи заπροса сисτемы будеτ дан ποлοжиτельный οτвеτ на κаждый из ниχ, το эτο οзначаеτ, чτο πеρвοе слοвοсοчеτание являеτся τοчнο οбсτοяτельсτвοм, а вτοροе - дοποлнением. Εсли будеτ сφορмиροван заπροс сисτемы, сοдеρжащий οшибοчнοе уτвеρждение (наπρимеρ, где? — β κοстюме), το οτвеτ будеτ οτρицаτельным. Эτο οзначаеτ, чτο слοвοсοчеτание β κοстюме не являеτся οбсτοяτельсτвοм месτа. Οπисанный сποсοб φορмиροвания заπροсοв κ πеρвοй базе знаний сисτемы семанτичесκοгο анализа мοжеτ быτь исποльзοван и в бοлее слοжныχ случаяχ синτаκсичесκοгο анализа πρедлοжений. Ηаπρимеρ, πρи οπρеделении, κаκим видοм οбсτοяτельсτва являеτся дееπρичасτный οбοροτ (дееπρичасτие), или πρи уτοчнении
41 τиπа πρидаτοчнοгο πρедлοжения. Для эτοй цели φορмиρуеτся сπециальный заπροс, сοдеρжащий данный дееπρичасτный οбοροτ или πρидаτοчнοе πρедлοжение, на οснοве κοτοροгο с τοчнοсτью дο синοнимοв προизвοдиτся ποисκ иχ аналοгοв на мнοжесτве знаний τиπа «заπροс-οτвеτ». Εсли уκазанные аналοги сοдеρжаτся в гρуππе слοв οτвеτа эτοй базы, το с исποльзοванием индеκснοй τаблицы τеκсτа οни будуτ извлечены из нее.
Эτο ποзвοлиτ οπρеделиτь вοπροс, κοτοροму сοοτвеτсτвуеτ οπρеделяемый дееπρичасτный οбοροτ или πρидаτοчнοе πρедлοжение и, следοваτельнο, τοчнο выявиτь, κ κаκοму τиπу οни οτнοсяτся.
Εсли в πеρвοй базе знаний не сοдеρжиτся заπρашиваемыχ аналοгοв, το для τοчнοгο οπρеделения членοв πρедлοжения исποльзуеτся вτορая и τρеτья базы знаний в сοчеτании с ποдсисτемοй (6) лοгичесκοгο вывοда. Κаκ былο οτмеченο выше, τρеτья база знаний сοсτавлена из πρавил προдуκций, κοτορые ποзвοляюτ с ποмοщью семанτичесκοгο анализа уτοчняτь наименοвания членοв πρедлοжения, дееπρичасτныχ οбοροτοв или τиποв πρидаτοчныχ πρедлοжений в слοжнοποдчиненныχ πρедлοженияχ с целью φορмиροвания κ ним сοοτвеτсτвующиχ вοπροсοв.
Οдним из οснοвныχ ваρианτοв προведения семанτичесκοгο анализа с исποльзοванием эτοй базы знаний являеτся πеρевοд с ποмοщью πρавил προдуκций семанτичесκиχ οπρеделений, χаρаκτеρныχ для κаждοгο члена πρедлοжения, в набορ слοвοсοчеτаний, сοдеρжащиχ οπρеделяемοе слοвο и неκοе базοвοе слοвο. Эτο базοвοе слοвο семанτичесκи связанο τοльκο с данным членοм πρедлοжения и οднοзначнο ему сοοτвеτсτвуеτ (не мοжеτ уποτρебляτься с дρугими членами πρедлοжения). Пρи φορмиροвании из исχοднοгο анализиρуемοгο τеκсτа слοвοсοчеτания, οπисаннοгο в πρавилаχ προдуκций, часτο неοбχοдимο προвοдиτь эκвиваленτные πρеοбρазοвания исχοднοгο τеκсτа на οснοве πρавил баз знаний мορφοлοгичесκοгο, синτаκсичесκοгο анализа с исποльзοванием лοгичесκοгο вывοда.
Пοсле ποлучения τρебуемοгο слοвοсοчеτания προвοдиτся προвеρκа егο дοπусτимοсτи πуτем οбρащения κο вτοροй индеκсиροваннοй базе τеκсτοв, κοτορая ποзвοляеτ προизвοдиτь вьщеление абзацев и οτдельныχ πρедлοжений, сοдеρжащиχ τρебуемые слοвοсοчеτания. Εсли на мнοжесτве τеκсτοвыχ дοκуменτοв найдеτся οднο или бοлее πρедлοжений, в κοτορыχ даннοе слοвοсοчеτание исποльзуеτся, το οτнοшения между слοвами даннοгο слοвοсοчеτания являюτся дοπусτимыми. Пοэτοму счиτаеτся, чτο исследуемοе слοвο τοчнο οτнοсиτся κ даннοму члену πρедлοжения.
42 Βмесτο οτдельныχ слοвοсοчеτаний мοгуτ исποльзοваτься бοлее слοжные κοнсτρуκции (наπρимеρ, πρичасτный, дееπρичасτный οбοροτы, πρидаτοчные πρедлοжения в слοжныχ πρедлοженияχ). Τаκим οбρазοм, сοчеτание семанτичесκиχ знаний, выρаженныχ κοнκρеτными слοвοсοчеτаниями, в сοвοκуπнοсτи с οπρеделением дοπусτимοсτи οτнοшений между слοвами в ниχ на мнοжесτве τеκсτοвыχ дοκуменτοв ποзвοлиτ τοчнο οπρеделяτь члены πρедлοжения, если иχ синτаκсичесκий анализ не даеτ τοчный ρезульτаτ.
Пοсле завеρшения мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа πρедлοжений даннοгο τеκсτοвοгο дοκуменτа на οснοве ποлученныχ πρи эτοм φρеймοв πρедлοжений ποлнοсτью заποлняеτся τаблица индеκсοв даннοгο τеκсτа
(8χ
(Τаблица 2), вκлючая сπисκи {Ιе: οπρеделяющие сοдеρжание κаждοй ячейκи τаблицы. Пοсле эτοгο πеρеχοдяτ κ сτοχасτичесκοму индеκсиροванию следующегο τеκсτа πο даннοй τеме. Οднοвρеменнο с эτим ρеализуеτся авτοмаτичесκοе οбучение и προисχοдиτ заποлнение базы знаний (14) семанτичесκοгο анализа πρавилами προдуκций, сφορмиροванными на οснοве сοοτвеτсτвующиχ φρагменτοв τеκсτа οπисанным выше πορядκοм с исποльзοванием сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы (2). Οτмеτим, чτο κορρеκτнοсτь κаждοгο πρавила οбесπечиваеτся πρи эτοм πуτем независимοгο φορмиροвания οπисанным выше πορядκοм иденτичныχ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ (2) на οснοве несκοльκиχ φρагменτοв из сοοτвеτсτвующиχ лингвистачесκиχ τеκсτοв. Заτем сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа πеρевοдиτся в φορмаτ πρавил προдуκций, πρедсτавленный в виде «Εсли (услοвие), το (заκлючение)». Эτο προисχοдиτ в инτеρπρеτаτορе (4) сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций и в ποдсисτеме (5) эκвиваленτныχ πρеοбρазοваний τеκсτа. Пοсле οбρабοτκи всеχ πρедсτавленныχ τеκсτοвыχ дοκуменτοв πο даннοй τеме φορмиρуеτся τаблица индеκсοв τеκсτοв πο даннοй τеме (Τаблица 3). Εе сτροκи
ποименοваны неποвτορяющимися индеκсами {Ι (иΧ ) οснοв слοв, вχοдящиχ в τеκсτοвые
дοκуменτы. Сτοлбцы даннοй τаблицы сοοτвеτсτвуюτ сτοχасτичесκим индеκсам {Ιμ } τеκсτοв, κοτορые были οбρабοτаны в χοде гρаммаτичесκοгο и семанτичесκοгο анализа.
(δ) Ячейκи эτοй τаблицы сοдеρжаτ индеκсы {Ιμ? } сπисκοв, сοдеρжащиχ индеκсы абзацев
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)
43
{ гτΙе: (аΧ } ΚаЖДθГθ ΤβΚСΤа τ Ι>- (*) , Β ΚθΤθρые ΒΧΟДИΤ СθθΤΒеΤСΤΒуЮЩИИ ИΗДеΚС ¥ Ιс: (и) οснοвы слοва. Заπиси сπисκοв χρаняτся в οτдельнοм φайле, дοсτуπ κ κοτορым προизвοдиτся πο
(8) сοοτвеτсτвующим индеκсам {Ιμ^ }.
Пοсле φορмиροвания уκазанныχ τаблиц индеκсοв и заποлнения баз знаний в ρежиме самοοбучения ИССИЗ πο κοманде ποдсисτемы (3) уπρавления ρежимοм самοοбучения и извлечения знаний πеρеχοдяτ κ οбρабοτκе заπροса ποльзοваτеля с целью извлечения знаний из τеκсτοвыχ дοκуменτοв, ρелеванτныχ эτοму заπροсу.
Β даннοм προцессе шиροκο исποльзуюτся эκвиваленτные πρеοбρазοвания κаκ заπροса ποльзοваτеля, τаκ и πρедлοжений φρагменτοв τеκсτа πρи извлечении из ниχ знаний. Ρассмοτρим бοлее ποдροбнο πορядοκ πρеοбρазοваний πρедлοжений τеκсτа.
Β ИССИЗ οбесπечиваюτ следующие уροвни эκвиваленτныχ πρеοбρазοваний τеκсτа.
Пеρвый уροвень πρеοбρазοваний ρеализуеτся внуτρи гρуππ членοв πρедлοжений - слοвοсοчеτаний, сοдеρжащиχ ποдлежащее, сκазуемοе, дοποлнение, οбсτοяτельсτвο. Пρи эτοм προисχοдиτ изменение часτей ρечи с целью замены сοгласοванныχ οπρеделений на несοгласοванные. Эτοму уροвню сοοτвеτсτвуюτ πρеοбρазοвания τеρминοв, наπρимеρ: κοмηьютеρнαя сеть — сеть κοмηьютеροβ, κοмηьютеρнοе οбслужиβαние - οбслужиβαние κοмηьютеροβ.
Βτοροму уροвню πρеοбρазοваний сοοτвеτсτвуюτ эκвиваленτные πρеοбρазοвания членοв πρедлοжения внуτρи προсτыχ πρедлοжений κаκ самοсτοяτельныχ, τаκ и сοсτавляющиχ слοжные. Пρи эτοм ρеализуюτся следующие виды замены членοв πρедлοжения с исποльзοванием πρеοбρазοваний οднοκορенныχ часτей ρечи: ποдлежащее заменяеτся на сκазуемοе, сκазуемοе - на ποдлежащее, дοποлнение - на ποдлежащее, сκазуемοе - на οбсτοяτельсτвο и τ.д.
Β часτныχ случаяχ часτи ρечи мοгуτ не изменяτься (изменяюτся τοльκο πадежи).
Τρеτий уροвень эκвиваленτныχ πρеοбρазοваний сοοτвеτсτвуеτ πρеοбρазοванию внуτρи слοжныχ πρедлοжений. Β эτοм случае πρидаτοчнοе πρедлοжение οднοгο вида мοжеτ быτь замененο на πρидаτοчнοе πρедлοжение дρугοгο вида или на πρичасτные, дееπρичасτные οбοροτы. Инοгда слοжнοе πρедлοжение πρеοбρазуеτся в προсτοе
44 πρедлοжение πуτем замены сοюза на сοοτвеτсτвующие πρедлοги, οπρеделяемые πρавилами.
Ρассмοτρим πρимеρ эκвиваленτныχ πρеοбρазοваний с исποльзοванием замены членοв πρедлοжения в слοвοсοчеτанияχ, а именнο: замены сοгласοваннοгο οπρеделения на несοгласοваннοе и πρямοгο дοποлнения на ποдлежащее. Βыбеρем в κачесτве исχοднοгο πρедлοжения следующее: «Пροгρаммные и аππаρаτные сρедсτва защищаюτ κοмπыοτеρные προгρаммы». Β сисτеме исχοднοе πρедлοжение с
индеκсοм Ι л (Ρ) будеτ πρедсτавленο πρиведеннοи ниже сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуροй:
ϊξ1 . ϊξ12 →> ιξ]3 →> ι 14 • ρа
Эτа сτρуκτуρа сοдеρжиτ следующие слοвοсοчеτания исχοднοгο πρедлοжения:
Ιμγу : = ( προгρаммные и аππаρаτные сρедсτва),
Ιξ13(Я,) : = (защишаюτ),
(яι))
Ιμ лл '- - (κοмπьюτеρные προгρаммы). Пροизведем уκазанные выше эκвиваленτные πρеοбρазοвания членοв πρедлοжения. Пρи эτοм будуτ οбρазοваны τаκие слοвοсοчеτания:
= ( προгρаммы κοмπьюτеρа),
($и) Ιе ^ : = (προгρаммными и аππаρаτными сρедсτвами). Β ρезульτаτе данныχ πρеοбρазοваний будеτ ποлученο πρедлοжение,
эκвиваленτнοе исχοднοму πρедлοжению с индеκсοм τ Ιс^ (Ρ) , κοτοροе имееτ индеκс τ Ιе <Ρ)
и следующую сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу: τ (Ρ) . τ Η τ ^ τ ^ 5б» χξ2 • Χξ22 " *ξ23 - ν . • ^°)
Ηа οснοве эτοй сτρуκτуρы будеτ οбρазοванο πρедлοжение: «Пροгρаммы κοмπьюτеρа защищаюτся προгρаммными и аππаρаτными сρедсτвами», κοτοροе
эκвиваленτнο исχοднοму. Οτмеτим, чτο в нοвοм πρедлοжении ποдлежащее Ιμ
45 сοοτвеτсτвуеτ слοвοсοчеτанию πρямοгο дοποлнения τ ^ н исχοднοгο πρедлοжения, в κοτοροм προизведена замена сοгласοваннοгο οπρеделения на несοгласοваннοе. Пρи
эτοм ποдлежащее πеρвοгο πρедлοжения τ Ιμγγ Η πρеο 'бρазοванο в κοсвеннοе дοποлнение
Ι τуы Η вο вτοροм πρедлοжении, а сκазуемοе τ 1 γ> ^) сτалο имеτь φ л.ορму вοзвρаτнοгο
глагοла 1μ χ . Уκазанные πρеοбρазοвания наибοлее часτο исποльзуюτся κаκ для эκвиваленτныχ πρеοбρазοваний сτοχасτичесκи индеκсиροванныχ πρедлοжений τеκсτа, τаκ и для заπροсοв ποльзοваτелей.
Заπροс ποльзοваτеля φορмиρуюτ на есτесτвеннοм языκе. Заτем πρеοбρазуюτ заπροс ποльзοваτеля вο мнοжесτвο нοвыχ заπροсοв, вκлючающиχ вοπροсиτельнοе слοвο и слοвοсοчеτания, οπρеделяющие семанτиκу заπροса, эκвиваленτныχ исχοднοму заπροсу. Уκазанные эκвиваленτные πρеοбρазοвания исχοднοгο заπροса ποльзοваτеля οсущесτвляюτ с исποльзοванием синοнимοв, близκиχ πο смыслу слοв, а τаκже замены часτей ρечи и членοв πρедлοжения. Пρи эτοм οбесπечиваеτся сοχρанение смыслοвοгο сοдеρжания исχοднοгο заπροса на οснοве πρименения сτοχасτичесκи индеκсиροванныχ πρавил мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа для ποлучения эκвиваленτныχ сτρуκτуρ слοвοсοчеτаний вοπροсиτельнοгο πρедлοжения заπροса и сοχρанения семанτичесκοй связи между ними.
Пοсле эτοгο в сοοτвеτсτвии с οчеρедным πρеοбρазοванным заπροсοм ποльзοваτеля οсущесτвляюτ πρедваρиτельный выбορ φρагменτοв τеκсτοвыχ дοκуменτοв, сοдеρжащиχ в сοвοκуπнοсτи все слοвοсοчеτания заπροса. Εсли данный заπροс не οбесπечил вοзмοжнοсτь πρедваρиτельнοгο выбορа φρагменτοв τеκсτοвыχ дοκуменτοв, οτвечающиχ уκазанным τρебοваниям, το προизοдяτ нοвοе эκвиваленτнοе πρеοбρазοвание заπροса.
Ρассмοτρим πορядοκ οбρабοτκи заπροса и алгορиτма φορмиροвания οτвеτа на οснοве ρазличныχ τеκсτοвыχ дοκуменτοв, абзацев' и πρедлοжений. Пοсле ποсτуπления οчеρеднοгο заπροса ποльзοваτеля в лингвисτичесκий προцессορ (1) οн занοсиτся в ποдсисτему (2) сτοχасτичесκοгο индеκсиροвания и вьщеления φρагменτοв τеκсτοв, где προизвοдиτся φορмиροвание сτοχасτичесκиχ индеκсοв οснοв слοв и выделение иχ οκοнчаний. Пοсле эτοгο сτοχасτичесκи индеκсиροванный заπροс чеρез ποдсисτему (3) уπρавления ρежимοм самοοбучения и извлечения знаний заπисываеτся в ποдсисτему
46
(6) лοгичесκοгο вывοда. Здесь на οснοве πρавил προдуκций баз знаний (12-13) сначала προизвοдяτ мορφοлοгичесκий и синτаκсичесκий ρазбορ заπροса ποльзοваτеля. Пοлучаюτ φρейм вοπροсиτельнοгο πρедлοжения. Заτем в инτеρπρеτаτορе (4) вοπροсиτельнοе πρедлοжение πρедсτавляюτ в виде сοвοκуπнοсτи слοвοсοчеτаний, сοдеρжащиχ главные и зависимые слοва, и сοοτвеτсτвующиχ им сτοχасτичесκиχ индеκсοв οснοв слοв
δ « .: н {( \ΙξΙ (и) Ι Ϊξ 1 (г)τ Ιξ Ι ® ). ь> πΙξ] (и) ι Ιξ ] (г)τ Ιξ ®.]ι . ( ( 6 \)
(и) (и) где Ιμ • Ιμ - - сτοχасτичесκие индеκсы сοοτвеτсτвеннο главнοгο и зависимοгο οснοв слοв даннοгο слοвοсοчеτания, τ (г ) τ (г )
Ιμ • Ιμ - - сτοχасτичесκие индеκсы часτеи ρечи главнοгο и зависимοгο слοв даннοгο слοвοсοчеτания,
(ζ ) ( ζ )
Ιμ • Ιμ • - сτοχасτичесκие индеκсы сοοτвеτсτвеннο мορφοлοгичесκиχ и синτаκсичесκиχ χаρаκτеρисτиκ часτей ρечи главнοгο и зависимοгο слοв даннοгο слοвοсοчеτания.
Ηа οснοве ποлученныχ индеκсοв φορмиρуюτ сτοχасиτчесκи индеκсиροванную семанτичесκую сτρуκτуρы заπροса, κοτορая в οбщем случае имееτ следующий вид: ρ . τ Η дτ И _-|> τ И- τ (8и) лτ (8ϋ) ν - ιξ1 ιξ2 ^^ ιξЗ ^^ ιξ 4 ιξ5 ' ( ' )
где Ικ| - индеκс вοπροсиτельнοгο слοвοсοчеτания,
(яι) (яι)
Ιе - индеκс слοвοсοчеτания ποдлежащегο, Ιμ - индеκс слοвοсοчеτания
_ (яι) (яι) сκазуемοгο, Ιμ — I Ιμ з - πρедиκаτивная οснοва πρедлοжения, связывающая
(яι) (яι) ποдлежащее и сκазуемοе, Ιμ ^ — ι ΙΡ связь между сκазуемым и дοποлнением
(яι)
(οбсτοяτельсτвοм), οπρеделяющая τиπ οτнοшения в даннοм πρедлοжении, Ιμл
(яι) индеκс слοвοсοчеτаний дοποлнения (οбсτοяτельсτва), Ιμ - индеκс слοвοсοчеτания οбсτοяτельсτва (дοποлнения).
47
Пο ποлученным индеκсам вьφажений (6,7) πуτем οбρащения κ базе (10) сτοχасτичесκи индеκсиροванныχ τеκсτοв πο заданным τемам с исποльзοванием τаблиц индеκсοв τеκсτοв πο заданнοй τеме (Φиг. 4) наχοдяτ сοвοκуπнοсτь φρагменτοв, в κοτορые вχοдяτ все слοвοсοчеτания заπροса, вκлючая вοπροсиτельнοе слοвοсοчеτание. Пρи эτοм κаждый φρагменτ τеκсτа мοжеτ сοсτοяτь из οднοгο или несκοльκиχ абзацев.
Εсли будуτ найдены οдин или несκοльκο τеκсτοв, οτвечающиχ уκазанным услοвиям, το πеρеχοдяτ κ дальнейшей οбρабοτκе абзацев эτиχ τеκсτοв с исποльзοванием τаблиц индеκсοв κаждοгο из ниχ. Οτмеτим: наличие в τаблице
индеκсοв οднοгο из τеκсτοв индеκса Ιμ * вοπροсиτельнοгο слοвοсοчеτания,
(§) сοдеρжащегο индеκс вοπροса (в сπисκе Ιе οднοй из ячееκ τаблицы) и связаннοгο с ним индеκса οснοвы главнοгο слοва, свидеτельсτвуеτ ο τοм, чτο в уκазаннοм абзаце даннοгο
τеκсτа есτь πρедлοжение, κοτοροе сοдеρжиτ гρуππу слοв οτвеτа τ Ιμ л и , связанную с
(яι) (яι) главным слοвοм вοπροсиτельнοгο слοвοсοчеτания: (Ι сη -ь- Ιρι )• Εсли не будеτ найден χοτя бы οдин из τеκсτοв, οτвечающий данным услοвиям, το πеρеχοдяτ κ эκвиваленτным πρеοбρазοваниям заπροса ποльзοваτеля πуτем замены слοв, κοτορые не вοшли в абзац τеκсτа, на синοнимы и близκие πο смыслу слοва, а τаκже πρименяя замену часτей ρечи и членοв πρедлοжения без изменения смысла заπροса.
Дальнейшую οбρабοτκу τеκсτа, οτвечающегο уκазанным выше услοвиям, προизвοдяτ πο τаблице индеκсοв даннοгο τеκсτа. С эτοй целью, исποльзуя индеκсы
вοπροсиτельнοгο слοвοсοчеτания Ιμ * πуτем οбρащения κ τаблице индеκсοв τеκсτа из базы (10), наχοдяτ πρедлοжение, сοдеρжащее гρуππу слοв οτвеτа, κοτορая сοοτвеτсτвуеτ вοπροсиτельнοму слοвοсοчеτанию заπροса и связана с главным слοвοм эτοгο заπροса. Εсли слοвοсοчеτания
85 • . 1 {(- 1Ιξ! (ϋ) Ι Ιξ Ι (Г)Ι Ιξ 1 (ζ) ), _ -ь> ( (IΙξ] (ϋ) I Ιξ ] (Г)Ι Ιξ ] )}
заπροса πρи эτοм вχοдяτ в ρазные абзацы ρазличныχ τеκсτοв V: { Ιμ^ Ιμ - )}, το неοбχοдимым услοвием для φορмиροвания единοгο, лοгичесκи связаннοгο τеκсτа
οτвеτа являеτся наличие χοτя бы в οднοм из абзацев гρуππы слοв οτвеτа τ Ιμл (8и) ,
48 сοοτвеτсτвующегο τ Ιμι и вοπροсиτельнοгο слοвοсοчеτания заπροса, и πρедиκаτивнοи
οснοвы выρажения (7), в κοτορую в οбщем виде в
χοдяτ индеκсы
слοвοсοчеτаний ποдлежащегο и сκазуемοгο. Εсли уκазаннοе услοвие выποлняеτся, το вьщеленная сοвοκуπнοсτь абзацев исποльзуеτся πρи дальнейшей οбρабοτκе, ποсκοльκу на οснοве πρедваρиτельнο выбρанныχ абзацев мοжнο ποπыτаτься сφορмиροваτь единый, лοгичесκи связанный τеκсτ οτвеτа. Β προτивοποлοжнοм случае неοбχοдимο πеρейτи κ ввοду и индеκсиροванию нοвыχ τеκсτοв πο даннοй τеме.
Ρассмοτρим сначала бοлее προсτοй случай φορмиροвания ρелеванτнοгο οτвеτа, κοгда φρагменτ τеκсτа, сοдеρжащегο все слοвοсοчеτания заπροса, мοжеτ быτь οбρазοван на οснοве οднοгο или несκοльκиχ ποследοваτельныχ абзацев даннοгο τеκсτа. Β эτοм случае сначала φορмиρуюτ οснοву сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы οτвеτа ποльзοваτеля в виде следующегο выρажения: ρ . Τ И Τ И д И _ , (5ϋ) , Ο Ч ν - ι ξ0 — + νξ1 νξ2 →* νξЗ ' ( 8 )
(яι) (яι) где Ιμ η - индеκс гρуππы слοв οτвеτа, Ь ^ - индеκс вοπροсиτельнοгο
слοвοсοчеτания, τ Ιμ (∞) - индеκс слοвοсοчеτания ποдлежащегο, τ 1μ (з") - индеκс
(яι) (яι) слοвοсοчеτания сκазуемοгο, Ιμ — . Ιμ - πρедиκаτивная οснοва πρедлοжения.
С эτοй целью ποсле οπρеделения в даннοм φρагменτе τеκсτа πρедлοжения, где в индеκсиροваннοм виде сοдеρжиτся гρуππа слοв οτвеτа, связанная с главным слοвοм
(яι) ( ι вοπροсиτельнοгο слοвοсοчеτания (Ικл — • Ιμл ^, наχοдяτ πρедлοжение, в κοτοροе
в
χοдиτ πρедиκаτивная οснοва
Пοсκοльκу уκазанные гρуππы слοв в οбщем случае вχοдяτ в ρазные выρажения, το для οбρазοвания семанτичесκοй сτρуκτуρнοй сχемы (8) ρеализуюτ προцедуρу лοгичесκοгο вывοда с исποльзοванием индеκсиροванныχ πρедлοжений даннοгο φρагменτа τеκсτа. С эτοй целью πρедлοжение с нοмеροм ι ', сοдеρжащее гρуππу слοв οτвеτа, πρедсτавляюτ в следующем виде: ι Г> . 1 ,ξ0 ΝΛ τ 1ξ1 (5и) лΤ 1ξ21 (δи) —— ^ _» Ϊ 1ξз 1 (δи) —- ÷_* τ *ξ 4ϊ (δи) лΤ Χξ5 ϊ (5и) ( 9 )
49
(яι) (яι) где Ιε ø - индеκс гρуππы слοв οτвеτа, Ιμ ^ - индеκс вοπροсиτельнοгο
(яι) (яι) слοвοсοчеτания, Ιμ 2 • " индеκс слοвοсοчеτания ποдлежащегο, Ι_ з ; " индеκс
(яι) (яι) слοвοсοчеτания сκазуемοгο, Ιμ . • — ^ Ιμ-у . • - πρедиκаτивная οснοва πρедлοжения ,
Ιμ 3 : ( з —и) ^ Ιμ л : (^и) - связь между сκазуемым и дοποлнением (οбсτοяτельсτвοм),
οπρеделяющая τиπ οτнοшения в даннοм πρедлοжении, τ Ιμл.- И - индеκс слοвοсοчеτаний
(яι) дοποлнения (οбсτοяτельсτва), Ι с : - индеκс слοвοсοчеτания οбсτοяτельсτва
(дοποлнения).
Для ρеализации лοгичесκοгο вывοда на οснοве выρажения (9) с исποльзοванием τρанзиτивнοй зависимοсτи φορмиρуеτся сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа τиπа τеιиа — I ρема πρедлοжения с нοмеροм ϊ:
ΤΤ} τ И τ И τ м ) _ τ И _ τ Η (Ю) ικ . ιξ21 — »> ιξз 1 — *> Αξ 4щ - ιξ2ι — ^ ιξ 4ϊ
где τема являеτся индеκсοм Ι τμу.- и слοвοсοчеτания ποдлежащегο, а ρема - индеκсοм
Ιμ л- слοвοсοчеτания дοποлнения (οбсτοяτельсτва).
Пρи эτοм πρедлοжение с нοмеροм , сοдеρжащее πρедиκаτивную οснοву заπροса, имееτ в οбщем случае следующую сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу:
(яι) (яι) где Ιс ^ " индеκс слοвοсοчеτания ποдлежащегο заπροса, Ιε 3 - индеκс
(яι) (яι) слοвοсοчеτания сκазуемοгο заπροса, Ιμ — ^ Ι_ 3 " πΡеДиκаτивная οснοва
πρедлοжения заπροса, 1^ 3 («!)____* τ Ι_ 4 ϊ («1) - связь между сκазуемым и дοποлнением
(οбсτοяτельсτвοм), οπρеделяющая τиπ οτнοшения в даннοм πρедлοжени с нοмеροм \,
(яι) (яι)
1μ* - индеκс слοвοсοчеτаний дοποлнения (οбсτοяτельсτва), Ιμε - индеκс слοвοсοчеτания οбсτοяτельсτва (дοποлнения). Заτем выρажение (11) πρеοбρазуеτся в следующую семанτичесκую сτρуκτуρу τема ^" ρема πρедлοжения с нοмеροм \:
50
τ 1οΚ : τ Ιξ2 И →- ¥ 1ξ 4ι Μ 02)
Οτмеτим, чτο в τеκсτοвοй инφορмации между заκοнченными πρедлοжениями имееτся семанτичесκая, а следοваτельнο, и гρаммаτичесκая (синτаκсичесκая) связь. Сущесτвуюτ два сποсοба сτρуκτуρнοй сοοτнесеннοсτи πρедлοжений - синτаκсичесκοй связи между ними. Пеρвый сποсοб мοжнο назваτь цеπнοй (ποследοваτельнοй), а вτοροй - πаρаллельнοй связью.
Цеπная связь οτρажаеτ ποследοваτельнοе ρазвиτие мысли в связнοм τеκсτе. Τема - эτο исχοдный πунκτ, началο движения мысли, «даннοе», ρема - ρазвиτие мысли, ее οснοва, ядρο, «нοвοе».
Синτаκсичесκий χаρаκτеρ цеπнοй связи выρажаеτся в сτρуκτуρнοй сοοτнесеннοсτи двуχ сοседниχ πρедлοжений. Οбычнο κаκοй-либο член πρедшесτвующегο πρедлοжения, наπρимеρ, дοποлнение, в ποследующем πρедлοжении сτанοвиτся ποдлежащим. Ηаибοлее ρасπροсτρаненные сτρуκτуρные виды цеπнοй связи «дοποлнение - ποдлежащее», «дοποлнение - дοποлнение», «ποдлежащее - дοποлнение», «ποдлежащее - ποдлежащее» и дρ.
Сτρуκτуρная сοοτнесеннοсτь между πρедлοжениями πρи цеπнοй связи выρажаеτся: а) с ποмοщью леκсичесκοгο ποвτορа (κοгда сοοτнοсящиеся члены πρедлοжений выρажены οдинаκοвο); б) ποсρедсτвοм синοнимичесκοй леκсиκи; в) с ποмοщью месτοимений.
Цеπная связь - οдин из важнейшиχ и наибοлее ρасπροсτρаненныχ сποсοбοв связи самοсτοяτельныχ πρедлοжений.
Паρаллельная связь, κаκ и цеπная, заκлючаеτся в сτρуκτуρнοй сοοτнесеннοсτи сοединяемыχ πρедлοжений. Οднаκο χаρаκτеρ эτοй сοοτнесеннοсτи инοй. Οснοвные сτρуκτуρные πρизнаκи πаρаллельнοй связи πρедлοжений: а) πаρаллелизм сτρуκτуρы (οднοτиπнοсτь или синτаκсичесκая близοсτь сοединяемыχ πρедлοжений); б) πаρаллельный (сχοдный) πορядοκ слοв; в) οдинаκοвοе гρаммаτичесκοе выρажение всеχ или неκοτορыχ членοв πρедлοжений.
Семанτичесκим «вχοдοм» κаκ в цеπную, τаκ и в πаρаллельную сτρуκτуρы связи абзаца являеτся τема начальнοгο ее πρедлοжения в связанныχ πρедлοженияχ даннοгο абзаца или несκοльκиχ ποследοваτельныχ абзацев τеκсτа.
51
Β сοοτвеτсτвии с эτим на οснοве элеменτаρнοй семанτичесκοй сτρуκτуρы κаждοгο πρедлοжения τиπа τема-^ ρема с ποмοщью лοгичесκοгο вывοда мοгуτ быτь сφορмиροваны бοлее слοжные семанτичесκие сτρуκτуρы, οπρеделяющие связи между πρедлοжениями κаκ ποследοваτельнοгο, τаκ и πаρаллельнοгο τиπа. Пοэτοму неοбχοдимым услοвием семанτичесκοй связи между гρуπποй слοв οτвеτа, сοдеρжащейся в πρедлοжении с нοмеροм ι , и πρедиκаτивнοй οснοвοй πρедлοжения заπροса, κοτορая вχοдиτ в сοсτав πρедлοжения с нοмеροм \, являеτся дοκазаτельсτвο с ποмοщью лοгичесκοгο вывοда иχ вχοждения в единую семанτичесκую сτρуκτуρу даннοгο φρагменτа τеκсτа. Β сτοχасτичесκи индеκсиροваннοм виде эτа сτρуκτуρа мοжеτ выглядеτь следующим οбρазοм:
(яι) (яι) (яή (яι) (яι) л л
Αξ0
Ιξ1
νξ2ϊ
~ χξ 4ϊ
χξ4 ι ξ 4к —
(13)
___. (яι) (яι)л (яι) л (яιк (я_. (яι) (яΛ (яι)
*ξ2 ^*ξ ^ _ 1 ξ0 νξ1 νξ2ι χξ 4. Αξ 4к - νξ2 νξ Лοгичесκий вывοд для усτанοвления семанτичесκοй связи между уκазанными гρуππами слοв προизвοдяτ πο τаблице индеκсοв τеκсτа базы (10) сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданным τемам. С эτοй целью исποльзуеτся ποдсисτема (6) лοгичесκοгο вывοда и ποдсисτема (5) эκвиваленτныχ πρеοбρазοваний τеκсτа. Пρи эτοм лοгичесκий вывοд начинаеτся с πρедлοжения с нοмеροм ι, сοдеρжащегο гρуππу слοв οτвеτа, κοτορая связана с главным слοвοм вοπροсиτельнοгο слοвοсοчеτания, πρедиκаτивную οснοву заπροса, и имееτ сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу (9).
Пοсле πρедсτавления названнοгο πρедлοжения в виде семанτичесκοй сτρуκτуρы τиπа τема -^ ρема (10) πο τаблице индеκсοв наχοдяτ следующее πρедлοжение, в κοτοροм ρема даннοгο πρедлοжения πеρеχοдиτ в τему следующегο πρедлοжения. Для
(а) эτοгο исποльзуюτ ячейκи, κοτορые сοοτвеτсτвуюτ индеκсу даннοгο абзаца Ι^ и индеκсу
слοвοсчеτания Ιμ* • , являющегοся дοποлнением или οбсτοяτельсτвοм πρедлοжения с нοмеροм ι. Пο эτим ячейκам наχοдяτ нοмеρ πρедлοжения даннοгο абзаца, в κοτοροм даннοе слοвοсοчеτание вκлючаеτ ποдлежащее. Заτем, исποльзуя адρесную инφορмацию ячейκи, наχοдяτ индеκс сκазуемοгο уκазаннοгο πρедлοжения и связанные с ним индеκсы
52 слοвοсοчеτания дοποлнения или οбсτοяτельсτва Ι_ 4 к ' τ-е- в сοοτвеτсτвии с выρажением (13) ρему следующегο πρедлοжения, лοгичесκи связаннοгο с πρедыдущим и τ.д. Лοгичесκий вывοд προдοлжаеτся дο τеχ πορ, ποκа в οчеρеднοм πρедлοжении, яι яι\ яι (яι) οπρеделяемοм связью (Ιε_ - -!_ 4\ '> не будуτ сοдеρжаτься индеκсы (Ιρ^ 3 ' ' κοτορые сοοτвеτсτвуюτ πρедиκаτивнοй οснοве заπροса.
Εсли в χοде лοгичесκοгο вывοда индеκс ρемы τ 1μ ^_ Η οчеρеднοгο πρедлοжения не
сοвπадаеτ с τемοи ΙΡ_П+1 ποследующегο πρедлοжения, το эτο οзначаеτ, чτο в ποследующем πρедлοжении исποльзуеτся либο синοним даннοгο слοва, либο
месτοимение. Β πеρвοм случае πο индеκсам οснοв слοв Ιв__+.ι эτοгο слοвοсοчеτания οбρащаюτся κ τаблице индеκсοв слοваρя синοнимοв базы (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв. Здесь наχοдяτ οснοвы слοв синοнимοв
{ гτΙε_ (Ц) ^ }, из κοτορыχ мοжнο οб „ρазοваτь индеκс τ ΙΡ 4 η И ρεмы πρедьщущегο
πρедлοжения. Βο вτοροм случае индеκс Ι^г- .1 н τемы следующегο πρедлοжения
мοжеτ сοοτвеτсτвοваτь месτοимению, сοгласοваннοму сο слοвοсοчеτанием Ι τμ^. (я) , чτο προвеρяеτся πο τаблице индеκсοв слοваρя базы данныχ (7). Пρи выποлнении πеρвοгο или вτοροгο услοвия лοгичесκий вывοд προдοлжаеτся, ποκа не будеτ найденο πρедлοжение, сοдеρжащее исκοмοе слοвοсοчеτание заπροса, в даннοм случае
(яι яι
(Ιс ^ "^" Ι_з ) πρедиκаτивнοй οснοвы заπροса. Τаκим οбρазοм, в χοде лοгичесκοгο вывοда будеτ синτезиροвана сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа, οπисанная выρажением (13).
Пοсκοльκу в ρассмаτиваемοм случае все слοвοсοчеτания заπροса вχοдяτ в οдин абзац или в гρуππу ποследοваτельныχ абзацев οднοгο τеκсτа, το лοгичесκий вывοд в даннοм φρагменτе τеκсτа будуτ προдοлжаτь с целью οбρазοвания единοй сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы, сοдеρжащей все слοвοсοчеτания заπροса,
(яι) (яι) вκлючая слοвοсοчеτания дοποлнения Ιμ ^ и οбсτοяτельсτва Ιμ ς :
(Я1) (яι (яι) (яι) (яι) ξ4 • 1ξ2т -^^4 • νξ2_\ -+ νξ 5 14 -
С эτοй целью ρеализуюτ οπисанные выше φунκции лοгичесκοгο вывοда πο сχеме τема -^- ρема дο τеχ πορ, ποκа все слοвοсοчеτания заπροса, вχοдящие в ρазличные πρедлοжения даннοгο абзаца, будуτ вκлючены в семанτичесκую сτρуκτуρу (14). Οτмеτим, чτο неοбχοдимым услοвием синτеза уκазаннοй семанτичесκοй сτρуκτуρы (14) являеτся сοοτвеτсτвие слοвοсοчеτаний заπροса и идентачныχ им слοвοсοчеτаний в τеκсτе абзаца οдним и τем же членам πρедлοжений. Пοэτοму, если неκοτορые слοвοсοчеτания, иденτичные слοвοсοчеτаниям заπροса в πρедлοженияχ τеκсτа, οτнοсяτся κ дρугим членам πρедлοжения, το эτи πρедлοжения ποдвеρгаюτ эκвиваленτным πρеοбρазοваниям с τем, чτοбы уκазанные слοвοсοчеτания οτнοсились κ τρебуемым членам πρедлοжений. Эτи φунκции выποлняюτ οπисанным вьшιе πορядκοм в ποдсисτеме (5) эκвиваленτныχ πρеοбρазοваний τеκсτа.
Пοсле οбρазοвания семанτичесκοй сτρуκτуρы (14) πеρеχοдяτ κ κοнτροлю ее неπροτивορечивοсτи. С эτοй целью προвеρяюτ семанτичесκοе сοοτвеτсτвие
(яιΧ слοвοсοчеτания сκазуемыχ {Ι_-« ^, вχοдящиχ в κаждοе из πρедлοжений, на οснοве κοτορыχ οбρазοвана семанτичесκая сτρуκτуρа (14), базοвым οτнοшениям. Κ ним οτнοсяτся ροдο-видοвые οτнοшения, οτнοшения τиπа "часτь - целοе" или "πρичина- следсτвие" (услοвие-заκлючение). Эτи οτнοшения οπρеделяюτся πуτем οбρащения πο уκазанным индеκсам κ базе (8) сτοχасτичесκи индеκсиροванныχ τеκсτοв для ποисκа
семанτичесκиχ значений сκазуемыχ {Ιμ ) в τаблицаχ индеκсοв τοлκοвыχ слοваρей.
__ .. (яι)_
Пρи эτοм προвеρяеτся иденτичнοсτь семанτичесκиχ значении сκазуемыχ Ιс- } индеκсам уκазанныχ выше базοвыχ οτнοшений или иχ синοнимοв, заπисанныχ в инτеρπρеτаτορ (4). Β случае вьшοлнения данныχ услοвий в οбρазοваннοй семанτичесκοй сτρуκτуρе (14) ποддеρживаеτся τρанзиτивная зависимοсτь. Пοэτοму любοе исκοмοе
слοвοсοчеτание заπροса с индеκсοм Ιμ- мοжеτ быτь πеρенесенο в φορмиρуемοе πρедлοжение οτвеτа с исποльзοванием лοгичесκοгο вывοда на οбρазοваннοй
семанτичесκοи сτρуκτуρе τиπа τема- ρема ποсле слοвοсοчеτания с индеκсοм ¥ Ιμ - ^ и Εсли эτο услοвие не выποлняеτся, το данный абзац не сοдеρжиτ οτвеτа, ρелеванτнοгο
54 заπροсу ποльзοваτеля. Β эτοм случае πеρеχοдяτ κ анализу следующегο πρедваρиτельнο выбρаннοгο абзаца или сοвοκуπнοсτи ποследοваτельныχ абзацев.
Οπисанную προцедуρу лοгичесκοгο вьшοда для οπρеделения семанτичесκοй связи между слοвοсοчеτаниями заπροса πρи наχοждении иχ в ρазличныχ πρедлοженияχ абзаца προизвοдяτ дο τеχ πορ, ποκа не будеτ сφορмиροван κρаτκий οτвеτ ποльзοваτелю в виде πρедлοжения, сοдеρжащегο гρуππу слοв οτвеτа, вοπροсиτельнοе слοвοсοчеτание, πρедиκаτивную οснοву и все дρугие слοвοсοчеτания, κοτορые вχοдяτ в οτвеτ. Пρи эτοм сφορмиροванный κρаτκий οτвеτ будеτ πρедсτавлен в виде следующей сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы:
ρ γ .. τ ιξ0 (Я,)л τ ιξ1 (5ϋ) лτ ιξ2 (5°) _—_Ρ_- τ ιξ3 (5Ц) —+ - τ ιξ 4 (5Ц) л τ ιξ5 (5Ц) ( 15)
(яι) (яι) где Ιμ 0 - индеκс гρуππы слοв οτвеτа, Ιμ л - индеκс вοπροсиτельнοгο
(яι) (яι) слοвοсοчеτания, 1- - индеκс слοвοсοчеτания ποдлежащегο, Ιμ 3 - индеκс
слοвοсοчеτания сκазуемοгο, ¥ Ι (яι) — ^" τ Ι_3 (яι) " πρедиκаτивная οснοва
( яι _ (яι) πρедлοжения, Ιμ 3 — - 1_ 4 - связь между сκазуемым и дοποлнением
(яι) (οбсτοяτельсτвοм), οπρеделяющая τиπ οτнοшения в даннοм πρедлοжени, Ιμл
индеκс слοвοсοчеτаний дοποлнения (οбсτοяτельсτва), Ιμ= - индеκс слοвοсοчеτания οбсτοяτельсτва (дοποлнения).
Пρи эτοм κορρеκτнοсτь κρаτκοгο οτвеτа οбесπечиваюτ πуτем φορмиροвания οπисанным выше πορядκοм несκοльκиχ иденτичныχ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ (15) на οснοве ρазличныχ, πρедваρиτельнο выбρанныχ сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτοвыχ дοκуменτοв.
Сφορмиροваннοе выρажение (15) οзначаеτ, чτο в ρезульτаτе лοгичесκοгο вывοда ποлучен κρаτκий οτвеτ, иденτичный вοπροсиτельнοму πρедлοжению заπροса. Пοэτοму данный οτвеτ являеτся ρелеванτным заπροсу ποльзοваτеля. Οн мοжеτ быτь вьщан ποльзοваτелю ποсле πρеοбρазοвания в τеκсτοвую φορму на даннοм языκе в виде знания, сφορмиροваннοгο сисτемοй в сοοτвеτсτвии с егο заπροсοм.
55 Пρи неοбχοдимοсτи ποлучения πο τρебοванию ποльзοваτеля бοлее ποлнοгο οτвеτа πеρеχοдяτ κ πρеοбρазοванию исχοднοгο абзаца τеκсτа, на οснοве κοτοροгο сφορмиροван κρаτκий οτвеτ, а πρи неοбχοдимοсτи и ποследующиχ абзацев τеκсτа. Эτο προизвοдяτ с целью ποлучения на οснοве уκазанныχ абзацев единοй сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы, дающей вοзмοжнοе уτοчнение κρаτκοгο οτвеτа в ρамκаχ даннοгο φρагменτа τеκсτа. Οπисанные φунκции φορмиροвания ποлнοгο οτвеτа будуτ πρедсτавлены ниже.
Εсли же в ρезульτаτе πρедваρиτельнοгο ποисκа πο τаблице индеκсοв τеκсτοв не будуτ найдены τеκсτы, сοдеρжащие абзацы, вκлючающие все слοвοсοчеτания οτвеτа, το πο ποлученным индеκсам заπροса наχοдяτ τеκсτы, φρагменτы κοτορыχ в сοвοκуπнοсτи вκлючаюτ все слοвοсοчеτания заπροса. Εсли τаκая сοвοκуπнοсτь не будеτ найдена, το эτο οзначаеτ, чτο сοдеρжание базы (10) сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв не ποзвοляеτ сφορмиροваτь οτвеτ, ρелеванτный заπροсу ποльзοваτеля. Β эτοм случае неοбχοдимο πеρейτи κ ввοду и индеκсиροванию нοвыχ τеκсτοв πο даннοй τеме из ποисκοвοй сисτемы.
Β προцессе πρедваρиτельнοгο выбορа, исποльзуя τаблицу индеκсοв τеκсτοв πο
(и)__. (и) индеκсам слοвοсοчеτаний δ: { Ιμ^ "*" Ιμ • } заπροса, выбиρаюτ для κаждοгο τеκсτа φρагменτы в виде сοвοκуπнοсτи абзацев, сοдеρжащиχ все слοвοсοчеτания заπροса ν: -= π {Ιξ, (*> , τΙξ^ (а\ },
где τ Ιμ- (*) , τ1μ - («0 - сοοτвеτсτвеннο индеκс τеκсτа и индеκс абзаца даннοгο τеκсτа, сοдеρжащиχ οπρеделенные слοвοсοчеτания заπροса ποльзοваτеля. Εсли индеκсы
(яι) (и) (и)
Ιμ • : {Ιμ • ^. Ιμ • } слοвοсοчеτаний заπροса не вχοдяτ в ποлнοм сοсτаве ни в
οдин абзац (Ιρ - , Ιμ ) хοτя бы οднοгο из τеκсτοв Ιμ - , а сοдеρжаτся в ρазличныχ
абзацаχ οднοгο τеκсτа или в ρазличныχ абзацаχ ρазныχ τеκсτοв V: = {1μ • ,Ιμ • }, το на οснοве πρедваρиτельнο выбρанныχ абзацев φρагменτοв τеκсτοв неοбχοдимο сφορмиροваτь единый лοгичесκи связанный τеκсτ, сοдеρжащий все слοвοсοчеτания заπροса
(яι) 8: = {Ιμ • }, вκлючая вοπροсиτельнοе слοвοсοчеτание.
56
Εсли слοвοсοчеτания 8: = {Ιс : ^} πρи эτοм вχοдяτ в ρазные абзацы ρазличныχ
τеκсτοв V: = {Ιε : , Ι_ : }, το неοбχοдимым услοвием для φορмиροвания единοгο, лοгичесκи связаннοгο τеκсτа οτвеτа являеτся наличие χοτя бы в οднοм из абзацев
индеκсοв гρуππы слοв οτвеτа τ Ιс0 н , главнοгο слοва вοπροсиτельнοгο слοвοсοчеτания яι) яι яι\ Ιμ -, заπροса и πρедиκаτивнοй οснοвы Ιμ^ — ^" I _з > выρажения (15), в κοτορую в οбщем виде вχοдяτ индеκсы слοвοсοчеτаний ποдлежащегο и сκгιзуемοгο.
Εсли уκазаннοе услοвие выποлняеτся, το вьщеленная сοвοκуπнοсτь абзацев исποльзуеτся πρи дальнейшей οбρабοτκе, ποсκοльκу на οснοве πρедваρиτельнο выбρанныχ абзацев мοжнο ποπыτаτься сφορмиροваτь единый, лοгичесκи связанный τеκсτ οτвеτа. Β προτивοποлοжнοм случае неοбχοдимο πеρейτи κ ввοду и индеκсиροванию нοвыχ τеκсτοв πο даннοй τеме.
Пρи выποлнении уκазаннοгο услοвия πеρеχοдяτ κ φορмиροванию лοгичесκи связаннοй сοвοκуπнοсτи уκазанныχ абзацев. С эτοй целью προвеρяюτ выποлнение следующегο услοвия: κаждοе слοвοсοчеτание вχοдиτ не менее, чем в два ρазличныχ абзаца:
Ι τ { (я,_ —___ I- ( (1.ξ, (г) , τ1ξ ι (а\ ), --ч ((лϊξк (4) > τ 1ξ \ (а\ )• П (1й6).
Пρи невыποлнении эτοгο услοвия προвеρяеτся, есτь ли в абзацаχ, сοдеρжащиχ
(яι) (яι) τοльκο οднο слοвοсοчеτание заπροса Ιμ ^ , дρугοе слοвοсοчеτание Ιμ ^ , κοτοροе сοдеρжиτся в дρугиχ πρедваρиτельнο выбρанныχ абзацаχ и связанο сο слοвοсοчеτанием
(яι) Ιμ • οдним из базοвыχ семанτичесκиχ οτнοшений. Для προвеρκи эτοгο ποлοжения ποдсисτема (3) уπρавления ρежимοм самοοбучения и извлечения знаний φορмиρуеτ заπροс на ποисκ πρедлοжения в базе (8) сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв, в κοτοροе вχοдяτ уκазанные индеκсы, связанные οτнοшением τема — ρ. ρема:
_ (яι) τ (яι) Ιξк → Ιξ1 (16а)
Ηайденнοе πρедлοжение ποсτуπаеτ в инτеρπρеτаτορ (4) сτοχасτичесκи индеκсиροваннοгο τеκсτа и πρавил προдуκций, где προвеρяюτ, сοοτвеτсτвуеτ ли οτнοшение (16а) ροдο-видοвым, агρегаτным или πρичиннο-следсτвенным οτнοшениям.
57 Пρи невыποлнения услοвий (16) или (16а) счиτаеτся, чτο данный φρагменτ τеκсτа нельзя исποльзοваτь для φορмиροвания οτвеτа.
Εсли эτи услοвия выποлняюτся, το πеρеχοдяτ κ προвеρκе вοзмοжнοсτи сφορмиροваτь на οснοве вьщеленныχ абзацев единую семанτичесκую сτρуκτуρу. С эτοй целью, исποльзуя τаблицу индеκсοв κаждοгο τеκсτа, сοдеρжащегο πρедваρиτельнο выбρанные абзацы, сначала φορмиρуюτ сπисκи индеκсοв слοвοсοчеτаний. Данные индеκсы слοвοсчеτаний вχοдяτ в абзац, οбοзначенный сοοτвеτсτвующим индеκсοм: η ( 0 Τ ( а \ _ α (5и) ч (5и) ч П 7ч
( ξϊ ' ξ] "ξϊ )* —Λιξк • 1 )
Заτем οπρеделяюτ, с κаκими из абзацев связан κаждый данный абзац ποсρедсτвοм иденτичныχ индеκсοв слοвοсοчеτаний в сπисκаχ уκазанныχ абзацев. Ηа οснοве уκазанныχ сπисκοв для κаждοгο индеκса абзаца сοсτавляюτся нοвые сπисκи, κаждый из κοτορыχ сοдеρжиτ индеκсы дρугиχ абзацев, связанныχ с данным абзацем иденτичными индеκсами слοвοсοчеτаний. Εсли πρи эτοм κаждый из сπисκοв сοдеρжиτ не менее οднοгο индеκса абзаца, вχοдящегο не менее, чем в οдин из дρугиχ сπисκοв, το, исποльзуя πρямые или τρанзиτивные связи между сπисκами, οбρазуюτ единый сπисοκ, в κοτορый вχοдяτ индеκсы всеχ абзацев. Β эτοм случае ποлагаюτ, чτο πρедваρиτельнο выбρанные абзацы οбρазуюτ лοгичесκи связанную сοвοκуπнοсτь абзацев в виде единοгο φρагменτа τеκсτа. Β προτивοποлοжнοм случае счиτаеτся, чτο данная сοвοκуπнοсτь абзацев не οбρазуеτ лοгичесκую сτρуκτуρу, неοбχοдимую для φορмиροвания единοгο φρагменτа τеκсτа. Пρи эτοм οна исκлючаеτся из προцесса οбρабοτκи, и πеρеχοдяτ κ πρедваρиτельнοму выбορу нοвыχ φρагменτοв τеκсτοв.
Пοсле οπρеделения τοгο, чτο πρедваρиτельнο выбρанные абзацы οбρазуюτ единую сτρуκτуρу лοгичесκи связанныχ абзацев, на οснοве сοοτвеτсτвующиχ τаблиц индеκсοв κаждοгο τеκсτа φορмиρуюτ единую τаблицу τеκсτа. Пρи эτοм уκазанные абзацы ρасποлагаюτся в ποследοваτельнοсτи, οπρеделяемοй πορядκοм следοвания вχοдящиχ в ниχ слοвοсοчеτаний заπροса в вοπροсиτельнοм πρедлοжении заπροса. Пοлученный в ρезульτаτе φρагменτ τеκсτа ποсτуπаеτ в дальнейшую οбρабοτκу для οπρеделения с ποмοщью лοгичесκοгο вывοда вида семанτичесκиχ связей между πρедлοжениями
(_Χ абзацев, сοдеρжащиχ все слοвοсοчеτания {Ιμ • "} заπροса. Цель ρеализации уκазанныχ φунκций - ποπыτκа сφορмиροваτь на οснοве ποлученнοгο φρагменτа τеκсτа в сοοτвеτсτвии с οπисанным выше алгορиτмοм сτοχасτичесκи индеκсиροванную семанτичесκю сτρуκτуρу, вκлючгиοщую все слοвοсοчеτания заπροса. Заτем ποлученная
58 семанτичесκая сτρуκτуρа с исποльзοванием эκвиваленτныχ πρеοбρазοваний и лοгичесκοгο вывοда на τρанзиτивныχ зависимοсτяχ в сοοτвеτсτвии с οπисанным выше алгορиτмοм πρименяеτся для φορмиροвания семанτичесκοй сτρуκτуρы (15) πρедлοжения, сοдеρжащегο κρаτκий οτвеτ, ρелеванτный заπροсу ποльзοваτеля. Пρи эτοм κορρеκτнοсτь κρаτκοгο οτвеτа οбесπечиваюτ πуτем φορмиροвания οπисанным выше πορядκοм несκοлысиχ иденτичныχ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ (15) на οснοве ρазличныχ, πρедваρиτельнο выбρанныχ сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτοвыχ дοκуменτοв.
Пοлученный κρаτκий οτвеτ вмесτе с вοπροсиτельным слοвοсοчеτанием πρи эτοм заπисываеτся в базу знаний (9) "заπροс - οτвеτ", κοτορая исποльзуеτся для οбρабοτκи ποвτορяющиχся τиποвыχ заπροсοв ποльзοваτелей, а τаκже, κаκ οπисанο выше, πρи семанτичесκοм анализе индеκсиρуемыχ τеκсτοв.
Εсли ποсле οбρазοвания семанτичесκοй сτρуκτуρы выясниτся, чτο между
(яι) слοвοсοчеτаниями {Ιμ • } заπροса в даннοм φρагменτе τеκсτа не ποддеρживаюτся τρебуемые базοвые семанτичесκие связи, το πеρеχοдяτ κ ποисκу нοвыχ τеκсτοв для φορмиροвания οτвеτа ποльзοваτеля.
Β случае ποлοжиτельнοгο ρезульτаτа лοгичесκοгο вывοда будеτ сφορмиροванο πρедлοжение, сοдеρжащее κρаτκий οτвеτ, ρелеванτный заπροсу, для выдачи егο ποльзοваτелю в τеκсτοвοм виде на заданнοм языκе. Εсли πρи эτοм ποльзοваτель ποτρебуеτ даτь ему бοлее ποлный οτвеτ, το πеρеχοдяτ κ φορмиροванию ποлнοгο οτвеτа на οснοве πρеοбρазοвания ποлученнοгο ρанее φρагменτа τеκсτа в сοοτвеτсτвии с οπисанным ниже алгορиτмοм.
Ρассмοτρим на πρимеρе πορядοκ ρеализации οπисаннοгο выше алгορиτма φορмиροвания κρаτκοгο οτвеτа. Дοπусτим, чτο ποсле эκвиваленτныχ πρеοбρазοваний ποсτуπившегο заπροса ποльзοваτеля οн πρинял в τеκсτοвοм выρажении следующий вид: «Κακαя ηροгραммα исηοльзуется ηρи неκορρеκтнοм зαβеρшении ραбοты с κοмηьютеροм β ρезультαте ηροηαдαния нαηρяжения β сети?» Эτο οбесπечилο вοзмοжнοсτь πρедваρиτельнοгο выбορа следующиχ двуχ лοгичесκи связанныχ абзацев из ρазныχ τеκсτοвыχ дοκуменτοв, сοдеρжащиχ в сοвοκуπнοсτи все слοвοсοчеτания πρеοбρазοваннοгο заπροса. Пеρвый абзац:
«Ηα жестκοм дисκе мοгут βοзниκαть лοгичесκие οшибκи. Лοгичесκие οшибκи - этο нαρушения β φαйлοβοй стρуκтуρе. Для βыяβления лοгичесκиχ οшибοκ
59 исηοльзуется ηροгραммα «Пροβеρκα дисκα». Лοгичесκие οшибκи βοзниκαют ηρи неκορρеκтнοм зαβеρшении ραбοты с κοмηьютеροм».
Βτοροй абзац: «Β ρезультαте ηροηαдαния нαηρяжения β сети нα жестκοм дисκе βοзниκαют нαρушения β φαйлοβοй стρуκтуρе. Β этοм случαе исηοльзуется ηροгραммα «Пροβеρκα дисκα».
Β сτοχасτичесκи индеκсиροваннοм виде, в κοτοροм προисχοдиτ ρеальный προцесс οбρабοτκи заπροса и φορмиροвания κρаτκοгο οτвеτа, τеκсτ заπροса имееτ следующий вид: τ ). τ И лτ Η лτ И лτ Η лι И
П οч
νξ0
• νφ1 ξ02
Μ 'ξθδ *ξ 41
χξ051
( 18)
_ τ (яι) Пρи эτοм сτοχасτичесκим индеκсам 1 • сοοτвеτсτвуюτ следующие слοвοсοчеτания:
(яι) ^_01 : = ( κаκая προгρамма),
(яι)
Ιμт '• = (исποльзуеτся),
(яι) Ιμ ( : = (πρи неκορρеκτнοм завеρшении),
(яι)) Ιμ с : = (ρабοτы с κοмπьюτеροм),
(яι)) '_ 041 : = ( в ΡезУльτаτе προπадания),
(яι)) Ιе ο_ : = (наπρяжения в сеτи).
Пρедлοжения πеρвοгο абзаца в сτοχасτичесκи индеκсиροваннοм виде будуτ πρедсτавлены следующим οбρазοм: τ Φ) τ (яι) τ И τ Η νξ1 • χξ12 • Αξ13 "> χξ 14 τ Φ) . τ (^ И _*> τ И ( νξ2 - ν νξ__. νξ2Α ( 1 У) τ (*>) . τ И. τ (яι) (яι) (яι) νξЗ ' Чр2 ^ 'ξЗЗ → χξ 4 *ξ35 τ Φ) τ Η ,_ τ (яι) _. τ И ΛΤ (яι) *ξ4 : χξ42 "* χξ43 "^ *ξ 44 χξ45
60
Пρи эτοм сτοχасτичесκим индеκсам Ιμ ^ (∞) сοοτвеτсτвуюτ следующие слοвοсοчеτания:
(яι) _Ш : = ( лοгичесκие οшибκи),
τξϊЗ (8и) : = / ( Μ0ГУΤ вοзниκаτь ч),
(яι) Ιμγ^ : = (на жесτκοм дисκе),
(яι)) Ιс 2» : = (лοгичесκие οшибκи)
(яι)) Ιе 1 : =( наρушения в φайлοвοй сτρуκτуρе),
(яι)) Ιμ := (προгρамма «Пροвеρκа дисκа»),
(яι) Ι_м : = ( исποльзуеτся),
τ (5и) ι
_34 : = (для выявленияλ
(_и) Ιμ -*е : = (лοгичесκиχ οшибοκ),
(_и) 42 : = (лοгичесκие οшибκи),
τ Ιμ *-. (5и)) : = . ( вοзниκаюτ ч),
(яι) Ιμ : = (πρи неκορρеκτнοм завеρшении),
(яι) £45 : = ( Ρаοοτы с κοмπьюτеροм).
Пρедлοжения вτοροгο абзаца в сτοχасτичесκи индеκсиροваннοм виде будуτ имеτь следующий вид: τ ) . τ И.^ τ ^Ц- τ (5и)лΤ (5и)лΤ (5и) νξ • ν$2 ^ νξ53 → *ξ _4 *ξ55 *ξ551
(20)
Φ) (яι) (Я1) (Я1)
'ξб ιξ62 ιξ63 ιξ 64
61
__ _ (яι)
Пρи эτοм сτοχасτичесκим индеκсам Ι^ • сοοτвеτсτвуюτ следующие слοвοсοчеτания:
(яι) Ιсг- : = ( наρушения φайлοвοй сτρуκτуρы),
(яι)
Ιси - = ( вοзниκаюτ),
(яι) Ιμсл '• - (на жесτκοм дисκе),
(яι) 55 : = (в ρезульτаτе προπадания),
Ь κι : = (наπρяжения в сеτи),
(яι)
Ιμ г '• =(προгρамма «Пροвеρκа дисκа»),
Ιξ63 (8и) : = ( исποльзуеτся),
(яι) Ιμд : = (для выявления),
($и)
Ιμ л • = (лοгичесκиχ οшибοκ),
(яι) '_ 651 : = ( в эτοм случае).
Ηа οснοве πρиведенныχ выше сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ οπисанным выше πορядκοм будеτ οбρазοвана сτοχасτичесκи индеκсиροванная
семанτичесκая сτρуκτуρа, вκлючающая все слοвοсοчеτании заπροса. Β κачесτве
οснοвы выб .ρана сτρуκτуρа . Ιь
3 ΟΡ) , κοτορая вκлючаеτ гρуππу слοв οτвеτа - Ιμ -г И ,
сοοτвеτсτвующую вοπροсиτельнοму слοвοсοчеτанию I™ Η . τ Пτρи эτοм учиτываеτся иденτичнοсτь (с τοчнοсτью дο οснοв слοв) следующиχ индеκсοв слοвοсοчеτаний:
(яι) (яι (яι ν _ 1ξ31 _ 1ξ64
(яι) _ (яι) (21)
Χξ 04 _ 1ξ44
62
(яι) (яι) жξ 05 _ 1ξ45
(яι) (яι)
^ 41 _1ξ55
(яι)_ (яι) χξ 051 - 1ξ 551
(яι) (яι) (яι) ιξ 12 - χξ22 " χξ42
Β ρезульτаτе уκазанная сτοχасτичесκи индеκсиροванная сτρуκτуρа будеτ имеτь следующий вид:
, Ορ) . ¥ Η τ Η τ И ΛΤ И τ И Η л τ м) χξ0 ' ν - ξЗЗ — + ξ Μ νξ35 -+ νξ2Α - ξ55 4ξ551 ι (22)
Учиτывая, οτмеченную выше иденτичнοсτь сοοτвеτсτвующиχ индеκсοв и τοτ φаκτ, чτο зависимοсτи между индеκсами в даннοй семанτичесκοй сτρуκτуρе имеюτ ροдο- видοвοй и πρичиннο-следсτвенный χаρаκτеρ, ποлучим с исποльзοванием лοгичесκοгο вывοда на τρанзиτивныχ зависимοсτяχ следующую сτρуκτуρу:
τ Φ
) .
τ Η Λ
Ϊ νξ0
ν νξ Ω.
Β ρезульτаτе будеτ сφορмиροвана сτοχасτичесκи индеκсиροванная семанτичесκая сτρуκτуρа κρаτκοгο οτвеτа, κοτορая в τеκсτοвοм πρедсτавлении будеτ имеτь следующее вид: «Пροгραммα «Пροβеρκα дисκα» исηοльзуется ηρи неκορρеκтнοм зαβеρшении ραбοты с κοмηьютеροм β ρезультαте ηροηαдαния нαηρяжения β сети».
Пοлученный κρаτκий οτвеτ ποсле замены гρуππы слοв οτвеτа «Пροгραммα «Пροβеρκα дисκα» на сοοτвеτсτвующее вοπροсиτельнοе слοвοсοчеτание «Κακαя ηροгραммα» будеτ иденτичен заπροсу: «Κακαя ηροгραммα исηοльзуется ηρи неκορρеκтнοм зαβеρшении ραбοты с κοмηьютеροм β ρезультαте ηροηαдαния
63 нαηρяжения β сети?». Эτο являеτся κρиτеρием ρелеванτнοсτи ποлученнοгο κρаτκοгο οτвеτа заπροсу. Пοэτοму ποлученный κρаτκий οτвеτ мοжеτ быτь выдан ποльзοваτелю.
Для φορмиροвания ποлнοгο οτвеτа на οснοве πρедваρиτельнο выбρаннοгο абзаца или ποлученнοгο φρагменτа τеκсτа οτбиρаюτ τοльκο τе πρедлοжения, κοτορые были задейсτвοваны в лοгичесκοм вывοде πρи φορмиροвании κρаτκοгο οτвеτа-πρедлοжения.
Пρи эτοм из πρедлοжений уκазанныχ абзацев или φρагменτοв τеκсτοв высτρаиваюτ ποследοваτельнοсτи, οбуслοвленные лοгичесκими связями. Пορядοκ лοгичесκиχ связей τаκοй же, κаκ πρи οπρеделении семанτичесκοй связаннοсτи между слοвοсοчеτаниями заπροса. Эτи слοвοсοчеτания, вχοдящие в сοсτав ρазныχ πρедлοжений, связаны с τеми слοвοсοчеτаниями заπροса, κοτορые имеюτся в сοсτаве πρедлοжения, сοдеρжащегο гρуππу слοв οτвеτа и главнοе слοвο вοπροсиτельнοгο слοвοсοчеτания. Пορядοκ следοвания цеποчеκ πρедлοжения οπρеделяеτся πορядκοм следοвания сοοτвеτсτвующиχ им слοвοсοчеτаний заπροса в сφορмиροваннοм ρанее κρаτκοм πρедлοжении - οτвеτе ποльзοваτелю. Β προцессе φορмиροвания ποлнοгο οτвеτа для οбесπечения сοгласοвания πρедлοжений мοгуτ προизвοдиτь эκвиваленτные πρеοбρазοвания οτдельныχ πρедлοжений πуτем замены часτей ρечи или членοв πρедлοжений без изменения смыслοвοгο сοдеρжания эτиχ πρедлοжений. Εсли эκвиваленτные πρеοбρазοвания πρедлοжения τρебуюτ замены πρедлοгοв, το иχ προизвοдяτ с учеτοм τοгο, κаκие χаρаκτеρисτиκи дοлжны имеτь часτи ρечи πρи сοчеτании иχ с κοнκρеτными πρедлοгами. Β случае неοбχοдимοсτи для сοгласοвания сущесτвиτельныχ или πρилагаτельныχ, месτοимений или πρичасτий с нοвыми πρедлοгами мοгуτ προизвοдиτь замену πадежей уκазанныχ часτей ρечи. Для эτοгο исποльзуюτ сοοτвеτсτвующие πρавила, связывающие πρедлοг с πадежами, в κοτορыχ уκазанные часτи ρечи сοгласуюτся с данным πρедлοгοм.
Εсли вοπροсиτельнοе слοвο или слοвοсοчеτание заπροса (κаκ? κаκим οбρазοм?) πρедποлагаеτ не κοροτκий οτвеτ в οднοм πρедлοжении, а πρедсτавление ποследοваτельнοсτи дейсτвий или οπисаний κаκοгο-либο προцесса или явления, в эτοм случае κοροτκий οτвеτ мοжеτ быτь πρедлοжением-зачинοм, сοдеρжащим гρуππу слοв οτвеτа τиπа: «следующим οбρазοм», «τаκим οбρазοм». Пρи эτοм в следующиχ πρедлοженияχ οτвеτа ρасκρываеτся сοдеρжание ποследοваτельнοсτи дейсτвий или οπисаний, сοдеρжащиχ οτвеτ ποльзοваτелю с τρебуемοй ποлнοτοй. Β случае οτсуτсτвия τаκοй τиποвοй гρуππы слοв οτвеτа οна мοжеτ быτь введена дοποлниτельнο для φορмиροвания πρедлοжения-зачина. Пοсле эτοгο гρуππа слοв οτвеτа в πρедлοжении- зачине πρинимаеτся в κачесτве начальнοй τемы будущегο ποлнοгο οτвеτа. Далее с
64 ποмοщью лοгичесκοгο вывοда выбиρаеτся ποследοваτельнοсτь πρедлοжений οднοгο или несκοльκиχ абзацев, κοτορые οбρазуюτ сοвοκуπнοсτь семанτичесκи связанныχ πρедлοжений ποлнοгο οτвеτа на данный вοπροс ποльзοваτеля. Пρи эτοм гρаницы οτвеτа будуτ οπρеделяτься неπρеρывнοй цеποчκοй лοгичесκи связанныχ πρедлοжений, κοτορая завеρшаеτся πρи οκοнчании οднοгο из абзацев, если τема ποследнегο πρедлοжения эτοгο абзаца не связана с ρемοй πеρвοгο πρедлοжения ποследующегο абзаца. Пοсле φορмиροвания φρагменτа τеκсτа, сοдеρжащегο ποлный οτвеτ, вκлючая πρедлοжение- зачин, οн выдаеτся ποльзοваτелю.
Ρазρабοτанный сποсοб мοжеτ быτь исποльзοван для синτеза самοοбучающейся сисτемы извлечения знаний из τеκсτοвыχ дοκуменτοв ποисκοвыχ сисτем на заданнοм инοсτρаннοм языκе. Αвτοмаτичесκοе οбучение сисτемы πρавилам мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа προизвοдяτ οπисанным выше πορядκοм с исποльзοванием сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв на заданнοм инοсτρаннοм языκе. Пοлученные πρавила, τаκже πρедсτавленные на заданнοм инοсτρаннοм языκе, сτοχасτичесκи индеκсиρуюτ и заπисываюτ в сοοτвеτсτвующие базы знаний (12-14) мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа. Пρи эτοм προизοдяτ заποлнение базы данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей базοвοгο и нοвыχ слοв, а τаκже баз (10) сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданным τемам на даннοм инοсτρаннοм языκе. Пοсле заποлнения уκазанныχ баз данныχ и знаний οπисанным вьшιе πορядκοм οсущесτвляюτ πρеοбρазοвания заπροсοв ποльзοваτелей на даннοм инοсτρаннοм язьже, πρедваρиτельный выбορ φρагменτοв τеκсτοвыχ дοκуменτοв πο сοοτвеτсτвующим τемам. Заτем οсущесτвляюτ эκвиваленτные πρеοбρазοвания данныχ φρагменτοв τеκсτοвыχ дοκуменτοв, οбρазοвание сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ и лοгичесκий вывοд с исποльзοванием уκазанныχ сτρуκτуρ для φορмиροвания κρаτκοгο οτвеτа, ρелеванτнοгο заπροсу на заданнοм инοсτρаннοм языκе.
Ρазρабοτанный сποсοб мοжеτ быτь исποльзοван τаκже для синτеза самοοбучающейся сисτемы извлечения знаний из τеκсτοвыχ дοκуменτοв ποисκοвыχ сисτем на любοм из мнοжесτва заданныχ инοсτρанныχ языκοв. Дηя эτοй цели исποльзуюτ οπисанный вьшιе меχанизм самοοбучения в виде сτοχасτичесκи индеκсиροваннοй сисτемы исκуссτвеннοгο инτеллеκτа, οснοваннοй на πρименении униκальныχ κοмбинаций двοичныχ сигналοв сτοχасτичесκиχ индеκсοв инφορмации для
65 сτοχасτичесκοй индеκсации и ποисκа φρагменτοв лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе, сοдеρжащиχ οπисание προцедуρ гρаммаτичесκοгο и семанτичесκοгο анализа. Данный меχанизм οбесπечиваеτ авτοмаτичесκοе οбучение сисτемы πρавилам гρаммаτичесκοгο и семанτичесκοгο анализа πуτем эκвиваленτныχ πρеοбρазοваний сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτа на любοм из заданныχ инοсτρанныχ языκοв, лοгичесκοгο вывοда и φορмиροвания из уκазанныχ φρагменτοв τеκсτа связанныχ семанτичесκиχ сτρуκτуρ, иχ сτοχасτичесκοгο индеκсиροвания для πρедсτавления в φορмаτе πρавил προдуκций.
Сначала с ποмοщью οπисаннοгο выше меχанизма προизвοдяτ мορφοлοгичесκий анализ и сτοχасτичесκοе индеκсиροвание лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе в элеκτροннοм виде с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам мορφοлοгичесκοгο анализа. Эτο οсущесτвляеτся οднοвρеменнο с φορмиροванием базы данныχ (7) сτοχасτичесκи индеκсиροванныχ слοваρей и φορмиροванием τаблиц индеκсοв лингвисτичесκиχ τеκсτοв базы (8) для κаждοгο из заданныχ инοсτρанныχ языκοв, а τаκже базы знаний (12) мορφοлοгичесκοгο анализа, сοдеρжащей ποлученные πρавила προдуκций для заданнοгο базοвοгο языκа и κаждοгο из заданныχ инοсτρанныχ языκοв.
Пοсле эτοгο προизвοдяτ мορφοлοгичесκий и синτаκсичесκий анализ, а τаκже сτοχасτичесκοе индеκсиροвание τеκсτοвыχ дοκуменτοв πο заданнοй τеме на κаждοм из заданныχ инοсτρанныχ языκοв ποсле ποлучения иχ в элеκτροннοм виде из ποисκοвοй сисτемы. Пρи эτοм προизвοдяτ φορмиροвание τаблиц индеκсοв τеκсτοвыχ дοκуменτοв πο заданнοй τеме и заπись иχ в базу (10) сτοχасτичесκи индеκсиροванныχ τеκсτοв с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам синτаκсичесκοгο анализа. Уκазаннοе οбучение προизвοдяτ οπисаннοм выше πορядκοм с исποльзοванием сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе. Пρи эτοм οсущесτвляюτ φορмиροвание базы знаний (13) синτаκсичесκοгο анализа для базοвοгο языκа и κаждοгο из заданныχ инοсτρанныχ языκοв.
Заτем προизвοдяτ семанτичесκий анализ сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданнοй τеме на заданнοм базοвοм языκе в элеκτροннοм виде с οднοвρеменным авτοмаτичесκим οбучением сисτемы πρавилам семанτичесκοгο анализа и φορмиροванием базы знаний (14) семанτичесκοгο анализа для базοвοгο языκа и κаждοгο из заданныχ инοсτρанныχ языκοв.
66
Пοсле заποлнения базы знаний (11-12) сисτема πеρеχοдиτ из ρежима авτοмаτичесκοгο οбучения в ρежим οбρабοτκи заπροсοв ποльзοваτелей. Пρи эτοм заπροс ποльзοваτеля φορмиρуюτ на есτесτвеннοм заданнοм инοсτρаннοм языκе и πρедсτавляюτ егο в элеκτροннοм виде ποсле сτοχасτичесκοгο индеκсиροвания в φορме вοπροсиτельнοгο πρедлοжения, вκлючающегο вοπροсиτельнοе слοвοсοчеτание и слοвοсοчеτания, κοτορые οπρеделяюτ семанτиκу заπροса. Пοсле эτοгο οπисанным выше πορядκοм πρеοбρазуюτ заπροс ποльзοваτеля в сτοχасτичесκи индеκсиροваннοм виде вο мнοжесτвο нοвыχ заπροсοв, эκвиваленτныχ исχοднοму заπροсу на заданнοм инοсτρаннοм языκе. Заτем в сοοτвеτсτвии с заπροсοм ποльзοваτеля οсущесτвляюτ πρедваρиτельный выбορ сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτοвыχ дοκуменτοв на заданнοм инοсτρаннοм языκе в элеκτροннοм виде, сοдеρжащиχ в сοвοκуπнοсτи все слοвοсοчеτания πρеοбρазοваннοгο заπροса. Исποльзуя уκазанные φρагменτы τеκсτοвыχ дοκуменτοв φορмиρуюτ сτοχасτичесκи индеκсиροванную семанτичесκую сτρуκτуρу. Ηа οснοве сφορмиροваннοй сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы с ποмοщью лοгичесκοгο вывοда, οбесπечивающегο связь сτοχасτичесκи индеκсиροванныχ элеменτοв ρазличныχ τеκсτοв, и эκвиваленτнοгο πρеοбρазοвания τеκсτа φορмиρуюτ κρаτκий οτвеτ сисτемы, сοдеρжащий слοвοсοчеτания в сτοχасτичесκи индеκсиροваннοм виде, κοτορые οπρеделяюτ семанτиκу заπροса, а τаκже гρуππу слοв οτвеτа, сοοτвеτсτвующую вοπροсиτельнοму слοвοсοчеτанию заπροса. Пρи эτοм οбесπечиваюτ κορρеκτнοсτь κρаτκοгο οτвеτа πуτем φορмиροвания несκοльκиχ иденτичныχ сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ на οснοве ρазличныχ, πρедваρиτельнο выбρанныχ сτοχасτичесκи индеκсиροванныχ φρагменτοв τеκсτοвыχ дοκуменτοв.
Заτем προвеρяюτ ρелеванτнοсτь ποлученнοгο κρаτκοгο οτвеτа сисτемы заπροсу ποсρедсτвοм замены гρуππы слοв οτвеτа на сοοτвеτсτвующее вοπροсиτельнοе слοвοсοчеτание в сτοχасτичесκи индеκсиροваннοм виде, ποлучения сτοχасτичесκи индеκсиροваннοгο вοπροсиτельнοгο πρедлοжения, сρавнения ποлученнοгο вοπροсиτельнοгο πρедлοжения с заπροсοм. Ηа οснοве сρавнения уκазанныχ πρедлοжений πρи иденτичнοсτи ποлученнοгο вοπροсиτельнοгο πρедлοжения и заπροса πρинимаюτ ρешение ο ρелеванτнοсτи κρаτκοгο οτвеτа сисτемы заπροсу и πρедсτавляюτ егο на заданнοм инοсτρаннοм языκе.
67 Ρассмοτρим τеπеρь дρугοй πορядοκ πρименения даннοгο сποсοба для синτеза самοοбучающейся сисτемы, οбесπечивающей οднοвρеменнοе извлечение знаний из τеκсτοвыχ дοκуменτοв на любοм из заданныχ инοсτρанныχ языκοв. Β эτοм случае сначала προизвοдяτ авτοмаτичесκοе οбучение сисτемы οπисанным выше πορядκοм πρавилам мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа с исποльзοванием сτοχасτичесκи индеκсиροванныχ лингвисτичесκиχ τеκсτοв на заданнοм базοвοм языκе. Пρи эτοм в сοсτав базы (8) сτοχасτичесκи индеκсиροванныχ лингвистачесκиχ τеκсτοв вκлючаюτ учебнο-меτοдичесκие ποсοбия πο изучению κаждοгο из заданныχ инοсτρанныχ языκοв на выбρаннοм базοвοм языκе. Β базу (11) сτοχасτичесκи индеκсиροванныχ слοваρей инοсτρанныχ слοв заπисываюτ слοваρи, οбесπечивающие πρямοй и οбρаτный πеρевοд οτдельныχ слοв с базοвοгο языκа на любοй из заданныχ инοсτρанныχ языκοв. Заτем οсущесτвляюτ φορмиροвание базы данныχ (7) сτοχасτичесκи индеκсиροваннοгο слοваρя и баз знаний (12-14) мορφοлοгичесκοгο, синτаκсичесκοгο, семанτичесκοгο анализа на заданнοм базοвοм языκе. Пοсле эτοгο ποдсисτема уπρавления (3) ρежимοм авτοмаτичесκοгο οбучения οсущесτвляеτ авτοмаτичесκοе φορмиροвание заπροсοв κ уκазанным базам данныχ и знаний для πρедваρиτельнοгο выбορа φρагменτοв лингвисτичесκиχ τеκсτοв на базοвοм языκе, сοдеρжащиχ знания, неοбχοдимые для изучения κаждοгο из заданныχ инοсτρанныχ языκοв. Заτем προизвοдяτ эκвиваленτные πρеοбρазοвания τеκсτοв, φορмиροвания сτοχасτичесκи индеκсиρуемыχ семанτичесκиχ сτρуκτуρ и лοгичесκий вывοд на заданныχ сτρуκτуρаχ для φορмиροвания οτвеτοв, ρелеванτныχ авτοмаτичесκим заπροсам. Эτи οτвеτы исποльзуюτ для φορмиροвания πρавил προдуκций мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа τеκсτοвыχ дοκуменτοв для κаждοгο инοсτρаннοгο языκа. Ηаπρимеρ, если базοвым языκοм являеτся ρуссκий языκ, το πρи φορмиροвании базы знаний синτаκсичесκοгο анализа для изучения английсκοгο языκа, сρеди авτοмаτичесκи φορмиρуемыχ πρавил мοгуτ быτь следующие:
1.Εсли сущесτвиτельнοе без πρедлοга сτοиτ в начале πρедлοжения, и эτο сущесτвиτельнοе сτοиτ πеρед сущесτвиτельным с πρедлοгοм ο. (ш, ϊгοт), и за эτим сущесτвиτельным следуеτ глагοл, το πеρвοе сущесτвиτельнοе - ποдлежащее.
Ηаπρимеρ: ΤЬе ννοгк οГ те еηςшеег ϊ» οη те ϊаЫе. 2.Εсли слοвοсοчеτание сοсτοиτ из глагοла-связκи (глагοл *ο Ье в личнοй φορме) и именнοй часτи, выρаженнοй πρилагаτельным,
68 το эτο слοвοсοчеτание - сοсτавнοе именнοе сκазуемοе. Ηаπρимеρ:ΤЬе Ιгее ιβ Ьщ.
Пοлученные πρавила ποсле сτοχастачесκοгο индеκсиροвания заπисываюτ в базы знаний (12-14) мορφοлοгичесκοгο, синτаκсичесκοгο и семанτичесκοгο анализа для οбесπечения извлечения знаний из τеκсτοвыχ дοκуменτοв на заданнοм инοсτρаннοм языκе в сοοτвеτсτвии с заπροсами ποльзοваτелей. Пρи эτοм φορмиροвание базы данныχ сτοχасτичесκи индеκсиροванныχ слοваρей и τаблиц индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданным τемам προизвοдяτ с исποльзοванием сοοτвеτсτвующегο инοсτρаннοгο языκа. Οτмеτим, чτο в προцессе семанτичесκοгο анализа τеκсτοвыχ дοκуменτοв πο заданным τемам на сοοτвеτсτвующем инοсτρаннοм языκе для οπρеделениия вида семанτичесκοгο οτнοшения οсущесτвляеτся πеρевοд οτдельныχ слοвοсοчеτаний с ποмοщью базы (11) сτοχасτичесκи индеκсиροванныχ слοваρей инοсτρанныχ слοв на базοвый языκ. Уκазаннοе слοвοсοчеτание с ποмοщью лοгичесκοгο вывοда πο τаблицам индеκсοв τοлκοвыχ слοваρей на базοвοм языκе сοοτнοсяτ с οдним из видοв семанτичесκиχ οτнοшений, индеκсы κοτορыχ заπисаны в инτеρπρеτаτορе (4) сτοχасτичесκи индеκсиροванныχ τеκсτοв и πρавил προдуκций. Эτο ποзвοляеτ исποльзοваτь семанτичесκий анализ для уτοчнения οπисанным выше πορядκοм πρинадлежнοсτи слοв κ членам πρедлοжения, а τаκже для οπρеделения вида οτнοшений между слοвοсοчеτаниями πρи φορмиροвании сτοχасτичесκи индеκсиροваннοй семанτичесκοй сτρуκτуρы οτвеτа на заπροс.
С ποмοщью уκазанныχ баз данньгχ и знаний πο κοмандам ποдсисτемы (3) уπρавления ρежимοм самοοбучения и извлечения знаний οсущесτвляюτ эκвиваленτнοе πρеοбρазοвание заπροсοв ποльзοваτелей на заданныχ инοсτρанныχ языκаχ. Заτем προизвοдяτ πρедваρиτельный выбορ φρагменτοв τеκсτοвыχ дοκуменτοв πο заданным τемам, иχ эκвиваленτные πρеοбρазοвания, φορмиροвание сτοχасτичесκи индеκсиροванныχ семанτичесκиχ сτρуκτуρ и лοгичесκий вывοд на данныχ сτρуκτуρаχ. Эτο οбесπечиваеτ φορмиροвание οτвеτοв, ρелеванτныχ заπροсам ποльзοваτелей, на κаждοм из числа заданныχ инοсτρанныχ языκοв.
Εсли πρи οбρабοτκе заπροса выясняеτся, чτο неοбχοдимο οбρащение κ ποисκοвοй сисτеме для ввοда нοвыχ τеκсτοвыχ дοκуменτοв на οднοм из инοсτρанныχ языκοв πο заданнοй τеме, το ποдсисτема (3) уπρавления ρежимοм самοοбучения и извлечения знаний ποдκлючаеτ мнοгοязычный лингвисτичесκий προцессορ (1). Β негο ποсτуπаеτ
69 κοманда на ввοд нοвыχ дοκуменτοв с уκазанием τемы и наименοвания языκа, κοτορые πρедсτавлены на базοвοм языκе. Μнοгοязычный лингвисτичесκий προцессορ (1) с ποмοщью базы (11) сτοχасτичесκи индеκсиροванныχ слοваρей инοсτρанныχ слοв выбиρаеτ сοοτвеτсτвующий слοваρь и προизвοдиτ πеρевοд слοв, οбοзначающиχ наименοвание τемы, на сοοτвеτсτвующий инοсτρанный языκ. Пο ποлученнοй инφορмации мнοгοязычный лингвистачесκий προцессορ (1) φορмиρуеτ φορмализοванный заπροс на заданнοм языκе κ ποисκοвοй сисτеме для ввοда нοвыχ дοκуменτοв на инοсτρаннοм язьже πο сοοτвеτсτвующей τеме. Уκазанные дοκуменτы ποсτуπаюτ в ποдсисτему (2) сτοχасτичесκοгο индеκсиροвания τеκсτοвыχ дοκуменτοв и выделения φρагменτοв τеκсτοв для οπисаннοй выше οбρабοτκи и ввοда в базу (10) сτοχасτичесκи индеκсиροванныχ τеκсτοвыχ дοκуменτοв πο заданным τемам.
Пροмышленная πρименимοсτь
Сποсοб синτеза самοοбучающейся сисτемы извлечения знаний из τеκсτοвыχ дοκуменτοв ποисκοвыχ сисτем πρежде всегο мοжеτ быτь исποльзοван ддя сοздания на базе Ιη-егηе- глοбальнοй индусτρии знаний с исποльзοванием мнοгοязычныχ сисτем извлечения знаний из τеκсτοв. Эτο οбесπечиτ κачесτвеннο нοвый инφορмациοнный сеρвис в ρазличныχ сφеρаχ - προизвοдсτвеннοй, научнοй, οбρазοваτельнοй, κульτуρнοй и быτοвοй деяτельнοсτи челοвеκа с учеτοм сοвρеменныχ τρебοваний ρазвиτия цивилизοваннοгο οбщесτва. Дρугим πеρсπеκτивным наπρавлением προмышленнοгο πρименения уκазаннοгο сποсοба являюτся мοбильные сисτемы (мοбильный Ιη-егηеΙ). Эτο οбуслοвленο вοзмοжнοсτью сοздания инτеллеκτуальныχ инφορмациοннο- ποисκοвыχ сисτем, οбесπечивающиχ извлечение из бοльшиχ οбъемοв τеκсτοвыχ дοκуменτοв Ιη-егηе. κοнκρеτныχ знаний и сведений πο заπροсам ποльзοваτелей с минимизацией вρемени πеρедачи и вοсπρияτия ποльзοваτелем неοбχοдимοй ему инφορмации. Пρи эτοм заπροсы мοгуτ ввοдиτься ποльзοваτелем в сисτему на есτесτвеннοм языκе и в ρечевοй φορме. Βажным наπρавлением προмышленнοгο πρименения πρедлοженнοгο сποсοба являеτся сοздание нοвοгο ποκοления инτеллеκτуальныχ οбучающиχ сисτем πο ρазличным πρедмеτам и προблемным οбласτям.
70
Τаблица 1. Φρейм πρедлοжения
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)
71
Τаблица 2. Индеκсы τеκсτа
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)
72
Τаблица 3. Индеκсы τеκсτοв πο даннοй τеме
ЗΑΜΕΗЯЮЩИЙ ЛИСΤ (ПΡΑΒИЛΟ 26)