WO2007032095A1 - ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア - Google Patents
ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア Download PDFInfo
- Publication number
- WO2007032095A1 WO2007032095A1 PCT/JP2005/021992 JP2005021992W WO2007032095A1 WO 2007032095 A1 WO2007032095 A1 WO 2007032095A1 JP 2005021992 W JP2005021992 W JP 2005021992W WO 2007032095 A1 WO2007032095 A1 WO 2007032095A1
- Authority
- WO
- WIPO (PCT)
- Prior art keywords
- information
- identifier
- document data
- things
- thing
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Ceased
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING OR CALCULATING; COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/93—Document management systems
Definitions
- the present invention relates to a method for displaying related information in document data by a computer system, a system, and a software program for causing a computer system to execute this method.
- a hyperlink which is a widely spread technology on the Internet. This is to embed a hyperlink in a specific character string included in the text data and display other related information when the user places the cursor on the character string and clicks it.
- information related to character strings in the text can be displayed instantly, improving the convenience for the user.
- Prior Document 1 Japanese Patent Laid-Open No. 5-313877
- Prior Document 2 Japanese Patent Laid-Open No. 8-292958
- Prior Document 3 Japanese Patent Laid-Open No. 2000-10981
- a character string of a link source and other information as a link destination are preset by an information provider (text creator, sender, etc.).
- an information provider text creator, sender, etc.
- the displayed information is uniform.
- the user can set the link source and link destination independently, but it is not suitable for a large amount of document data because the work needs to be repeated for each character string.
- the present invention has been made to solve the above-described problems.
- the user wants to refer to the feature information that the user wants to refer to independently for each thing or keyword. It is an object of the present invention to provide a method and a system that can be displayed effectively and can effectively use document data.
- related information is displayed in document data by a computer system including an input device, a display device, a storage device, a document data reading unit, and a control unit.
- the storage device is a data that describes a plurality of things, an identifier for identifying one or more things from the plurality of things, and feature information of each thing in association with the identification information of the thing.
- Library and control means A computer software storage unit that stores computer software to be executed, and the control means reads out and executes the computer software, whereby the selection of identifiers for extracting document data force is received by the input means force identifier receiving step A step of identifying an identifier related to the selection from document data read by the reading means, a step of searching for feature information of an object from a data library based on the specified identifier, and the searched feature information And displaying it on a display device in the vicinity of the position of the identifier in the document data.
- thing means a general thing such as gene, protein, chemical substance, biological species, organ, cell tissue, etc., person, university, company, country, region (region), It includes all the peculiar things of political parties, etc. and abstract events such as illnesses, incidents, religions, political thoughts, and history.
- “Characteristic information” refers to, for example, a gene, a locus, size, GC content, absolute expression level, tissue-specific expression frequency, biological function, structure.
- Information such as information, localization information, etc., and “specific researcher” as an item, information such as age, gender, affiliated research institution, specialized field, impact factor, etc. (Numerical values, definitions, explanations, etc.) and diagrams.
- tissue of the target gene is placed on the side of the identifier representing the gene detected in the document data.
- a graph showing the specific expression level is displayed.
- information including an input device, a display device, a storage device, a document data reading unit and a control unit, and displaying related information in the document data.
- the storage device includes a plurality of things, an identifier for identifying a thing more than: L among the plurality of things, and characteristic information of each thing.
- An identifier receiving means for receiving a selection of identifiers for extracting document data force comprising: a data library described in association with identification information of a thing; and a computer software storage unit for storing computer software executed by the control means.
- identifier specifying means for specifying an identifier related to the selection from the document data read by the reading means, and feature information searching means for searching for feature information of an object from the data library based on the specified identifier
- a display means for displaying the characteristic information searched for on the display device by embedding it in the vicinity of the position of the identifier in the document data or overlapping it.
- the computer is stored in the storage device of the computer system including the input device, the display device, the storage device, the document data reading unit, and the control unit.
- a computer software for causing a system to function as an information processing system for displaying related information in document data, wherein the storage device identifies a plurality of things and one or more things from the plurality of things.
- computer software is provided that causes the computer system to execute a procedure for displaying on a display device.
- the document data management system according to the second main viewpoint described above is constructed by being installed in the computer system and executed, and the document data management according to the first main viewpoint is performed.
- the method can be suitably realized You can get computer software.
- the feature information that the user wants to refer to can be displayed uniformly on the document without performing work individually for each thing or keyword, thereby effectively using the document data.
- FIG. 1 is a diagram showing a schematic configuration of a document data management system according to an embodiment of the present invention.
- This system 1 includes a user client system 2 and an information providing server system 3 connected via a communication network. Both the user client system 2 and the information providing server system 3 can use a general-purpose computer system for IJ.
- the user client system 2 is connected to a CPU 5 as a control means by a RAM 6, a storage device 7 such as an HDD or ROM, and an input / output interface (IZF) 8 via a communication node 9.
- a display device 10 such as an LED display
- an input device 11 such as a mouse or keyboard
- a communication device 12 such as a modem
- a drive 13 for a removable recording medium such as a CD-ROM ⁇ DVD-ROM, etc. It has a nodeware configuration.
- a characteristic processing function of the present invention described later is that computer software (information display software 15 and system software 16) installed in the program storage unit 14 of the storage device 7 is called on the RAM 6 by the CPU 5, and the OS Realized by being executed in cooperation with the (operation system).
- the storage device 7 includes a usage information storage unit 17 that assists the operation of the system software 16.
- This usage information storage unit 17 includes one or more elements that are digitized things, information included in this thing or information that identifies the thing, the type of information (facet) provided for each thing, each element Identifier, facet of each element It stores information such as data in the network.
- the type (facet) indicates additional information such as the type of characteristic information to be displayed (graph, font, chart, etc.), size, and color. The data stored in the usage information storage unit 17 will be described later.
- the information display software 15 is software such as a Web browser, for example.
- the information display software 15 communicates with the information providing server system 3 via a communication network and is stored in a service information storage unit 20 described later.
- the characteristic information is acquired and data to be displayed on the display device 10 of the user client system 2 is generated.
- the system software 16 receives information input by the user using the input device 11, performs information encryption / decryption processing of information in the usage information storage unit 17, processing for embedding feature information at a predetermined position of document data, and the like. Is. Detailed functions of the system software 16 will be described later with reference to flowcharts.
- the information providing server system 3 includes a Web server function that provides information to the user client system 2 through the WWW network.
- This information providing server system 3 has the same hardware configuration as that of the user client system 2 (not shown), and the storage device stores the feature information of the thing in the identification information (ID) of the thing.
- the service information storage unit 20 stores the information in association with each other, and the user information database (DB) 21 stores user login information and the like.
- the information providing server system 3 includes information providing software 22 that retrieves and passes necessary information from the service information storage unit 20 when accessed from the information display software 15 of the user client system 2. Yes.
- the usage information storage unit 17 includes a thing type information table 17a, a user invalid identifier information table 17b, a family identifier information table 17c, a thing element information table 17d, a thing facet information table 17e, and a thing element identifier information table. 17f, user event element identifier information table 17g and event element information table 17h [0028]
- the event type information table 17a stores the event ID, the event name, and the definition of the event, which are the master IDs related to the event type that is the type of information of interest. Examples of things include genes, proteins, chemical substances, biological species, organs, cell tissues, people, companies, universities, diseases, and incidents.
- the user invalid identifier information table 17b stores identifiers that the user always wants to invalidate for a specific type (attribute) of things.
- the family identifier information table 17c common identifiers of identifiers that have a common part more than the specified number of characters at the beginning and end with a series of numerical values or a series of alphabets with a space in between are specified for certain types of things.
- An identifier (family identifier) associated with a series of thing elements is stored.
- the item element information table 17d stores information (item ID, element, representative element name) related to each element included in the target item. For example, there are “ ⁇ 10”, “ ⁇ ”, ⁇ “ALDH1A 1” and the like as elements of the thing “gene”.
- the object facet information table 17e stores an object ID, a facet ID, a facet data access URL, and a display data option. That is, it stores the type of information (facets) that can be provided for the subject matter. For example, “size”, “function”, “absolute expression level”, etc. as facets for the thing “gene”.
- the facet data access URL is a URL for accessing facet data based on the object ID, element ID, facet ID, and display data option.
- the display data option is an option that can be selected in the display of facet data. For example, the display size, display color, upper / lower limit, straight line / logarithm memory, hyperlink indicating the jump destination when the display data is clicked, etc. It is news.
- the event / element identifier information table 17f stores an identifier indicating an event / element and its element ID.
- the representative element name and alias name of the element identified by the element ID are stored. For example, as an identifier of an element having a representative identifier “ALDH1A1”, “ALDH1A1
- this thing element identifier information table 17f includes a plurality of identifiers having a common part greater than or equal to the number of designated characters at the beginning and having a series of numerical values or a series of alphabets ending or ending with a space. , Identifiers (family identifiers) that associate the first common part with a series of thing elements are registered. As a result, the recognition rate of identifiers in document data can be improved.
- an identifier uniquely defined by the user and an ID of an event element related to the identifier are stored for a specific type of event.
- the inter-event element information table 17h stores two different event elements in the same or different types of events and the relationship between them. The relationship between elements includes the presence of directionality and the strength of the relationship.
- the service information storage unit 20 includes an original information table 20a, a data generation information table 20b, an original element information table 20c, a facet information table 20d, and an ID conversion information table 20e.
- the original information table 20a stores the original information ID, the URL of the original information site, and the definition of the original information.
- the data generation information table 20b information (facet, original information ID, and data conversion condition) for generating facet data is stored.
- the original element information table 20c stores original information ID, original element ID, and original data.
- the facet information table 20d stores information provided by the target facet for the target element.
- the ID conversion information table 20e contains element IDs and their corresponding originators. Element ID is stored, and the facet information is associated with the original element information.
- facet information can be generated from original information based on information in the original information table 20a, data generation information table 20b, original element information table 20c, and ID conversion information table 20e. It becomes possible. Note that if the original element information corresponding to the thing element does not exist and facet data cannot be generated, the information providing software 22 displays a text or image indicating that facet data does not exist (“no data”). You can make it clear that the facet data does not exist by generating the “?” Or “?” Icon)!
- a third party can independently separate a matter element, an identifier dictionary, facet data, etc. for use in the system. Or can be easily developed and provided as a set.
- the target facet for example, a facet "biological image” (see Fig. 9 (b) described later) for each element of the thing "biological species” is created one record at a time.
- the facet “size” of an object “gene” is generated by the original information power information processing existing for each element.
- step S1 when the information display software 15 acquires the digitized document data and displays it on the display device 10 (step S1), what happens to the user power included in the document data! /, The selection of whether or not the type of information (facet) is obtained as additional information is accepted (step S2). In this example, “gene” t, things! This facet is selected.
- the system software 16 loads the identifier dictionary (see the entity element identifier information table 17i in FIG. 2) corresponding to the selected entity (gene) from the usage information storage unit 17 (step S3).
- This identifier is a set of terms and IDs that can identify specific elements contained in the target thing (gene), and there are multiple identifiers that specify one element.
- the system software 16 searches (maps) the identifier of the central force of the document data, and identifies it as an element of the subject matter (step S4). Note that hidden information embedded in a document can also be searched. Embed a link to the information provision software 22 that provides feature information about the element adjacent to the element identified by this mapping, either statically or dynamically, according to the selected facet (size) (step S5). . The information display software 15 acquires the feature information according to the link embedded in the document data, displays the feature information in the document data display, or overlaps the document data display (step S6). ).
- the information display software 15 uses the text indicating that it is a multiple identifier (characters “polysense identifier” and “M”). And images (icons, etc.), multiple elements indicated by this identifier are displayed side by side, and a user interface (selection menu, etc.) that can select the elements to be displayed is generated and displayed. Display on device 10.
- the information display software 15 executes a feature information display process for the element selected by this selection menu or the like.
- step S7 when the change of the matter is received from the user after displaying the characteristic information (step S7), the system software 16 and the information display software 15 are configured to perform the above-described steps S3 to S3 based on the changed matter.
- the process of S6 is executed.
- step S8 when the facet change is accepted (step S8), the processes of steps S4 to S6 are executed in accordance with the facet that contributes to the change. If new document data is acquired (step S9), and the same thing and facet information is still selected, the processing of steps S4 to S6 is executed for the new document data.
- FIG. 4 shows an example of a user interface in the user client system 2.
- the user interface is implemented as a tool bar 30 in the Web browser.
- This toolbar 30 includes a check box 31 for switching between showing and hiding information, a pull-down button 32 for selecting an object, a pull-down button 33 for selecting a facet, a button 34 for re-executing identifier mapping, and a high level for recognized identifiers.
- Light display Z non-display switch button 35, mapping information panel display Z non-display switch button 36, and option button 37 for opening a dialog box for setting operation options.
- the re-execution button 34 is convenient when the identifier mapping parameter is changed and re-executed.
- mapping is re-executed after setting an object element to be displayed as a default with a ambiguity identifier in the identifier recognition status table display of FIG. 11 described later.
- mapping is re-executed after setting an object element to be displayed as a default with a ambiguity identifier in the identifier recognition status table display of FIG. 11 described later.
- a pull-down menu 38 is displayed.
- “Gene Symbol” is selected as an object
- a pull-down menu 39 is displayed.
- FIG. 5 is an example of the operation option setting dialog box 40 displayed when the option button 37 is clicked in the user interface of FIG.
- This operation option setting dialog box 40 includes setting items Display41, Activate42, and Dictionary43 that can be switched by three tabs.
- This figure shows an example in which the Display setting tab 41 is opened. In this tab 41, the overlap setting box 45 for selecting whether facet information is embedded or displayed in the document data, and the identifier recognized as an element in the document data is highlighted.
- Highlight text setting box 46 to set whether to display force
- text color and background color settings 46a and 46b are also prepared. Further, the display order in displaying a plurality of things or facet data is determined by the display order in the display information selection list boxes 47a and 47b. The display order in these list boxes 47a and 47b can be changed by a display order change button 47c. Furthermore, for example, when multiple identifiers are recognized at the same position in the object “gene”, such as ⁇ 3 ”and ⁇ 3 receptor] t, and the identifier priority display option setting 49 is turned on, the former The "kinesin" identifier is ignored.
- FIG. 6 is an example in which the Activate tab 42 is opened in the operation option setting dialog box 40 of FIG.
- items 52 to 60 for setting options in facet display are provided.
- the parameters for generating facet data there are a type setting 52, a display size setting 53, and generation parameters 54-60.
- the generation type can be text, graph (circle, bar, line, multiple bars, pie, etc.), image, or custom.
- generation parameters corresponding to each generation type can be specified. For example, when generating a graph, specify color 54, graph orientation 55, maximum 56, minimum 57, standardize Z not set 58, logarithmic conversion (logN) Z not set 59, ruler display Z Hidden setting 60 etc. can be specified.
- sample 61 which allows you to check the settings on the spot, is displayed.
- FIG. 7 shows an example in which the Dictionary tab 43 is opened in the operation option setting dialog box 40 shown in FIG. 5 or FIG.
- This screen provides a user interface that can set an identifier added by a user or a specific identifier to be invalidated in a dictionary of identifiers corresponding to specified things stored in the usage information storage unit 17.
- the dictionary name corresponding to the target thing is displayed.
- a text box 63 for displaying and changing, a text box 64 for inputting an identifier to be newly registered, and a text box 65 for displaying a list of invalidated identifiers are provided.
- an element ID corresponding to the user identification information is input and registered in the identifier input text box 64. It is also possible to delete an identifier added using this identifier input text box 64.
- the button 66 for adding the invalidation identifier is clicked with the mouse, and an input box (not shown) is displayed.
- the identifier ID is registered in the user invalid identifier information table 17b, and the information display software 15 refers to the table 17b to determine whether to display feature information.
- the user can also cancel the invalidation individually by selecting the identifier to be invalidated from the invalidated identifier display text box 65 and clicking the delete button 67.
- the identifier of a certain thing is the same as a term having a different meaning, the thing that is different from the thing intended by the user is recognized as the same thing.
- Feature information may be displayed in the document data.
- the thing is a “human gene”
- the identifier indicating the human gene “peptide deformylas e-like protein” is “PDF (Portable Document Format)” which is the name of the adobe document file format.
- PDF Portable Document Format
- the setting of addition or invalidation of a specific identifier by a user is made persistent, a plurality of document data during a series of processing (sessions), or a specific currently displayed It is preferable to design so that it is possible to select any one of the document data. If the user always wants to invalidate the identifier, the function of storing the invalid identifier separately in the usage information storage unit 17 and restricting when the system software 16 uses the identifier dictionary is effective.
- the information display software 15 provides a user interface for invalidating a specific identifier during a series of sessions or in the document data. Right-click the facet data displayed by identifying the identifier with the mouse to display a pop-up menu, and prepare an execution command (invalid during session, invalid during page) in this menu. Is effective.
- FIG. 8 is an example in which the information display software (such as a Web browser) 15 and the system software 16 of the user client system 2 are operated and the document data is displayed.
- the thing “Protein” and facet “BM” are selected.
- BM is gene expression frequency pattern data in 10 biological tissues.
- Displayed document data force Identifiers 68 and 68 such as “CDC2” and “CDK1” representing “Protein” are identified and highlighted, and next to these identifiers 68 are facet data in 10 organizations.
- a bar graph 69 showing the occurrence frequency pattern is displayed.
- the facet data such as the bar graph 69 shown in this example is dynamically generated by the information providing software 22 with reference to the original element information table 20c. That is, it can be generated when requested by the user client system 2. Therefore, the user can change the setting in the user client system 2 and change the display form in real time.
- the user left-clicks the identifier 68 with the mouse to display a hyperlink to the item element set by the administrator (data developer or provider) of the item information, and facet data (bar graph 69).
- hyperlinks to the facet data set by the facet data manager data developer or provider
- the pop-up menu displayed by right-clicking the mouse displays a hyperlink to the object information resource or object element set by the object information administrator (data developer or provider) and the facet data. It is possible to use hyperlinks to facet data information set by the administrator.
- a list of multiple meaning identifiers having multiple meanings and selection from the list, invalidation of a specific identifier, and a user reporting command can be used.
- FIG. 9 is an example of facet data that can be dynamically generated from the original element information table 20c.
- FIGS. 10A to 10C are examples of displaying document data by operating the information display software (such as a Web browser) 15 and the system software 16 of the user client system 2.
- the thing “Species” and the facet “Picture” are selected.
- Clicking the check box 72 with the mouse from the information display off state in FIG. 10 (a) turns on the information display on state in FIG. 10 (b).
- an image (characteristic information) 74 of each organism is displayed on the side of the scientific name (identifier) 73 of the organism in the document data.
- FIG. 11 is a diagram showing a function for managing the history of information processed by the user client system 2 and making the information available for use.
- This figure shows an example in which each gene of “Cdc2” rcdklj “Cdk2” is recognized on multiple pages in “gene” as a thing.
- element information recognized in previously processed document data pages is displayed as a tree in units of things 76 or pages 77 as shown in FIG. 11 (a). Click this tree power thing or page with the mouse to display the corresponding thing or page.
- the recognized elements can be aggregated and displayed in a tabular format.
- FIG. 12 is a diagram for explaining the processing of the ambiguous identifier.
- an element name such as a polysemy may correspond to multiple elements.
- the icon 80 is changed to the characteristic information of the selected element, or the characteristic information of the selected element is changed to the icon. 80.
- the display section 82 on the left side of FIG. 12 displays a list 82a of identifiers recognized in the corresponding page of the document data on the right side of the page and an element selection interface 82b.
- the recognized identifiers the above-mentioned ambiguous identifiers are also included.
- This display unit 82 is an effective interface for providing information on elements existing in the target document and ambiguity thereof.
- FIG. 13 is a diagram showing a dictionary information display function.
- the display screen of this figure is stored in the information display section 83 for the dictionary of identifiers stored in the usage information storage section 17 (thing element identifier information table 17f) and the service information storage section 20 (facet information table 20d).
- a display 84 for information on the faceted data is provided.
- the number of identifiers and the number of things included in such an identifier dictionary, information on resources used to construct the identifier dictionary, etc. can be obtained from the website that provides text, images, resource information, and other related information. , Iperlink is useful information to the user.
- Fig. 14 is a schematic diagram of the whole human chromosome displaying the location of various proteins recognized as document elements in the document data in the human genome on the map tab 86 of the information panel. It is an example displayed above.
- FIG. 15 is an example in which the molecular weight distribution (logarithmic frequency) in the whole thing element of various protein types recognized in the document data is displayed on the map tab 87 of the information panel. In this way, on the Map tab of the information panel, you can select the map that can be used in response to the selected thing, and also select the pull-down menu, and identify the identifier recognized in the document data as a map, chart, graph. By mapping to information according to things such as, it is possible to provide information that can easily know the outline of recognized thing elements. It should be noted that the present invention is not limited to the above-described embodiment, and various modifications can be made without departing from the scope of the invention.
- the present system 1 is configured by the user client system 2 and the information providing server system 3, but may be configured by only the user client system.
- the user client system 200 is configured to include a service information storage unit 20 and information providing software 22.
- the feature information can be downloaded from the web server via the WWW, or the storage medium such as CD-ROM can be introduced.
- the identifier dictionary information stored in the usage information storage unit 17 may be provided with a function for reporting to the event type information manager (including the creator; the same shall apply hereinafter).
- This function can be applied to an identifier that does not exist in the identifier dictionary stored in the usage information storage unit 17, an error in the element ID corresponding to the identifier, or a claim for facet data displayed by the element ID corresponding to the identifier ( This is a function for the user to report to the administrator of the item type information. Thereby, the accuracy of the identifier dictionary can be increased.
- the new identifier report dialog box prepared in the registration confirmation dialog box for registering the user's identifier is effective for reporting the identifier!
- a pop-up menu is displayed by right-clicking the facet data displayed when the identifier is identified by the information display software 15 with the mouse. It is effective to prepare a function to open a complaint dialog button in this menu.
- a relationship between a plurality of things or elements may be displayed as facets (feature information).
- feature information For example, as shown in Fig. 17, in the thing (Protein) specified by the extracted identifier of document data force, the interaction between multiple (in the example shown, 5) proteins (elements) is used as feature information to identify the identifier. It is embedded in the vicinity or displayed overlapping.
- Such relationships between multiple elements are stored in the inter-element information table 17h in FIG. This is an individual thing or element It is possible to provide useful information for obtaining new knowledge that cannot be obtained by referring to this information.
- FIG. 1 is a schematic diagram showing a system configuration of an embodiment of the present invention.
- FIG. 2 is a schematic diagram showing the relationship between the databases.
- FIG. 3 is a flowchart showing the processing steps.
- FIG. 4 is a diagram showing an example of a user interface in the user client system.
- FIG. 5 is a diagram showing an example of a user interface in the user client system.
- FIG. 6 is a diagram showing an example of a user interface in the user client system.
- FIG. 7 is a diagram showing an example of a user interface in the user client system.
- FIG. 8 is a diagram showing an example of system operation in a user client system.
- FIG. 9 is a diagram illustrating an example of facet data.
- FIG. 10 is a diagram showing an example of system operation in a user client system.
- FIG. 11 is a diagram showing an operation example of a history function.
- FIG. 12 is a diagram showing an example of system operation (processing of ambiguous identifier) in the user client system.
- FIG. 13 is a diagram showing a system operation example (dictionary information display function) in the user client system.
- FIG. 14 is a diagram showing a system operation example (location on the human genome) in the user client system.
- FIG. 15 is a diagram showing a system operation example (molecular weight distribution) in the user client system.
- FIG. 16 is a schematic diagram showing a system configuration of a modified example of the present invention.
- FIG. 17 is a diagram showing another display example of feature information.
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Business, Economics & Management (AREA)
- General Business, Economics & Management (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
- User Interface Of Digital Computer (AREA)
Abstract
【課題】大量のドキュメントデータについて、事物やキーワード毎に個別に作業を行うことなく、ユーザが参照したい特徴情報をそのドキュメント上に統一的に表示させ、ドキュメントデータの有効利用を図る。 【解決手段】入力装置11、ディスプレイ装置10、記憶装置7、ドキュメントデータを読み出す情報表示ソフトウェア15及びCPU5を備えた情報処理システム1であって、記憶装置7は、複数の事物と、複数の事物の中から1以上の事物を特定するため識別子と、各事物の特徴情報と、を事物の識別情報に関連付けて記述する利用情報格納部17と、CPU5によって実行されるコンピュータソフトウェアを格納するプログラム格納部14とを備え、システムソフトウェア16が、ドキュメントデータから抽出する識別子の選択を前記入力装置11から受け付ける機能、前記情報表示ソフトウェア15が読み出したドキュメントデータから選択に係る識別子を特定する機能、特定した識別子に基づいて利用情報格納部17から事物の特徴情報を検索する機能、及び検索した特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込んでディスプレイ装置10に表示する機能とを有する。
Description
明 細 書
ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア 技術分野
[0001] 本発明は、コンピュータシステムによってドキュメントデータ中に関連情報を表示す る方法、システム及びコンピュータシステムにこの方法を実行させるためのソフトゥェ ァプログラムに関する。 背景技術
[0002] コンピュータの一般ィ匕による情報の電子化と、インターネットの普及による情報の流 通による相乗効果により、利用可能な情報量が爆発的に増大している。例えば、バイ ォテクノロジーの分野においても、ゲノムプロジェクトをはじめとする巨大プロジェクト や測定技術などの科学技術の発達によって大量の情報が日々生み出されている。こ のような膨大な電子情報 (テキストデータ)には、種々の研究、開発等に有益な体系 的情報が含まれていることが多いため、その情報を活用する方法が検討されている。
[0003] 例えば、インターネット上で広く普及している技術であるハイパーリンクを利用する 方法がある。これは、テキストデータに含まれる特定の文字列等にハイパーリンクを埋 め込み、ユーザがこの文字列等にカーソルを合わせてクリックすることで関連する他 の情報を表示させるものである。この方法を利用することで、テキスト中の文字列等に 関連した情報を瞬時に表示することができ、ユーザの利便性は向上する。
[0004] また、指定された範囲のテキストデータを自動翻訳するシステム (ソフトウェア)や、 テキストデータに含まれる特定の文字列等にァノテーシヨン (注釈)を与えるシステム( ソフトウェア)、及びテキストデータのコンテキストを解析したりシソーラス辞書を利用す ることで要約(抄録)を作成するシステム (ソフトウェア)なども実用化されて 、る。これ らのシステムを利用することで、外国語の文献、難解な用語等が頻出するテキスト、 長文のテキスト等を有効活用できるようになる。
[0005] このような情報処理の方法としては、例えば、以下の先行文献が参考になる。
[0006] 先行文献 1 :特開平 5— 313877号公報
先行文献 2:特開平 8— 292958号公報
先行文献 3 :特開 2000— 10981号公報
先行文献 4:特開 2002— 207727号公報
先行文献 5 :特開 2003— 6186号公報
発明の開示
発明が解決しょうとする課題
[0007] しカゝしながら、上記した従来の方法は、何れも解決すべき課題が存在し、多くの電 子情報が十分活用されな ヽまま埋もれて ヽるのが現状である。
[0008] 例えば、ハイパーリンクを利用する方法では、情報の提供者 (テキストの作成者、発 信者等)によってリンク元の文字列等とリンク先としての他の情報とが予め設定されて いるため、表示される情報が画一的であるという問題がある。ユーザがリンク元とリンク 先とを独自に設定することも可能であるが、個々の文字列等毎に作業を繰り返す必 要があるため、大量のドキュメントデータには不向きである。
[0009] また、自動翻訳ゃァノテーシヨン付与、要約作成等のシステムは、予め用意された 辞書データやルールなどに従ってテキストデータを画一的に加工しているに過ぎず、 ユーザが欲 、情報が得られな 、おそれがある。
[0010] さらに、上記した従来の方法では、ユーザがドキュメントデータに含まれる複数の関 連する事物について同一の情報 (リンク先)を設定したい場合でも、ユーザがシソーラ ス辞書等を参照しながら作業することになり、統一的な処理は困難である。
[0011] 本発明は、上記課題を解決するためになされたもので、大量のドキュメントデータに ついて、事物やキーワード毎に個別に作業を行うことなぐユーザが参照したい特徴 情報をそのドキュメント上に統一的に表示させ、ドキュメントデータの有効利用を図る ことができる方法及びシステムを提供することを目的とする。
課題を解決するための手段
[0012] 本発明の第 1の主要な観点によれば、入力装置、ディスプレイ装置、記憶装置、ド キュメントデータの読出し手段及び制御手段を備えたコンピュータシステムによってド キュメントデータ中に関連情報を表示する方法であって、前記記憶装置は、複数の 事物と、複数の事物の中から 1以上の事物を特定するため識別子と、各事物の特徴 情報と、を事物の識別情報に関連付けて記述するデータライブラリと、制御手段によ
つて実行されるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部と を備え、前記制御手段が、コンピュータソフトウェアを読み出して実行させることで、ド キュメントデータ力 抽出する識別子の選択を前記入力手段力 受け付ける識別子 受付工程と、読出手段によって読み出されたドキュメントデータから、前記選択に係る 識別子を特定する工程と、前記特定した識別子に基づいてデータライブラリから事物 の特徴情報を検索する工程と、検索した特徴情報を前記ドキュメントデータ中の識別 子の位置の近傍に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示 する工程とを有することを特徴とする方法が提供される。
[0013] ここで、「事物」とは、遺伝子、タンパク質、化学物質、生物種、臓器、細胞組織、等 の実在する一般的な物と、人物、大学、企業、国、地方 (地域)、政党等の固有の物と 、疾病、事件、宗教、政治思想、歴史などの抽象的な事象、などが全て含まれる。ま た、「特徴情報」とは、例えば「遺伝子」という事物に対しては、遺伝子座 (Locus)、サ ィズ、 GCコンテンツ、絶対発現量、組織特異的発現頻度、生物学的機能、構造情報 、局在情報などの情報を、また「特定の研究者」を事物とする場合には、その年齢、 性別、所属研究機関、専門分野、インパクトファクターなどの情報を、夫々テキストデ ータ (数値や定義、解説等)、図表などで視覚的に表したものである。
[0014] 例えば、事物として「遺伝子」が選択され、特徴情報として「組織特異的発現頻度」 が選択された場合に、ドキュメントデータ中で検出された遺伝子を表す識別子の側に 、対象遺伝子の組織特異的発現量を表すグラフを表示する。これにより、例えば、疾 病に至る遺伝子の相互作用に関するドキュメント中に現れる遺伝子について、組織 特異的発現の情報を参照しながら、元々記述された内容を容易に解釈することが可 能となる。特に、バイオテクノロジーなどの未解明の領域が多い研究分野では、既知 の情報であっても相互参照することで新たな知見を見出すことが少なくな 、ため、本 発明によって研究者等のユーザに非常に有益な情報を提供できることになる。
[0015] また、本発明の第 2の主要な観点によれば、入力装置、ディスプレイ装置、記憶装 置、ドキュメントデータの読出し手段及び制御手段を備え、ドキュメントデータ中に関 連情報を表示する情報処理システムであって、前記記憶装置は、複数の事物と、複 数の事物の中から :L以上の事物を特定するため識別子と、各事物の特徴情報と、を
事物の識別情報に関連付けて記述するデータライブラリと、制御手段によって実行さ れるコンピュータソフトウェアを格納するコンピュータソフトウェア格納部とを備え、ドキ ュメントデータ力 抽出する識別子の選択を前記入力手段力 受け付ける識別子受 付手段と、前記読出手段によって読み出されたドキュメントデータから、前記選択に 係る識別子を特定する識別子特定手段と、前記特定した識別子に基づ 、てデータラ イブラリから事物の特徴情報を検索する特徴情報検索手段と、検索した特徴情報を 前記ドキュメントデータ中の識別子の位置の近傍に埋め込んで、若しくはオーバーラ ップしてディスプレイ装置に表示する表示手段とを有することを特徴とするシステムが 提供される。
[0016] このような構成によれば、コンピュータシステムによって上記した第 1の主要な観点 におけるドキュメントデータ管理方法を好適に実現できるドキュメントデータ管理シス テムを得ることができる。
[0017] さらに、本発明の第 3の主要な観点によれば、入力装置、ディスプレイ装置、記憶 装置、ドキュメントデータの読出し手段及び制御手段を備えたコンピュータシステムの 前記記憶装置に格納され、このコンピュータシステムをドキュメントデータ中に関連情 報を表示させる情報処理システムとして機能させるためのコンピュータソフトウェアで あって、前記記憶装置は、複数の事物と、複数の事物の中から 1以上の事物を特定 するための識別子と、各事物の特徴情報と、を事物の識別情報に関連付けて記述す るデータライブラリを備え、前記コンピュータソフトウェア力 ドキュメントデータカも抽 出する識別子の選択を前記入力手段力 受け付ける手順と、前記読出手段によって 読み出されたドキュメントデータから、前記選択に係る識別子を特定する手順と、前 記特定した識別子に基づいてデータライブラリから事物の特徴情報を検索する手順 と、検索した特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込ん で、若しくはオーバーラップしてディスプレイ装置に表示する手順とを前記コンビユー タシステムに実行させることを特徴とするコンピュータソフトウェアが提供される。
[0018] このような構成によれば、コンピュータシステムにインストールされて実行されること で、上記した第 2の主要な観点におけるドキュメントデータ管理システムを構築し、第 1の主要な観点におけるドキュメントデータ管理方法を好適に実現させることができる
コンピュータソフトウェアを得ることができる。
発明の効果
[0019] 本発明によれば、大量のドキュメントデータについて、事物やキーワード毎に個別 に作業を行うことなぐユーザが参照したい特徴情報をそのドキュメント上に統一的に 表示させ、ドキュメントデータの有効利用を図ることができる。これにより、従来は、事 物や事物に含まれる Z事物を特定する要素等の特徴情報や専門知識等を保有する 一部のユーザだけが可能であった内容の把握や新たな発見を、一般ユーザでも容 易に実践することが可能となる。
発明を実施するための最良の形態
[0020] 以下、本発明の最良の実施形態を、図面を参照して具体的に説明する。
図 1は、本発明の一実施形態に係るドキュメントデータ管理システムの概略構成を 示す図である。このシステム 1は、通信ネットワークを介して接続される利用者用クライ アントシステム 2及び情報提供サーバシステム 3によって構成される。利用者用クライ アントシステム 2及び情報提供サーバシステム 3は、何れも汎用のコンピュータシステ ムを禾 IJ用できる。
[0021] 利用者用クライアントシステム 2は、制御手段としての CPU5に、 RAM6、 HDDや R OMなどの記憶装置 7、及び入出力インタフェース (IZF) 8が通信ノ ス 9を介して接 続され、この入出力 IZF8に、 LEDディスプレイなどのディスプレイ装置 10、マウスや キーボードなどの入力装置 11、モデム等の通信デバイス 12、 CD-ROM^DVD- ROMなどのリムーバブル記録媒体用のドライブ 13等が接続されたノヽードウエア構成 を有する。後述する本発明の特徴的な処理機能は、前記記憶装置 7のプログラム格 納部 14にインストールされたコンピュータソフトウエア(情報表示ソフトウェア 15やシス テムソフトウェア 16)が CPU5によって RAM6上に呼び出され、 OS (オペレーション システム)と協働して実行されることで実現される。
[0022] また記憶装置 7は、前記プログラム格納部 14の他、システムソフトウェア 16の動作を 補助する利用情報格納部 17を備えている。この利用情報格納部 17は、電子化され た事物、この事物に含まれる若しくは事物を特定する情報である 1以上の要素、各事 物に対して提供される情報の種類 (ファセット)、各要素の識別子、各要素のファセッ
トにおけるデータなどの情報を格納するものである。ここで、種類 (ファセット)は、表示 する特徴情報の種類 (グラフ、フォント、図表等)、大きさ、色などの付加情報を指す。 利用情報格納部 17に格納されるデータにつ 、ては後述する。
[0023] 前記情報表示ソフトウェア 15は、例えば Webブラウザの様なソフトウェアであり、ドキ ュメントデータを取得すると、通信ネットワーク経由で情報提供サーバシステム 3と交 信して後述するサービス情報格納部 20に格納された特徴情報を取得して、利用者 用クライアントシステム 2のディスプレイ装置 10に表示するデータを生成するものであ る。
[0024] システムソフトウェア 16は、ユーザが入力装置 11で入力した情報の受け付け、前記 利用情報格納部 17の情報の暗号化'復号化処理、ドキュメントデータの所定位置に 特徴情報を埋め込む処理等を行うものである。このシステムソフトウェア 16の詳細な 機能はフローチャートを参照して後述する。
[0025] 一方、前記情報提供サーバシステム 3は、 WWWネットワークを通じて利用者用クラ イアントシステム 2に対して情報を提供する Webサーバの機能を備えて 、る。この情 報提供サーバシステム 3は、利用者用クライアントシステム 2と同様のハードウェア構 成を備えており(図示は省略)、記憶装置には、事物の特徴情報を事物の識別情報( ID)に関連付けて格納する前記サービス情報格納部 20とユーザログイン情報等を格 納するユーザ情報データベース (DB) 21とを備えている。また、情報提供サーバシス テム 3は、利用者用クライアントシステム 2の情報表示ソフトウェア 15からアクセスされ た場合に、サービス情報格納部 20から必要な情報を検索して受け渡す情報提供ソ フトウエア 22を備えている。
[0026] 次に、図 2を参照して前記利用情報格納部 17及びサービス情報格納部 20に格納 されるデータを具体的に説明する。これらは、以下に列挙するテーブル、格納部が事 物 IDなどで相互にデータ参照可能なリレーショナルデータベースで構成される。
[0027] まず、利用情報格納部 17は、事物種類情報テーブル 17a、ユーザ用無効識別子 情報テーブル 17b、ファミリー識別子情報テーブル 17c、事物要素情報テーブル 17 d、事物ファセット情報テーブル 17e、事物要素識別子情報テーブル 17f、ユーザ用 事物要素識別子情報テーブル 17g及び事物要素間情報テーブル 17hを備えている
[0028] 事物種類情報テーブル 17aには、注目する情報の種類である事物の種類に関する マスタ IDである事物 ID、事物名称及び事物の定義が格納される。事物としては、例 えば、遺伝子、タンパク質、化学物質、生物種、臓器、細胞組織、人物、企業、大学、 疾病、事件などが挙げられる。ユーザ用無効識別子情報テーブル 17bには、特定の 種類 (属性)の事物において、ユーザが常に無効としたい識別子が格納される。フアミ リー識別子情報テーブル 17cには、特定の種類の事物において、先頭指定文字数 以上の共通部分を有し、末尾または空白を挟んだ末尾が一連の数値あるいは一連 のアルファベットである識別子について、先頭の共通部分を一連の事物要素に関連 した識別子 (ファミリー識別子)が格納される。事物要素情報テーブル 17dには、対象 事物に含まれる個々の要素に関する情報 (事物 ID、要素 、代表要素名)が格納さ れる。例えば、事物「遺伝子」の要素としては、「ΑΚΑΡ10」「ΑΚΙΡ」 ΓΑΚΤυ「ALDH1A 1」などがある。
[0029] 事物ファセット情報テーブル 17eには、事物 ID、ファセット ID、ファセットデータァク セス URL及び表示データオプションが格納される。すなわち、対象事物に関して提 供可能な情報 (ファセット)の種類を格納する。例えば、「遺伝子」という事物に対する ファセットとして「サイズ」「機能」「絶対発現量」などである。ここで、ファセットデータァ クセス URLは、事物 ID、要素 ID、ファセット ID、表示データオプションを元にファセッ トデータにアクセスするための URLである。また、表示データオプションは、ファセット データの表示において選択可能なオプションである。例えば、表示サイズ、表示色、 上限'下限、直線 ·対数メモリ、表示データをクリックされた際にジャンプする先を示す ハイパーリンク等の、対象ファセットの表示形態にぉ 、て選択可能なオプションの情 報である。
[0030] 事物要素識別子情報テーブル 17fには、事物 、要素 、その要素 IDを表す識 別子が格納される。ここには、要素 IDで識別される要素の代表要素名及び別名が格 納される。例えば、代表識別子「ALDH1A1」を持つ要素の識別子として、「ALDH1A1
EC1.2.1.36Jなどが登録される。本テーブル 17fに格納されるレコードを、事物 IDで
分類される要素 ID毎に纏めたもの力 その事物についての識別子辞書となる。
[0031] また、この事物要素識別子情報テーブル 17fには、先頭指定文字数以上の共通部 分を持ち、末尾または空白を挟んだ末尾が一連の数値あるいは一連のアルファべッ トである複数の識別子について、先頭の共通部分を一連の事物要素に関連付けた 識別子 (ファミリー識別子)が登録される。これにより、ドキュメントデータ中の識別子の 認識率を向上させることができる。
[0032] 例えば、事物「蛋白質」には要素として「Keratinl」「Keratin2」「Keratin3」 · · ·が存在 するが、ドキュメントデータ中ではこれらが区別されずに単に「Keratin」と記載されるこ とが多い。この「 1 1」を「1¾ 1 11」「Keratin2」等のファミリー識別子として登録する ことにより、一連の「Keratin」をドキュメントデータ中の識別子「Keratin」に対応付ける ことが可能となる。このようなファミリー識別子は、一般の多義識別子の場合と同一の ユーザインタフェースにより、複数の関連付けられた事物要素の情報やファセットデ ータを表示し、また、デフォルトを選択することが可能である。
[0033] ユーザ用事物要素識別子情報テーブル 17gには、特定の種類の事物において、 ユーザが独自に定義した識別子と、当該識別子に関連した事物要素の IDとが格納 される。事物要素間情報テーブル 17hには、同一または異なる種類の事物における 2つの異なる事物要素とその間の関係を格納される。要素間の関係としては、方向性 の有無や関係の強度等が含まれる。
[0034] また、サービス情報格納部 20は、オリジナル情報テーブル 20a、データ生成情報テ 一ブル 20b、オリジナル要素情報テーブル 20c、ファセット情報テーブル 20d、及び I D変換情報テーブル 20eを備えて 、る。
[0035] オリジナル情報テーブル 20aには、オリジナル情報 ID、オリジナル情報サイトの UR L及びオリジナル情報の定義が格納される。データ生成情報テーブル 20bには、オリ ジナルの情報力もファセットデータを生成するための情報(ファセット 、オリジナル 情報 ID及びデータ変換条件)が格納される。オリジナル要素情報テーブル 20cには 、オリジナル情報 ID、オリジナル要素 ID及びオリジナルデータが格納される。
[0036] ファセット情報テーブル 20dには、対象要素に対して対象ファセットで提供される情 報が格納される。 ID変換情報テーブル 20eには、要素 IDとそれに対応したオリジナ
ル要素 IDが格納され、ファセット情報とオリジナルの要素情報との対応付けを行う。
[0037] 上記した情報のうち、オリジナル情報テーブル 20a、データ生成情報テーブル 20b 、オリジナル要素情報テーブル 20c及び ID変換情報テーブル 20eの情報を元に、ォ リジナルの情報から、ファセット情報を生成することが可能となる。なお、事物要素に 対応するオリジナル要素情報が存在せず、ファセットデータが生成できな ヽ場合は、 情報提供ソフトウェア 22が、ファセットデータが存在しな 、ことを示すテキストやィメー ジ(「データなし」の文字や「?」のアイコン等)を生成することにより、ファセットデータ が存在しな 、ことを明示するようにしてもよ!、。
[0038] これらの情報は、公開鍵暗号を用いて暗号ィ匕することにより、データ開発者'作成 者が開発した識別子辞書やファセットデータが、開発者が予期しない改ざんを受ける ことを避けることが好ましい。すなわち、データ開発者等が開発したオリジナルデータ を秘密鍵で暗号化し、システムソフトウェア 16が、この開発者カゝら公開された公開鍵 を用いて、情報を復号ィ匕してこれを用いることが有効である。
[0039] このような簡潔なデータ構造およびデータ間の独立性により、また、暗号化処理に より、第三者が本システムでの利用を目的として、事物要素、識別子辞書、ファセット データ等を独立に、あるいはセットとして容易に開発し、提供することが可能になる。
[0040] ここで、対象となるファセットとしては、例えば、事物「生物種」の各要素に対するファ セット「生物種イメージ」(後述する図 9(b)参照)の様に、 1レコードずつ作製したり、測 定されたりしたものの他に、例えば、事物「遺伝子」におけるファセット「サイズ」の様に 、各要素について存在するオリジナルの情報力 情報処理的に生成されるものがあ る。
[0041] 次に、図 3のフローチャートを参照して、前記システムソフトウェア 16が実行する情 報処理の工程を説明する。以下の説明においては、情報提供対象の事物として「遺 伝子」を、情報を付加する内容であるファセットとして、「サイズ」を指定した例を示す。
[0042] まず、情報表示ソフトウェア 15が電子化されたドキュメントデータを取得してディスプ レイ装置 10に表示すると、(ステップ S1)、ユーザ力もそのドキュメントデータに含まれ るどの事物にっ 、てどう!/、う種類の情報 (ファセット)を付加情報として得た 、かの選 択を受け付ける (ステップ S2)。この例では、「遺伝子」 t 、う事物につ!、て「サイズ」と
いうファセットが選択される。システムソフトウェア 16は、利用情報格納部 17から、選 択された事物 (遺伝子)に対応する識別子辞書 (図 2の事物要素識別子情報テープ ル 17i参照)をロードする (ステップ S3)。この識別子は、対象とする事物(遺伝子)に 含まれる特定の要素を識別可能なタームや IDの集合であり、 1つの要素を特定する 複数の識別子が存在する。
[0043] 次いで、システムソフトウェア 16は、ドキュメントデータの中力も前記識別子を探索( マッピング)し、対象事物の要素として識別する (ステップ S4)。なお、ドキュメント中に 埋め込まれた非表示情報も探索対象とすることもできる。このマッピングによって識別 された要素に隣接してその要素に関する特徴情報を、選択されたファセット (サイズ) に従って、静的あるいは動的に提供する情報提供ソフトウェア 22へのリンクを埋め込 む (ステップ S5)。情報表示ソフトウェア 15は、ドキュメントデータ中に埋め込まれたリ ンクに従って特徴情報を取得し、ドキュメントデータ表示の中に展開して、あるいはド キュメントデータ表示にオーバーラップして特徴情報を表示する (ステップ S6)。なお 、ステップ S4で探索された識別子が複数の要素を同時に示す多義識別子である場 合は、前記情報表示ソフトウェア 15は、多義識別子であることを示すテキスト(「多義 識別子」「M」という文字)やイメージ (アイコン等)を表示したり、この識別子が示す複 数の要素を並べて表示したり、さらに、表示対象とする要素を選択可能なユーザイン ターフェース (選択メニューなど)を生成してディスプレイ装置 10に表示する。情報表 示ソフトウェア 15は、この選択メニュー等で選択された要素につ 、て特徴情報の表 示処理を実行する。
[0044] また、特徴情報を表示した後、ユーザから事物の変更を受け付けた場合 (ステップ S7)には、前記システムソフトウェア 16及び情報表示ソフトウェア 15は、変更された 事物に基づいて上記ステップ S3〜S6の処理を実行する。さらに、ファセットの変更を 受け付けた場合 (ステップ S8)には、変更に力かるファセットに従ってステップ S4〜S 6の処理を実行する。また、新しいドキュメントデータを取得した場合で (ステップ S9) 、同一の事物及びファセット情報が引き続き選択されている場合には、新しいドキュメ ントデータに対してステップ S4〜S6の処理が実行される。
[0045] 次に、図 4〜図 16の表示画面等の例を参照して、本発明の動作及び機能を具体
的に説明する。
[0046] まず、図 4は、利用者用クライアントシステム 2におけるユーザインタフェースの例で ある。本実施例において、ユーザインタフェースは、 Webブラウザにおいてツールバ 一 30として実装されている。このツールバー 30は、情報の表示 Z非表示を切り替え るチェックボックス 31、事物を選択するプルダウンボタン 32、ファセットを選択するプ ルダウンボタン 33、識別子マッピングを再実行するボタン 34、認識された識別子の ハイライト表示 Z非表示の切換ボタン 35、マッピング情報パネルの表示 Z非表示の 切換ボタン 36、及び動作オプションを設定するためのダイアログボックスを開くための オプションボタン 37を備える。ここで、前記再実行ボタン 34は、識別子マッピングの ノ メータを変更して再実行する際に便利である。例えば、後述する図 11の識別子 認識状況のテーブル表示にぉ ヽて、多義識別子でデフォルト表示する事物要素を 設定した後に、マッピングを再実行する場合である。このように、複数のコマンドをッ 一ルバ一に実装することにより、簡便に機能を利用することが可能となる。
[0047] また、事物を選択するプルダウンボタン 32をクリックするとプルダウンメニュー 38が 表示される。また、事物として「Gene Symbol」が選択されている際に、ファセット選択 プルダウンボタン 33をクリックするとプルダウンメニュー 39が表示される。このインタフ エースによって、 1種類の事物と、ファセットとが選択可能である。
[0048] 図 5は、図 4のユーザインタフェースにおいてオプションボタン 37をクリックした場合 に表示される動作オプション設定ダイアログボックス 40の例である。この動作ォプショ ン設定ダイアログボックス 40は 3つのタブによって切り替えられる設定項目 Display4 1と、 Activate42と、 Dictionary43とを有する。この図では、 Display設定タブ 41を 開いた例を示している。このタブ 41では、ファセット情報をドキュメントデータ内に埋め 込んで表示するか、オーバーラップして表示するかを選択するオーバーラップ設定 ボックス 45、ドキュメントデータ中で要素として認識された識別子をハイライト表示する 力どうかを設定するハイライトテキスト設定ボックス 46、複数の事物 (47a)及び複数の ファセット (47b)で指定されるファセット情報を表示するかの設定ボックス 47、ドキュメ ントデータ上の同じ位置で長 ヽ識別子と短!ヽ識別子とが認識された場合に、認識範 囲が他の識別子の認識範囲内である識別子 (短 、識別子)を無視し、長 、識別子を
優先的に表示させるオプション設定ボックス 48、及びドキュメントデータ中において、 同一の要素が複数個認識された場合に、 1個目の要素についてのみファセット情報 を表示させるかのオプション設定ボックス 49を有する。
[0049] ここで、前記ハイライトテキスト設定 46では、テキスト色及び背景色の設定 46a、 46 bも用意されている。また、複数の事物あるいはファセットデータを表示する場合の表 示順序は、表示情報選択リストボックス 47a、 47bにおける表示順序により決定される 。これらのリストボックス 47a、 47bにおける表示順序は、表示順変更ボタン 47cにより 変更できる。さらに、例えば、事物「遺伝子」において同じ位置で ^3 」と ^3 receptor] t 、う複数の識別子が認識された場合に、前記識別子優先表示オプション 設定 49が onにされて 、ると、前者の「kinesin」の識別子は無視される。
[0050] 図 6は、図 5の動作オプション設定ダイアログボックス 40において、 Activateタブ 4 2を開いた例である。ここでは、図 4のユーザインタフェース及び図 5の動作オプション 設定ダイアログボックス 40の Displayタブ 41にお!/、て表示する事物リストに表示する 事物、及びファセットリストに表示するファセットを選択する項目 50、 51を有する。
[0051] また、ファセット表示におけるオプションを設定する項目 52〜60を有する。具体的 には、ファセットデータ生成のためのパラメータとして、生成するタイプの設定 52、表 示サイズの設定 53、及び生成パラメータ 54〜60の設定を有する。生成タイプとして は、テキスト、グラフ(円、棒、折れ線、複数の棒、パイその他)、イメージ、カスタムが 指定可能である。また、それぞれの生成タイプに対応した、生成パラメータが指定で きる。例えば、グラフの生成においては、色の指定 54、グラフの向き 55、最大値 56、 最小値 57、標準化する Zしないの設定 58、対数変換 (logN)する Zしないの設定 59、 ルーラの表示 Z非表示の設定 60などが指定可能である。また、設定内容をその場で 確認できるサンプル 61も表示される。
[0052] 図 7は、図 5又は図 6の動作オプション設定ダイアログボックス 40において、 Dictio naryタブ 43を開いた例である。この画面では、前記利用情報格納部 17に格納され る、指定した事物に対応した識別子の辞書において、ユーザが追加した識別子や、 無効にしたい特定の識別子を設定できるユーザインタフェースを提供する。
[0053] そのため、このユーザインタフェースでは、対象となる事物に対応した辞書名を表
示 ·変更するテキストボックス 63、新規登録したい識別子を入力するテキストボックス 6 4、及び無効化された識別子を一覧表示するテキストボックス 65を備えて 、る。
[0054] 識別子を追加する場合には、識別子入力テキストボックス 64にユーザの識別情報 と対応する要素 IDを入力して登録する。なお、この識別子入力テキストボックス 64を 使用して追加した識別子を削除することも可能である。
[0055] また、特定の識別子を無効化 (属性を登録)した!/ヽ場合には、無効化識別子を追加 するボタン 66をマウスでクリックし、図示しない入力ボックスを表示させる。無効化が 選択されると、前記ユーザ用無効識別子情報テーブル 17bにその識別子の IDが登 録され、前記情報表示ソフトウェア 15がこのテーブル 17bを参照して特徴情報を表 示するかを判別する。なお、ユーザは、無効化済識別子表示テキストボックス 65から 、無効化を解除したい識別子を選択して、削除ボタン 67をクリックすることで個別に 無効化を解除することもできる。
[0056] 例えば、ユーザが参照するドキュメントデータにおいて、ある事物の識別子力 別の 意味を持つターム等と同一である場合に、ユーザが意図した事物と異なる事物とが 同一の事物と認識され、共通の特徴情報がドキュメントデータ中に表示されるおそれ がある。具体的には、事物が「ヒト遺伝子」である場合、ヒト遺伝子「peptide deformylas e-like protein」を指す識別子には、 adobe社のドキュメントファイル形式の名称である「 PDF(Portable Document Format)」と同一の「PDF」が含まれる。そのため、後者を含 むドキュメントデータでは前者だけを識別することはできない。そこで、このような場合 には、当該識別子「PDF」を無効にできるようにした。
[0057] また、このユーザインタフェースでは、ユーザによる特定の識別子の追加若しくは無 効化の設定が、永続的、一連の処理 (セッション)中の複数のドキュメントデータ、若し くは現在表示中の特定のドキュメントデータ、の何れかである力も選択できるように設 計するのが好ましい。なお、ユーザが常にその識別子を無効にしたい場合は、無効 識別子を利用情報格納部 17に別途格納し、システムソフトウェア 16が識別子辞書を 利用する際に制限する機能が有効である。
[0058] また、一連のセッション中に、あるいは当該ドキュメントデータ中で、特定の識別子を 無効にするためのユーザインタフェースとしては、情報表示ソフトウェア 15によって当
該識別子が識別されることにより表示されるファセットデータを、マウスで右クリックす ることでポップアップメニューを表示させ、このメニューの中に実行コマンド(セッション 中無効、ページ中で無効)を用意することが効果的である。
[0059] 図 8は、利用者用クライアントシステム 2の情報表示ソフトウェア (Webブラウザ等) 1 5やシステムソフトウェア 16が稼動してドキュメントデータを表示した例である。この例 では、事物「Protein」、ファセット「BM」が選択されている。ここで、 BMは、 10の生体 組織における遺伝子発現頻度パターンデータである。表示されたドキュメントデータ 力 「Protein」を表す「CDC2」「CDK1」などの識別子 68、 68が識別されてハイライト 表示されると共に、これらの識別子 68の隣に、ファセットデータである 10組織での発 現頻度パターンを示す棒グラフ 69が表示されて 、る。この例で示した棒グラフ 69な どのファセットデータは、前記情報提供ソフトウェア 22がオリジナル要素情報テープ ル 20cを参照して動的に生成する。即ち、この利用者用クライアントシステム 2から要 求された時点で生成することが可能である。そのためユーザは、利用者用クライアント システム 2にお ヽて設定を変えて、リアルタイムで表示形態を変更することが可能であ る。
[0060] ユーザは、識別子 68をマウスで左クリックすることにより、事物情報の管理者 (デー タ開発者若しくは提供者)が設定した事物要素へのハイパーリンクを、また、ファセット データ(棒グラフ 69)をマウスで左クリックすることにより、ファセットデータの管理者( データ開発者あるいは提供者)が設定したファセットデータへのハイパーリンクを、夫 々利用することができる。また、マウスの右クリックにより表示されるポップアップメ-ュ 一には、事物情報の管理者 (データ開発者あるいは提供者)が設定した事物情報リソ ースゃ事物要素へのハイパーリンク、及びファセットデータの管理者が設定したファ セットデータ情報へのハイパーリンクを利用することが可能になる。また、複数の意味 を有する多義識別子のリスト表示とリストからの選択、特定の識別子の無効化、ユー ザによるクレーム報告のためのコマンド等が利用可能である。多義識別子の選択およ び識別子の無効化処理の対象については、永続的、一連の処理 (セッション)中の複 数のドキュメントデータ、若しくは現在表示中の特定のドキュメントデータ、の何れかを ユーザが選択できるコマンドをメニューアイテムとして用意するのが好ましい。
[0061] 図 9は、オリジナル要素情報テーブル 20cから動的に生成可能なファセットデータ の例である。例えば、テキスト 70a、円グラフ 70b、棒グラフ 70c、染色体上の位置情 報であるローカス情報 70d、メモリ付き棒グラフ 70e、複数棒グラフ 70f、パイグラフ 70 gなどである。それぞれ、表示サイズ、色の指定、縦横表示の指定、オリジナル情報 における下限'上限値指定や直線'対数変換指定等が可能である(図 6参照)。
[0062] 図 10 (a)〜(c)は、利用者用クライアントシステム 2の情報表示ソフトウェア (Webブ ラウザ等) 15やシステムソフトウェア 16を稼動させてドキュメントデータを表示する例 である。この例では、事物「Species (生物種)」、ファセット「Picture」が選択されている 。図 10 (a)の情報表示オフの状態から、チェックボックス 72をマウスでクリックすると、 図 10 (b)の情報表示オンの状態になる。この状態では、図 10 (c)で拡大して示すよう に、ドキュメントデータ中の生物の学名(識別子) 73の側に各生物のイメージ (特徴情 報) 74が夫々表示される。
[0063] 図 11は、利用者用クライアントシステム 2で処理した情報の履歴を管理し、集計して 利用可能とする機能を示す図である。この図では、事物として「遺伝子」 (gene)にお いて、複数のページで、「Cdc2」 rcdklj「Cdk2」の各遺伝子が認識された例を示す。 この履歴管理機能は、過去に処理したドキュメントデータ (ページ)において認識され た要素情報が、図 11 (a)に示すように、事物 76又はページ 77の単位でツリー表示さ れる。このツリー力 事物又はページをマウスでクリックすると、該当する事物若しくは ページが表示される。また、図 11 (b)に示すように、認識された要素を集計して表形 式で表示させることちできる。
[0064] 図 12は、多義識別子の処理を説明するための図である。要素の名称を識別子とす る場合は、多義語など 1の識別子が複数の要素に対応する場合がある。この様な場 合、ドキュメントデータの中で認識した識別子が複数の要素に対応することを、例え ばアイコン 80で表示するのが好ましい。ユーザが、このアイコン 80にマウスのポイン タを合わせたり右クリックすると、対応する要素の代表的な名称(=代表識別子)と特 徴情報とを含むポップアップ画面 81を表示し、ユーザがリストの中から特定の要素を 選択できるようにする。この画面 81で特定の要素が選択された場合には、アイコン 80 が選択された要素の特徴情報に変更されたり、選択された要素の特徴情報がアイコ
ン 80に併記される。
[0065] また、このように特定の事物を選択させる場合は、その事物と識別子との関連付け 力 永続的、一連の処理 (セッション)中の複数のドキュメントデータ、若しくは現在表 示中の特定のドキュメントデータ、の何れかであるかをユーザが選択できるコマンドを メニューアイテムとして用意するのが好ましい。この場合、テキストマイニングの手法に よって、当該複数事物の中で、対象ドキュメントにふさわしい事物を選択候補の上位 に表示したり、デフォルトの選択候補とすることも有効である。
[0066] 一方、図 12の紙面左側の表示部 82には、紙面右側のドキュメントデータの該当べ ージにおいて認識された識別子のリスト 82aや要素選択のインタフェース 82bが表示 される。認識された識別子の中には、上記した多義識別子も含まれる。この表示部 8 2は、対象ドキュメントに存在する要素や、その多義性の情報を提供する有効なイン タフエースとなる。
[0067] 図 13は、辞書情報表示機能を示す図である。この図の表示画面は、前記利用情報 格納部 17 (事物要素識別子情報テーブル 17f)に格納される識別子の辞書に関する 情報の表示部 83、及びサービス情報格納部 20 (ファセット情報テーブル 20d)に格 納されたファセットデータに関する情報の表示部 84を備えている。このような識別子 辞書に含まれる識別子の数や事物要素の数、識別子辞書の構築に用いたリソース の情報等を、テキスト、イメージ、リソース情報を提供する Webサイトやその他の関連 情報を取得できるノ、ィパーリンクはユーザに有益な情報となる。
[0068] 図 14は、事物「蛋白質」において、ドキュメントデータ中で認識された事物要素であ る各種蛋白質のヒトゲノム上の存在位置を、情報パネルのマップタブ 86に表示したヒ ト全染色体概略図上で表示した例である。また図 15は、同じくドキュメントデータ中で 認識された各種蛋白質の種類における事物要素全体における分子量の分布 (対数 頻度)を情報パネルのマップタブ 87に表示した例である。このように、情報パネルの マップタブでは、選択されて!ヽる事物に対応して利用可能なマップをプルダウンメニ ユー力も選択して、ドキュメントデータ中で認識された識別子を、地図、図表、グラフ など、事物に応じた情報にマッピングすることで、認識された事物要素の概要を容易 に知ることができる情報を提供できる。
[0069] なお、この発明は上記の実施形態に限定されるものではなぐ発明の要旨を変更し な!ヽ範囲で種々変形可能である。
[0070] 例えば、上記の実施形態では、本システム 1を利用者用クライアントシステム 2と情 報提供サーバシステム 3とで構成したが、利用者用クライアントシステムだけで構成す ることもできる。この場合は、図 16に示すように、利用者用クライアントシステム 200に サービス情報格納部 20及び情報提供ソフトウェア 22を備えるように構成する。この場 合の特徴情報は、 WWWを通じて WEBサーバ力もダウンロードしてもよいし、 CD— ROMなどの記憶媒体力 導入してもよ 、。
[0071] また、利用情報格納部 17に格納した識別子辞書の情報について、事物種類情報 の管理者 (作成者を含む。以下同様)に対して報告する機能を備えてもよい。この機 能は、前記利用情報格納部 17に格納される識別子辞書に存在しない識別子や、識 別子に対応する要素 IDの誤り、若しくは識別子に対応する要素 IDにより表示される ファセットデータに対するクレーム (不備、不足等)を、ユーザが事物種類情報の管理 者に対して報告する機能である。これにより、識別子辞書の精度を高めることができる
[0072] これを実現するユーザインタフェースとして、識別子辞書に存在しな!、識別子の報 告は、ユーザの識別子登録における登録確認ダイアログボックスに用意する新規識 別子報告ダイアログボックスが有効である。また、識別子に対応する要素 IDの誤り、 及びファセットデータに対するクレームについては、情報表示ソフトウェア 15によって 当該識別子が識別されることにより表示されるファセットデータをマウスで右クリックす ることによりポップアップメニューを表示させ、このメニュー中にクレームダイアログボッ タスをオープンする機能を用意することが効果的である。
[0073] また、本発明においては、ファセット (特徴情報)として複数の事物若しくは要素の 間の関係を表示するようにしてもよい。例えば、図 17に示すように、ドキュメントデータ 力も抽出された識別子によって特定される事物(Protein)において、複数(図示の例 では 5個)のタンパク質 (要素)間の相互作用を特徴情報として識別子の近傍に埋め 込んで若しくはオーバーラップして表示する。このような複数要素間の関係は、図 2の 事物要素間情報テーブル 17hに格納される。これにより、個々の事物若しくは要素だ
けを参照した場合には得られな 、 (得られにく 、)新たな知見を得るための有益な情 報を提供できる。
図面の簡単な説明
[図 1]図 1は、本発明の実施形態のシステム構成を示す概略図である。
[図 2]図 2は、同、各データベースの関係を示すスキーマ概略図である。
[図 3]図 3は、同、処理工程を示すフローチャートである。
[図 4]図 4は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例 を示す図である。
[図 5]図 5は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例 を示す図である。
[図 6]図 6は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例 を示す図である。
[図 7]図 7は、同、利用者用クライアントシステムにおけるユーザインタフェースの一例 を示す図である。
[図 8]図 8は、利用者用クライアントシステムにおけるシステム動作例を示す図である。
[図 9]図 9は、ファセットデータの一例を示す図である。
[図 10]図 10は、利用者用クライアントシステムにおけるシステム動作例を示す図であ る。
[図 11]図 11は、履歴機能の動作例を示す図である。
[図 12]図 12は、利用者用クライアントシステムにおけるシステム動作例(多義識別子 の処理)を示す図である。
[図 13]図 13は、利用者用クライアントシステムにおけるシステム動作例(辞書情報表 示機能)を示す図である。
[図 14]図 14は、利用者用クライアントシステムにおけるシステム動作例(ヒトゲノム上 の存在位置)を示す図である。
[図 15]図 15は、利用者用クライアントシステムにおけるシステム動作例(分子量の分 布)を示す図である。
[図 16]図 16は、本発明の変形例のシステム構成を示す概略図である。
[図 17]図 17は、特徴情報の他の表示例を示す図である。
Claims
[1] 入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御 手段を備えたコンピュータシステムによってドキュメントデータ中に関連情報を表示す る方法であって、
前記記憶装置は、複数の事物と、複数の事物の中から 1以上の事物を特定する識 別子と、各事物の特徴情報と、を事物の識別情報に関連付けて記述するデータライ ブラリと、制御手段によって実行されるコンピュータソフトウェアを格納するコンビユー タソフトウェア格納部とを備え、
前記制御手段が、コンピュータソフトウェアを読み出して実行させることで、 ドキュメントデータ力 抽出する識別子の選択を前記入力手段力 受け付ける識別 子受付工程と、
読出手段によって読み出されたドキュメントデータから、前記選択に係る識別子を 特定する工程と、
前記特定した識別子に基づいてデータライブラリから事物の特徴情報を検索する 工程と、
検索した特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込ん で、若しくはオーバーラップしてディスプレイ装置に表示する工程と、
を有することを特徴とする方法。
[2] 請求項 1の方法において、
前記データライブラリは、遺伝子、生物種、学校、人物、企業、疾病、事件の少なく とも何れかを含む複数の事物と、各事物に含まれる情報若しくは事物を特定する情 報力 なる要素と、事物や要素に含まれる及び Z若しくは 1以上の事物や要素を特 定する文字列、記号、数値などのテキストデータ力 なる識別子と、ドキュメントデータ 上に表示させるフォーマットを含むファセットデータ力 なる特徴情報と、を記述する ものであり、
前記特徴情報検索工程は、論文や WEBサイト、文書データ、電子メールなどのド キュメントデータ力 特定した識別子に基づいて事物若しくは要素を特定することで、 この事物の特徴情報をデータライブラリから検索するものである
ことを特徴とする方法。
[3] 請求項 2の方法において、
前記データライブラリは、識別子として、少なくとも事物若しくは要素の名称と、その 同義語とを記述するものであることを特徴とする方法。
[4] 請求項 3の方法において、
前記出力工程は、ドキュメントデータ上で特定した識別子に複数の事物若しくは要 素が対応する場合に、前記データライブラリを参照して当該複数の事物若しくは要素 の特徴情報をディスプレイ装置に一覧表示し、この一覧表示力 ユーザが選択した 1 以上の特徴情報をドキュメントデータ上に埋め込んで若しくはオーバーラップして表 示するものであることを特徴とする方法。
[5] 請求項 1の方法において、
前記データライブラリは、複数の事物若しくは要素で共通する 1以上の識別子を記 述するものであり、
前記検索工程は、特定された識別子に複数の事物が関連付けられている場合に、 該当する複数の事物をディスプレイ装置に一覧表示して 1以上の事物の種類の選択 を受け付ける工程を備え、
この検索工程は、選択に係る 1以上の事物の特徴情報をデータライブラリから検索 するものである
を有することを特徴とする方法。
[6] 請求項 1の方法において、
前記データライブラリは、特定の識別子について、特徴情報を表示する対象若しく は対象外となる属性を登録するものであり、
前記出力工程は、制御手段が、ドキュメントデータ上で特定した識別子について前 記データライブラリを参照して特徴情報を表示するかを判別する工程を備えた ことを特徴とする方法。
[7] 請求項 1の方法において、
さらに、前記制御手段が、
事物、識別子及び特徴情報の少なくとも何れかの情報をこの情報の作成者若しく
は管理者力 取得して記憶装置に格納する工程と、
データライブラリに登録されて ヽな ヽ事物や識別子の情報、識別子と事物との関連 付けが不正確若しくは不十分である場合の当該識別子及び事物の情報、の何れか を入力手段を通じて受け付ける工程と、
受け付けた修正情報を前記データライブラリの作成者若しくは管理者に通知する 工程と
を備えたことを特徴とする方法。
[8] 請求項 1の方法において、
前記データライブラリは、関連性の高い複数の識別子同士を関連付けて登録する ものであり、
前記検索工程は、ドキュメントデータの中から前記関連付けられた複数の識別子の 何れかを特定した場合に、前記データライブラリを参照して事物の特徴情報を検索 するものである
ことを特徴とする方法。
[9] 請求項 1の方法において、
さらに、前記制御手段が、データライブラリに記述された事物、識別子若しくは特徴 情報の少なくとも何れ力を一覧表示する工程を備えたことを特徴とする方法。
[10] 請求項 1の方法において、
前記データライブラリは、複数の事物に対応する 1の識別子を記述するものであり、 前記特徴情報検索工程は、ドキュメントデータの中で特定された当該識別子に対 応する複数の事物を表示してユーザからの選択を受け付け、選択された事物に関す る特徴情報を検索するものである
ことを特徴とする方法。
[11] 請求項 1の方法において、
さらに、前記制御手段が、前記識別子特定工程で特定された識別子に基づいて関 連する事物を特定し、この事物の情報を当該事物に応じた地図、図表、グラフなどの 形式で表示する工程を備えたことを特徴とする方法。
[12] 請求項 1の方法において、
さらに、前記制御手段が、ドキュメントデータの中から特定された識別子に基づいて 特定された複数の事物のリストを作成し、当該ドキュメントデータ中における各識別子 若しくは事物の登場頻度や、選択された情報の種類で特定される情報をテーブル形 式で表示する工程を備えたことを特徴とする方法。
[13] 請求項 1の方法において、
さらに、前記制御手段が、
ドキュメントデータの中で特定された識別子及びこの識別子に関連する事物の履歴 情報を事物若しくは識別子の識別情報に関連付けて前記記憶装置に格納する工程 と、
事物若しくは処理対象のドキュメントデータの単位で、表示履歴をディスプレイ装置 に表示する工程とを備えた
ことを特徴とする方法。
[14] 請求項 1の方法において、
前記ドキュメントデータは、ハイパーテキスト形式のデータであり、
前記特徴情報表示工程は、特徴情報をハイパーテキスト中の識別子の位置の近傍 に埋め込んで、若しくはオーバーラップしてディスプレイ装置に表示するものである ことを特徴とする方法。
[15] 請求項 1の方法において、
前記特徴情報表示工程は、データライブラリに格納された情報に基づ ヽて特徴情 報を動的に生成するものであることを特徴とするシステム。
[16] 請求項 1の方法において、
前記特徴情報検索工程は、特徴情報として、ドキュメントデータから特定された識 別子に基づいて特定される事物と他の事物との間の関係を前記データライブラリから 検索するものであることを特徴とする方法。
[17] 請求項 1の方法において、
前記コンピュータシステムは、通信ネットワークを介して接続される情報提供サーバ システムと、情報表示クライアントシステムとから構成され、
前記情報提供サーバシステムの記憶装置は、データライブラリのうち、複数の事物
と識別子とを事物の識別情報に関連付けて記述するサービス情報格納部を備え、 前記情報表示クライアントシステムの記憶装置は、データライブラリのうち、各事物 の特徴情報を事物の識別情報に関連付けて記述する利用情報格納部を備えた ことを特徴とする方法。
[18] 入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御 手段を備え、ドキュメントデータ中に関連情報を表示する情報処理システムであって 前記記憶装置は、複数の事物と、複数の事物の中から 1以上の事物を特定するた め識別子と、各事物の特徴情報と、を事物の識別情報に関連付けて記述するデータ ライブラリと、制御手段によって実行されるコンピュータソフトウェアを格納するコンビュ ータソフトウェア格納部とを備え、
ドキュメントデータ力 抽出する識別子の選択を前記入力手段力 受け付ける識別 子受付手段と、
前記読出手段によって読み出されたドキュメントデータから、前記選択に係る識別 子を特定する識別子特定手段と、
前記特定した識別子に基づいてデータライブラリから事物の特徴情報を検索する 特徴情報検索手段と、
検索した特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込ん で、若しくはオーバーラップしてディスプレイ装置に表示する表示手段と
を有することを特徴とするシステム。
[19] 入力装置、ディスプレイ装置、記憶装置、ドキュメントデータの読出し手段及び制御 手段を備えたコンピュータシステムの前記記憶装置に格納され、このコンピュータシ ステムをドキュメントデータ中に関連情報を表示させる情報処理システムとして機能さ せるためのコンピュータソフトウェアであって、
前記記憶装置は、複数の事物と、複数の事物の中から 1以上の事物を特定するた めの識別子と、各事物の特徴情報と、を事物の識別情報に関連付けて記述するデー タライブラリを備え、
前記コンピュータソフトウェアが、
ドキュメントデータ力 抽出する識別子の選択を前記入力手段力 受け付ける手順 と、
前記読出手段によって読み出されたドキュメントデータから、前記選択に係る識別 子を特定する手順と、
前記特定した識別子に基づいてデータライブラリから事物の特徴情報を検索する 手順と、
検索した特徴情報を前記ドキュメントデータ中の識別子の位置の近傍に埋め込ん で、若しくはオーバーラップしてディスプレイ装置に表示する手順と
を前記コンピュータシステムに実行させることを特徴とするコンピュータソフトウェア。
Priority Applications (3)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2007505309A JP3998706B2 (ja) | 2005-09-16 | 2005-11-30 | ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア |
| US12/066,973 US20090210787A1 (en) | 2005-09-16 | 2005-11-30 | Document data managing method, managing system, and computer software |
| EP05811483A EP1956498A4 (en) | 2005-09-16 | 2005-11-30 | DOCUMENT DATA MANAGEMENT PROCEDURES, ADMINISTRATIVE SYSTEM AND COMPUTER SOFTWARE |
Applications Claiming Priority (2)
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2005269441 | 2005-09-16 | ||
| JP2005-269441 | 2005-09-16 |
Publications (1)
| Publication Number | Publication Date |
|---|---|
| WO2007032095A1 true WO2007032095A1 (ja) | 2007-03-22 |
Family
ID=37864701
Family Applications (2)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2005/021992 Ceased WO2007032095A1 (ja) | 2005-09-16 | 2005-11-30 | ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア |
| PCT/JP2006/313868 Ceased WO2007032142A1 (ja) | 2005-09-16 | 2006-07-12 | ドキュメントデータ表示処理方法、ドキュメントデータ表示処理システム及びドキュメントデータ表示処理用のソフトウェアプログラム |
Family Applications After (1)
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| PCT/JP2006/313868 Ceased WO2007032142A1 (ja) | 2005-09-16 | 2006-07-12 | ドキュメントデータ表示処理方法、ドキュメントデータ表示処理システム及びドキュメントデータ表示処理用のソフトウェアプログラム |
Country Status (4)
| Country | Link |
|---|---|
| US (2) | US20090210787A1 (ja) |
| EP (2) | EP1956498A4 (ja) |
| JP (2) | JP3998706B2 (ja) |
| WO (2) | WO2007032095A1 (ja) |
Cited By (2)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016066232A (ja) * | 2014-09-24 | 2016-04-28 | 株式会社オウケイウェイヴ | 回答検索システム、データ送受信装置及び回答検索装置 |
| JP2019160334A (ja) * | 2019-05-13 | 2019-09-19 | 株式会社オウケイウェイヴ | 回答検索システム、データ送受信装置及び回答検索装置 |
Families Citing this family (15)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2009009202A (ja) * | 2007-06-26 | 2009-01-15 | Bits Co Ltd | 電子文書の提供方法及びコンピュータプログラム |
| US20090319945A1 (en) * | 2008-06-19 | 2009-12-24 | International Business Machines Corporation | Interface for using desired state commands on a copy services mangement system |
| US9195755B1 (en) * | 2009-03-31 | 2015-11-24 | Emc Corporation | Relevancy radar |
| CA2788330C (en) * | 2010-01-29 | 2018-05-08 | Gaurav Mehra | Systems and methods for providing a validation tool |
| US20120151310A1 (en) * | 2010-12-13 | 2012-06-14 | El-Kalliny Ahmed M | Method and system for identifying and delivering contextually-relevant information to end users of a data network |
| US9542494B2 (en) * | 2011-10-11 | 2017-01-10 | Microsoft Technology Licensing, Llc | Proactive delivery of related tasks for identified entities |
| US20130110605A1 (en) * | 2011-10-30 | 2013-05-02 | Bank Of America Corporation | Product recognition promotional offer matching |
| CN102508897B (zh) * | 2011-11-03 | 2013-08-21 | 匡晓明 | 通用信息收藏的方法与系统 |
| US9141715B2 (en) * | 2012-01-03 | 2015-09-22 | International Business Machines Corporation | Automated hyperlinking in electronic communication |
| JP2013196141A (ja) * | 2012-03-16 | 2013-09-30 | Ntt Docomo Inc | 端末装置、情報表示システムおよび情報表示方法 |
| US20140180934A1 (en) * | 2012-12-21 | 2014-06-26 | Lex Machina, Inc. | Systems and Methods for Using Non-Textual Information In Analyzing Patent Matters |
| JP2014186463A (ja) * | 2013-03-22 | 2014-10-02 | Yahoo Japan Corp | 関連情報抽出装置、関連情報抽出方法および関連情報抽出プログラム |
| CN103514286A (zh) * | 2013-09-30 | 2014-01-15 | 鸿富锦精密工业(深圳)有限公司 | 好友推荐系统及方法 |
| US10180985B2 (en) * | 2015-02-19 | 2019-01-15 | At&T Intellectual Property I, L.P. | Apparatus and method for automatically redirecting a search |
| CN106951492B (zh) * | 2017-03-14 | 2020-09-22 | Oppo广东移动通信有限公司 | 文件搜索方法、装置和电子设备 |
Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08212230A (ja) * | 1995-01-31 | 1996-08-20 | Toshiba Corp | 文書検索方法及び文書検索装置 |
| JP2000010981A (ja) | 1998-06-19 | 2000-01-14 | Fuji Xerox Co Ltd | リンク識別方法及び電子ドキュメントシステム |
| JP2002207727A (ja) | 2000-11-10 | 2002-07-26 | Fujitsu Ltd | クライアント装置、そのプログラムを記録した記録媒体、及びそのプログラム |
| JP2003006186A (ja) | 2001-06-22 | 2003-01-10 | Hitachi Eng Co Ltd | 文書管理方法及びその装置 |
| JP2004272678A (ja) * | 2003-03-10 | 2004-09-30 | Casio Comput Co Ltd | 情報表示制御装置及びプログラム |
| JP2005269441A (ja) | 2004-03-19 | 2005-09-29 | Sharp Corp | 電荷検出回路およびそれを備えた画像センサ |
Family Cites Families (11)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH02297188A (ja) * | 1989-03-14 | 1990-12-07 | Sharp Corp | 文書作成支援装置 |
| JP3734101B2 (ja) * | 1995-07-17 | 2006-01-11 | シャープ株式会社 | ハイパーメディア構築支援装置 |
| US5873107A (en) * | 1996-03-29 | 1999-02-16 | Apple Computer, Inc. | System for automatically retrieving information relevant to text being authored |
| US5926808A (en) * | 1997-07-25 | 1999-07-20 | Claritech Corporation | Displaying portions of text from multiple documents over multiple databases related to a search query in a computer network |
| JP2001109654A (ja) * | 1999-10-12 | 2001-04-20 | Fuji Xerox Co Ltd | 電子読書支援システム |
| US7559034B1 (en) * | 2000-10-19 | 2009-07-07 | DG FastChannel, Inc. | Method and system for using a hyperlink, banner, or graphical icon to initiate the overlaying of an object on a window |
| US6883138B2 (en) * | 2001-08-08 | 2005-04-19 | Xerox Corporation | Methods and systems for generating enhanced thumbnails usable for document navigation |
| JP2003196194A (ja) * | 2002-09-30 | 2003-07-11 | Fujitsu Ltd | リンク処理方法及び装置 |
| US20040073531A1 (en) * | 2002-10-09 | 2004-04-15 | International Business Machines Corporation | Method, system and program product for automatically linking web documents |
| JP2004295485A (ja) * | 2003-03-27 | 2004-10-21 | Sanyo Electric Co Ltd | 診療支援装置、診療支援方法、診療支援プログラム及び電子カルテ |
| US7428698B2 (en) * | 2004-07-08 | 2008-09-23 | International Business Machines Corporation | Differential dynamic delivery of content historically likely to be viewed |
-
2005
- 2005-11-30 EP EP05811483A patent/EP1956498A4/en not_active Withdrawn
- 2005-11-30 US US12/066,973 patent/US20090210787A1/en not_active Abandoned
- 2005-11-30 JP JP2007505309A patent/JP3998706B2/ja not_active Expired - Lifetime
- 2005-11-30 WO PCT/JP2005/021992 patent/WO2007032095A1/ja not_active Ceased
-
2006
- 2006-07-12 WO PCT/JP2006/313868 patent/WO2007032142A1/ja not_active Ceased
- 2006-07-12 JP JP2007535389A patent/JP4150415B2/ja active Active
- 2006-07-12 EP EP06768132A patent/EP1950670A4/en not_active Withdrawn
- 2006-07-12 US US12/066,978 patent/US20090240560A1/en not_active Abandoned
Patent Citations (6)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JPH08212230A (ja) * | 1995-01-31 | 1996-08-20 | Toshiba Corp | 文書検索方法及び文書検索装置 |
| JP2000010981A (ja) | 1998-06-19 | 2000-01-14 | Fuji Xerox Co Ltd | リンク識別方法及び電子ドキュメントシステム |
| JP2002207727A (ja) | 2000-11-10 | 2002-07-26 | Fujitsu Ltd | クライアント装置、そのプログラムを記録した記録媒体、及びそのプログラム |
| JP2003006186A (ja) | 2001-06-22 | 2003-01-10 | Hitachi Eng Co Ltd | 文書管理方法及びその装置 |
| JP2004272678A (ja) * | 2003-03-10 | 2004-09-30 | Casio Comput Co Ltd | 情報表示制御装置及びプログラム |
| JP2005269441A (ja) | 2004-03-19 | 2005-09-29 | Sharp Corp | 電荷検出回路およびそれを備えた画像センサ |
Non-Patent Citations (1)
| Title |
|---|
| See also references of EP1956498A4 * |
Cited By (3)
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016066232A (ja) * | 2014-09-24 | 2016-04-28 | 株式会社オウケイウェイヴ | 回答検索システム、データ送受信装置及び回答検索装置 |
| JP2019160334A (ja) * | 2019-05-13 | 2019-09-19 | 株式会社オウケイウェイヴ | 回答検索システム、データ送受信装置及び回答検索装置 |
| JP2022000773A (ja) * | 2019-05-13 | 2022-01-04 | 株式会社オウケイウェイヴ | 回答検索システム、データ送受信装置及び回答検索装置 |
Also Published As
| Publication number | Publication date |
|---|---|
| EP1950670A4 (en) | 2010-03-31 |
| JPWO2007032095A1 (ja) | 2009-03-19 |
| JP3998706B2 (ja) | 2007-10-31 |
| EP1950670A1 (en) | 2008-07-30 |
| US20090240560A1 (en) | 2009-09-24 |
| JP4150415B2 (ja) | 2008-09-17 |
| US20090210787A1 (en) | 2009-08-20 |
| EP1956498A4 (en) | 2009-08-05 |
| WO2007032142A1 (ja) | 2007-03-22 |
| JPWO2007032142A1 (ja) | 2009-03-19 |
| EP1956498A1 (en) | 2008-08-13 |
Similar Documents
| Publication | Publication Date | Title |
|---|---|---|
| Markscheffel et al. | Comparison of two science mapping tools based on software technical evaluation and bibliometric case studies | |
| Yang et al. | NCBI's conserved domain database and tools for protein domain analysis | |
| JP3998706B2 (ja) | ドキュメントデータの管理方法、管理システム及びコンピュータソフトウェア | |
| Van Eck et al. | Visualizing bibliometric networks | |
| US20060150087A1 (en) | Ultralink text analysis tool | |
| JP2013537326A (ja) | 医療情報ナビゲーションエンジン(mine)システム | |
| US9311360B2 (en) | Association of data to a biological sequence | |
| CN113779540A (zh) | 一种基于rpa的企业公示信息数据采集方法 | |
| Bailey Jr et al. | GAIA: framework annotation of genomic sequence | |
| Lo Surdo et al. | SIGNOR: a database of causal relationships between biological entities—a short guide to searching and browsing | |
| Spidlen et al. | Gating‐ML: XML‐based gating descriptions in flow cytometry | |
| Aguillo | A new generation of tools for search, recovery and quality evaluation of World Wide Web medical resources | |
| Liu et al. | DynGO: a tool for visualizing and mining of Gene Ontology and its associations | |
| US20100211562A1 (en) | Multi-part record searches | |
| Hoeber et al. | HotMap: Supporting visual exploration of Web search results | |
| Richardson et al. | EMAGE: electronic mouse atlas of gene expression | |
| KT et al. | Landscape of Research Data Repositories (RDRs) from Asian Countries: Insights from the re3data Registry | |
| O’Donoghue et al. | Reflect: A practical approach to web semantics | |
| N. Twigger et al. | Exploring phenotypic data at the rat genome database | |
| Garritano | Evolution of SciFinder, 2011–2013: new features, new content | |
| Shen | HAD: an automated database tool for analyzing screening hits in drug discovery | |
| Healy | Using BLAST for performing sequence alignment | |
| Schindler et al. | An annotation scheme for references to research artefacts in scientific publications | |
| Vitalis et al. | Flapjack: Data Management and Analysis for Genetic Circuit Characterization | |
| Smith et al. | Determining usage when vendors do not provide data |
Legal Events
| Date | Code | Title | Description |
|---|---|---|---|
| WWE | Wipo information: entry into national phase |
Ref document number: 2007505309 Country of ref document: JP |
|
| 121 | Ep: the epo has been informed by wipo that ep was designated in this application | ||
| NENP | Non-entry into the national phase |
Ref country code: DE |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 2005811483 Country of ref document: EP |
|
| WWP | Wipo information: published in national office |
Ref document number: 2005811483 Country of ref document: EP |
|
| WWE | Wipo information: entry into national phase |
Ref document number: 12066973 Country of ref document: US |