WO2016063446A1 - 説明変数表示優先順位決定システム、方法およびプログラム - Google Patents

説明変数表示優先順位決定システム、方法およびプログラム Download PDF

Info

Publication number
WO2016063446A1
WO2016063446A1 PCT/JP2015/004284 JP2015004284W WO2016063446A1 WO 2016063446 A1 WO2016063446 A1 WO 2016063446A1 JP 2015004284 W JP2015004284 W JP 2015004284W WO 2016063446 A1 WO2016063446 A1 WO 2016063446A1
Authority
WO
WIPO (PCT)
Prior art keywords
explanatory variable
display priority
variable
value
explanatory
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Ceased
Application number
PCT/JP2015/004284
Other languages
English (en)
French (fr)
Inventor
洋介 本橋
佐也香 八木
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
NEC Corp
Original Assignee
NEC Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by NEC Corp filed Critical NEC Corp
Priority to US15/521,275 priority Critical patent/US20170308825A1/en
Priority to JP2016555053A priority patent/JP6558375B2/ja
Priority to EP15852193.0A priority patent/EP3211579A4/en
Publication of WO2016063446A1 publication Critical patent/WO2016063446A1/ja
Anticipated expiration legal-status Critical
Ceased legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising

Definitions

  • the present invention relates to an explanatory variable display priority determining system, an explanatory variable display priority determining method, and an explanatory variable display priority determining program for determining priorities when displaying explanatory variables.
  • Estimating the future from available data in various business fields is effective for business improvement. For example, in a store, if future sales can be estimated from sales data for the last two weeks, inventory management can be performed appropriately.
  • Non-Patent Document 1 discloses software that supports analysis of available data performed by an analyst such as a statistician.
  • the software disclosed in Non-Patent Document 1 has an estimation function and a function for visualizing an estimation result.
  • Non-Patent Document 2 when a prediction formula is automatically selected from a plurality of prediction formulas and a predicted value is calculated using the prediction formula, the selected prediction formula is displayed together with a graph of predicted values and actual values. It displays that the graph which shows transition of is displayed.
  • an expression representing regularity found between the objective variable and the explanatory variable is called an “estimation expression”.
  • a value estimated using the estimation formula is referred to as an “estimated value”.
  • the estimation formula is represented in the following format, for example.
  • y is an estimated value.
  • X 1 , x 2 ,..., X n are explanatory variables.
  • b is a constant term, and a 1 , a 2 ,..., a n , b are determined in advance using learning data.
  • the estimated value y can be calculated using the above formula.
  • SAS Visual Analytics SAS Institute Japan, Inc., [October 23, 2014 search], Internet ⁇ URL: http://www.sas.com/en_us/software/business-intelligence/visual-analytics.html> “Machine learning that has taken a step forward, penetration of data usage increased rapidly with IoT”, Nikkei BP, “Nikkei Big Data”, 2014 06, p. 7-12
  • each explanatory variable for example, change in the value of each explanatory variable
  • each explanatory variable can be grasped together with the display of the change in the estimated value.
  • explanatory variables there are many types of explanatory variables, and when all explanatory variables are displayed in a random order, it may be difficult for an analyst to understand the relationship between the explanatory variables and the estimated values.
  • the present invention provides an explanatory variable display priority determination system, an explanatory variable display priority determination method, and an explanation capable of determining display priority for explanatory variables given for calculating an estimated value and displaying the explanatory variables.
  • An object is to provide a variable display priority determination program.
  • the display priority of each explanatory variable used in the estimation of the value by the estimation formula is based on the residual that is the estimated amount of error between the estimated value by the estimation formula and the actual measurement value.
  • Display priority determining means for determining the display variable, and display means for displaying the explanatory variable according to the display priority displays the explanatory variable based on the magnitude of the influence of the explanatory variable on the residual. The priority order is determined.
  • the explanatory variable display priority determination system determines the display priority of each explanatory variable used in the estimation of the value by the estimation formula based on the coefficient of each explanatory variable in the estimation formula.
  • a display means for displaying a change in the estimated value by the estimation formula and a change in the value of the explanatory variable along a predetermined axis.
  • the explanatory variable display priority determination method provides the display priority of each explanatory variable used in the estimation of the value by the estimation formula as a residual that is an estimated amount of error between the estimated value by the estimation formula and the actual measurement value. Display the explanatory variables according to the display priority, and determine the display priority of the explanatory variables based on the magnitude of the influence of the explanatory variables on the residual when the display priority is determined.
  • the explanatory variable display priority determination method determines the display priority of each explanatory variable used in the estimation of the value by the estimation formula based on the coefficient of each explanatory variable in the estimation formula, A change in the estimated value and a change in the value of the explanatory variable are displayed along a predetermined axis.
  • the explanatory variable display priority determination program causes the computer to display the display priority of each explanatory variable used in the estimation of the value by the estimation formula by the estimated amount of error between the estimated value by the estimation formula and the actual measurement value.
  • a display priority determination process that is determined based on a certain residual and a display process that displays explanatory variables according to the display priority are executed. Based on the influence of the explanatory variable on the residual in the display priority determination process The display priority order of the explanatory variables is determined.
  • the explanatory variable display priority determination program displays to the computer the display priority of each explanatory variable used in the estimation of the value by the estimation formula based on the coefficient of each explanatory variable in the estimation formula. It is characterized by executing a priority order determination process and a display process for displaying a change in an estimated value by an estimation formula and a change in the value of an explanatory variable along a predetermined axis.
  • the estimation formula is represented by, for example, the following formula (1).
  • Y is an estimated value.
  • the object estimated by Expression (1) for example, traffic volume and the like can be mentioned, but the object to be estimated is not particularly limited.
  • explanatory variables are represented as x 1 , x 2 ,..., X n .
  • the number of explanatory variables represented in Formula (1) is not particularly limited.
  • the estimated value y is obtained using equation (1).
  • Continuous variables take numerical values.
  • the continuous variable for example, air temperature or the like can be cited.
  • Categorical variables take items as values. Examples of categorical variables include “gender”. Taking “gender” as an example, the possible values of “sex” as a categorical variable are “male” and “female”. Other examples of categorical variables include days of the week. Taking “day of the week” as an example, possible values of “day of the week” as a categorical variable are, for example, “Sunday”, “Monday”,..., “Saturday”.
  • One continuous variable corresponds to one of the explanatory variables in the estimation formula (in other words, the explanatory variables included in the estimation formula) x 1 , x 2 ,..., X n . Then, when the value (numerical value) of the explanatory variable corresponding to the continuous variable is given, the value is assigned to the corresponding explanatory variable in the estimation formula.
  • Each value of one categorical variable corresponds to one of explanatory variables x 1 , x 2 ,..., X n in the estimation formula.
  • the possible values of “day of the week” which is a categorical variable are the explanatory variables x 1 , x 2 ,..., X n in the estimation formula, respectively.
  • each explanatory variable in the estimation formula corresponding to each value of the categorical variable has two values (for example, 0 and 1). Either value is assigned.
  • the value of the continuous variable is input to the explanatory variable in the estimation equation corresponding to the continuous variable, and one of the binary values is input to each explanatory variable in the estimation equation corresponding to each value of the categorical variable.
  • an estimated value y is obtained.
  • each value of one categorical variable corresponds to one of the explanatory variables x 1 , x 2 ,..., X n in the estimation formula. Therefore, it can be said that one categorical variable corresponds to a plurality of explanatory variables in the estimation formula.
  • the present invention determines the display priority of explanatory variables (various continuous variables and various categorical variables) given to calculate the estimated value y.
  • FIG. FIG. 1 is a block diagram illustrating a configuration example of an explanatory variable display priority determination system according to the first embodiment of this invention.
  • the explanatory variable display priority determination system 1 of the first embodiment includes an estimation unit 2, a display priority determination unit 3, and a display unit 4.
  • the explanatory variable display priority determination system 1 receives various explanatory variable values corresponding to continuous variables and categorical variables via an input device (not shown in FIG. 1).
  • the estimation means 2 calculates an estimated value using an estimation formula expressed in a predetermined formula (1).
  • the estimation formula used by the estimation means 2 is determined in advance using learning data.
  • the estimation unit 2 substitutes the value of the input explanatory variable corresponding to the continuous variable into the explanatory variable in the estimation formula corresponding to the continuous variable. Further, the estimating means 2 substitutes 1 for an explanatory variable in the estimation expression corresponding to the value of the explanatory variable corresponding to the input categorical variable, and in the estimation expression corresponding to each other value of the categorical variable. Substitute 0 for each explanatory variable. And the estimation means 2 calculates the estimated value y by calculating an estimation formula.
  • each explanatory variable is input to the explanatory variable display priority determination system 1, and the estimation means 2 calculates the estimated value y based on the value of each explanatory variable and the estimation formula.
  • the value of each explanatory variable is associated with time information, for example. In this case, the estimation means 2 calculates the estimated value y at each time point based on the value of each explanatory variable at each time point and the estimation formula.
  • FIG. 2 is a diagram showing an example of explanatory variables input to the explanatory variable display priority order determination system 1.
  • “date” and “time” correspond to time information.
  • the explanatory variables “day of the week”, “temperature”, “time division”, and “humidity” are associated with this time information.
  • “Day of the week” and “Time division” are categorical variables.
  • the possible values of “time division” are “within business hours” and “out of business hours”.
  • “Air temperature” and “humidity” are continuous variables.
  • the estimation unit 2 may calculate the estimated value y for each row illustrated in FIG.
  • the estimation unit 2 sends the calculated estimated value y to the display unit 4.
  • the estimating unit 2 associates the calculated estimated value y with the time information corresponding to the estimated value y, and sends it to the display unit 4.
  • FIG. 3 is a diagram showing an example of the calculated estimated value y.
  • the power consumption is illustrated as the estimated value y.
  • this estimated value (power consumption amount) is a value obtained by the value of each explanatory variable shown in FIG. 2 and the estimation formula.
  • “Date” and “Time” shown in FIG. 3 are the same as “Date” and “Time” shown in FIG. 2, and “Date” and “Time” correspond to time information in FIG.
  • the estimation unit 2 may send the estimated value y and the time information to the display unit 4 in association with each row illustrated in FIG.
  • the display priority determining means 3 determines the display priority of each explanatory variable when displaying the change in the value of the explanatory variable input to the explanatory variable display priority determining system 1.
  • the “change in the value of the explanatory variable” is, for example, a change in the value of the explanatory variable along the time axis.
  • the display priority order determining means 3 is a coefficient (more specifically, a coefficient of each of the explanatory variables x 1 , x 2 ,..., X n in the estimation formula used by the estimating means 2 to calculate the estimated value y.
  • the display priority order is determined based on the absolute value.
  • the display priority determining means 3 increases the display priority of the explanatory variable as the absolute value of the coefficient of the explanatory variable in the estimation equation corresponding to the explanatory variable to which the value is input is increased, and the smaller the absolute value of the coefficient is as the absolute value of the coefficient is. Decrease the display priority of explanatory variables.
  • explanatory variables to which values are input are continuous variables (for example, temperature, humidity, etc.), and individual explanatory variables x 1 , x 2 ,..., X n in the estimation formula. Also correspond to continuous variables.
  • the display priority determining means 3 compares the absolute values of the coefficients of the explanatory variables in the estimation formula corresponding to the continuous variables, and displays the priority of the continuous variables in descending order of the absolute values of the coefficients. What is necessary is just to determine a ranking.
  • the explanatory variable having the larger absolute value of the coefficient has a larger influence on the estimated value y.
  • the explanatory variable corresponding to x 1 is estimated more than the explanatory variable corresponding to x 2
  • the influence on y is great. Therefore, by determining the display priority of each continuous variable in descending order of the absolute value of the coefficient, it is possible to preferentially display the change in the value of the explanatory variable that has a large influence on the estimated value y.
  • the explanation variables used for calculating the estimated value y are all assumed to be continuous variables.
  • the explanatory variables used for calculating the estimated value y are not limited to continuous variables, but may include categorical variables.
  • the value of the categorical variable is also input to the explanatory variable display priority determination system 1.
  • the estimation formula includes explanatory variables corresponding to each value (each item) of the categorical variable.
  • the display priority determining means 3 determines the display priority of each explanatory variable as follows.
  • the display priority order determination means 3 calculates the sum of the absolute values of the coefficients of each explanatory variable in the estimation formula corresponding to each value of the categorical variable for each categorical variable. In this case, one value is calculated for each categorical variable. Then, the display priority determining means 3 determines the category based on the sum of the absolute values of the coefficients calculated for each categorical variable and the absolute value of the coefficient of each explanatory variable in the estimation formula corresponding to each continuous variable. The display priority of each explanatory variable that is a type variable and each explanatory variable that is a continuous type variable is determined.
  • the display priority determination means 3 selects the category in descending order of the value calculated for each categorical variable (sum of the absolute values of the coefficients) and the absolute value of the coefficient in the estimation formula corresponding to each continuous variable. The display priority of each explanatory variable that is a type variable and each explanatory variable that is a continuous type variable is determined.
  • the display priority order determination means 3 sends the display priority order of each explanatory variable thus determined to the display means 4.
  • the display unit 4 displays the change in the estimated value calculated by the estimation unit 2 and also displays the change in the value of the explanatory variable according to the display priority determined by the display priority determination unit 3.
  • FIG. 4 is a schematic diagram showing a display example by the display means 4.
  • the display unit 4 displays, for example, a change in the estimated value y in the estimated value display area 11 defined at the upper part of the screen (see FIG. 4).
  • the change in the estimated value y is displayed along the axis between axes (horizontal axis).
  • the display means 4 displays the change of the value of various explanatory variables according to a display priority order below the estimated value display area 11 (refer FIG. 4).
  • FIG. 4 is a schematic diagram showing a display example by the display means 4.
  • the display unit 4 displays, for example, a change in the estimated value y in the estimated value display area 11 defined at the upper part of the screen (see FIG. 4).
  • the change in the estimated value y is displayed along the axis between axes
  • the change in the value of the explanatory variable is displayed along the time axis.
  • the time axis in the estimated value display area 11 and the time axis for displaying the change in the value of the explanatory variable are aligned with each other.
  • the change in the estimated value y and the explanatory variable It is preferable to display the change in value along a common time axis. By displaying in this way, the analyst can intuitively understand how the estimated value y and the value of the explanatory variable correlate along the time axis.
  • the values shown in parentheses indicate the display priority.
  • the display means 4 changes the value of the explanatory variable “temperature”, the value of the explanatory variable “time division”, the value of the explanatory variable “day of the week” from the side closer to the estimated value display area 11 in the order of display priority. Changes in values and changes in the value of the explanatory variable “humidity” are displayed.
  • the display unit 4 may display changes in the values of all explanatory variables in the order of display priority. Alternatively, the display unit 4 may display the change in the value of the explanatory variable up to the upper predetermined number in the display priority order.
  • FIG. 4 illustrates the case where the display unit 4 represents the change in the value of the explanatory variable in a heat map format (a format for displaying a color or a pattern according to the value).
  • the display mode of the change is not particularly limited.
  • the display unit 4 may display a change in the value of the explanatory variable in a line graph or the like.
  • the display means 4 may switch the display mode of the change of the value of each explanatory variable according to the operation of the analyst.
  • the estimated value y and the value of the explanatory variable are displayed along the time axis (horizontal axis), but the horizontal axis is not limited to the time axis. As long as the information corresponding to the horizontal axis is associated with the value of the explanatory variable, the information corresponding to the horizontal axis is not limited to time information, and may be arbitrary information.
  • the estimation unit 2, the display priority order determination unit 3, and the display unit 4 are realized by, for example, a CPU of a computer that performs an input device and a display device.
  • the CPU reads the explanatory variable display priority determination program from a program recording medium such as a computer program storage device (not shown in FIG. 1), and in accordance with the explanatory variable display priority determination program, What is necessary is just to operate
  • the display means 4 a portion for causing the display device to execute display is realized by the CPU.
  • Each means may be realized by separate hardware.
  • the explanatory variable display priority determination system 1 may have a configuration in which two or more physically separated devices are connected by wire or wirelessly. This also applies to embodiments described later.
  • FIG. 5 is a flowchart illustrating an example of processing progress of the first embodiment.
  • the display priority determining means 3 determines the display priority of each explanatory variable to which a value is input based on the coefficient of each explanatory variable in the estimation formula used by the estimating means 2 for calculating the estimated value (step S1).
  • step S1 The process of step S1 will be specifically described.
  • the estimation formula used by the estimation means 2 is the estimation formula shown in FIG.
  • the explanatory variables x 1 to x 7 in the estimation formula are the values of the explanatory variable “day of the week” (“Sunday”, “Monday”,... ]).
  • the explanatory variable x 8 in estimation formula corresponds to the explanatory variable "temperature” is a continuous variable.
  • the explanatory variables x 9 and x 10 in the estimation formula correspond to the values of the explanatory variable “time segment” (“within business hours” and “out of business hours”), which are categorical variables, respectively.
  • the explanatory variable x 11 in estimation formula corresponds to a continuous variable explanatory variables "humidity".
  • the estimation formula shown in FIG. 6 is schematically shown for simplicity of explanation, and the number of x n in the estimation formula and what kind of explanatory variable the x n in the estimation formula corresponds to. It is not limited to the example shown in FIG.
  • the explanatory variable display priority determination system 1 includes, for example, a value of “day of the week”, a value of “temperature”, a value of “time segment”, “ A set of values of “humidity” is input.
  • the display priority order determination means 3 calculates the sum of the absolute values of the coefficients of each explanatory variable in the estimation formula corresponding to each value of the categorical variable for each categorical variable.
  • the display priority determining means 3 calculates the sum of absolute values of the coefficients x 1 to x 7 corresponding to the values of “day of the week” for the categorical variable “day of the week”. That is, the display priority determination means 3 calculates
  • the display priority determination means 3 calculates the sum of absolute values of the respective coefficients of x 9 and x 10 corresponding to the respective values of the “time segment” with respect to the categorical variable “time segment”. That is, the display priority order determination unit 3 calculates
  • the display priority determining means 3 calculates the absolute value of the coefficient of each explanatory variable in the estimation formula corresponding to the values a 1to7 and a 9to10 calculated for each categorical variable and the continuous variables “temperature” and “humidity”. Based on the above, the display priorities of the explanatory variables “day of the week” and “time division” which are categorical variables and the explanatory variables “temperature” and “humidity” which are continuous variables are determined.
  • the absolute value of the coefficient of the explanatory variable x 8 in the estimation equation corresponding to “temperature” is
  • the absolute value of the coefficient of the explanatory variable x 11 in the estimation equation corresponding to “humidity” is
  • the display priority determination means 3 determines the display priority of “day of the week”, “time division”, “temperature”, and “humidity” in descending order of a 1to7 , a 9to10 ,
  • the estimating means 2 calculates the estimated value y from the value of each explanatory variable and the estimation formula (step S2). S3). For example, “Sunday”, “25 ° C.”, “Outside business hours”, and “60%” are input as values of each explanatory variable “day of the week”, “temperature”, “time category”, and “humidity” at a certain time.
  • the estimated value y at the time is calculated.
  • the estimation means 2 calculates the estimated values at other time points in the same manner.
  • the estimation unit 2 associates the calculated estimated value y with the time information corresponding to the estimated value y and sends it to the display unit 4.
  • the display unit 4 displays the change in the estimated value y, and displays the change in the value of the explanatory variable according to the display priority determined in step S ⁇ b> 1 (step). S4).
  • the display priorities of “temperature”, “time category”, “day of the week”, and “humidity” are 1st, 2nd, 3rd, and 4th respectively
  • the display means 4 estimates From the side close to the value display area 11 (see FIG. 4), a change in temperature, a change in time division, a change in day of the week, and a change in humidity may be displayed.
  • the display means 4 may display the change in the value of the explanatory variable up to the upper predetermined number (for example, the upper third) of the display priority. For example, the top number of explanatory variable values to be displayed may be determined in advance.
  • the present embodiment as described above, it is possible to set the display priority for the explanatory variable given for calculating the estimated value and display the change in the value of the explanatory variable. As a result, a change in the value of the explanatory variable that has a large influence on the estimated value y can be preferentially displayed.
  • the display unit 4 displays the change in the estimated value along a predetermined axis (typically, the time axis), and further, the change in the value of the explanatory variable is also the common time axis. Display along. In other words, the display unit 4 displays the change in the estimated value and the change in the value of the explanatory variable along the same axis. This makes it easy for the analyst to intuitively understand how the change in the estimated value and the change in the explanatory variable are linked along the predetermined axis.
  • a predetermined axis typically, the time axis
  • the change in the value of the explanatory variable is also the common time axis. Display along.
  • the display unit 4 displays the change in the estimated value and the change in the value of the explanatory variable along the same axis. This makes it easy for the analyst to intuitively understand how the change in the estimated value and the change in the explanatory variable are linked along the predetermined axis.
  • the target displayed according to the display priority order is not limited to the change in the value of the explanatory variable.
  • the display unit 4 may display the names of the explanatory variables according to the display priority when displaying the names of the explanatory variables side by side. This also applies to the embodiments described later.
  • the estimation unit 2 uses one estimation formula.
  • two or more estimation formulas used by the estimation unit 2 may exist.
  • the estimation unit 2 may select one estimation formula from a plurality of estimation formulas, and calculate an estimated value using the selected estimation formula.
  • the operation in this case will be described as a modification of the first embodiment. Note that description of operations similar to those already described is omitted.
  • the configuration of the explanatory variable display priority determination system in this modification is the same as the configuration shown in FIG. However, operations of the estimation unit 2 and the display priority order determination unit 3 are partially different. The operation of the display priority determining means 3 will be described later.
  • the estimation means 2 stores a model for selecting an estimation formula.
  • This model is a model in which one estimation formula can be determined according to the value of each explanatory variable at each time point.
  • FIG. 7 is a schematic diagram illustrating an example of a model for selecting an estimation formula.
  • the estimation means 2 selects an estimation formula from the model schematically shown in FIG. 7 according to the value of each explanatory variable at a certain point in time, and calculates an estimated value based on the value of each explanatory variable at that point and the selected estimation formula To do.
  • the operation for calculating the estimated value y using the estimation formula is the same as the operation in the first embodiment described above.
  • a plurality of estimation formulas and a model for selecting the estimation formulas are determined in advance using learning data.
  • FIG. 7 shows a tree structure model
  • the model may have a common leaf and a plurality of tree structures with different roots.
  • step S1 the display priority determining means 3 determines the display priority of each explanatory variable to which a value is input based on the coefficient of each explanatory variable in a plurality of estimation formulas used by the estimating means 2 for calculating the estimated value. To decide.
  • the two estimation expressions include explanatory variables x 1 to x 11 , respectively.
  • the explanatory variables x 1 to x 7 in each estimation formula shown in FIG. 8 correspond to the respective values of the explanatory variable “day of the week” that is a categorical variable.
  • the explanatory variable x 8 in each estimation formula corresponds to the explanatory variable "temperature" is a continuous variable.
  • explanatory variables x 9 and x 10 in each estimation formula correspond to the respective values of the explanatory variable “time segment” which is a categorical variable.
  • explanatory variable x 11 in each estimation formula corresponds to a continuous variable explanatory variables "humidity".
  • the two estimation formulas shown in FIG. 8 are schematically shown for simplicity of explanation, and the number of x n in the estimation formula and what kind of explanatory variable the x n in the estimation formula corresponds to. It is not limited to the example shown in FIG.
  • the display priority order determination unit 3 calculates, for each categorical variable, the sum of the absolute values of the coefficients of each explanatory variable in all the estimation equations corresponding to each value of the categorical variable.
  • the display priority determining means 3 relates to the categorical variable “day of the week”, the absolute value of each coefficient of x 1 to x 7 corresponding to each value of “day of the week” in the first estimation formula, And the sum of the absolute values of the coefficients x 1 to x 7 corresponding to the values of “day of the week” is calculated by the second equation.
  • the display priority order determination means 3 uses
  • the display priority determining means 3 relates to the absolute value of each coefficient of x 9 and x 10 corresponding to each value of the “time segment” in the first estimation formula for the categorical variable “time segment”, and 2
  • the sum of absolute values of the respective coefficients of x 9 and x 10 corresponding to the respective values of the “time segment” is calculated by the second equation. That is, the display priority order determination unit 3 calculates
  • the display priority order determination unit 3 calculates, for each continuous variable, the sum of the absolute values of the coefficients of the explanatory variables in all the estimation equations corresponding to the continuous variable.
  • the display priority determining means 3 with respect continuous variables "Temperature”, the absolute value of the coefficient of x 8 corresponding to "temperature” in the first estimation formula, and in the second estimation equation to calculate the sum of the absolute values of the coefficient of x 8 that corresponds to the "temperature”. That is, the display priority determination means 3 calculates
  • the display priority determining means 3 with respect continuous variables "humidity", the absolute value of the coefficient of x 11, corresponding to the "humidity” in the first estimation formula, and the "humidity” second estimated equation Calculate the sum of the absolute values of the corresponding x 11 coefficients. That is, the display priority order determination unit 3 calculates
  • the display priority determining means 3 then calculates the sum of the absolute values of the coefficients calculated for each categorical variable (A 1 , A 2 in this example) and the sum of the absolute values of the coefficients calculated for each continuous variable ( In this example, the display priority of each explanatory variable that is a categorical variable and each explanatory variable that is a continuous variable is determined based on A 3 , A 4 ). In this example, the display priority determination means 3 determines the display priority of “day of the week”, “time division”, “temperature”, and “humidity” in descending order of A 1 , A 2 , A 3 , A 4. .
  • the display priority determining means 3 sets the display priority to 1 in the order of “temperature”, “time category”, “day of the week”, “humidity”. First place, second place, third place, fourth place.
  • the estimation unit 2 uses the value of each explanatory variable and the above-described model (model for selecting an estimation formula). Then, an estimation formula is selected, and an estimated value is calculated from the value of each explanatory variable and the selected estimation formula (step S3).
  • Step S4 is the same as step S4 already described, and the description is omitted.
  • step S1 is not limited to the above example.
  • the explanatory variable display priority determination system 1 may execute step S1 after step S3.
  • FIG. FIG. 9 is a block diagram illustrating a configuration example of the explanatory variable display priority determination system according to the second embodiment of this invention.
  • the explanatory variable display priority determination system 1 according to the second embodiment includes an estimation unit 12, a display priority determination unit 13, and a display unit 4.
  • the display unit 4 is the same as the display unit 4 in the first embodiment, and a description thereof will be omitted.
  • the value of each explanatory variable is input via an input device (not shown in FIG. 9), as in the first embodiment.
  • the actual measurement value of the estimation target corresponding to the set of explanatory variables is also input to the explanatory variable display priority determination system 1 via the input device.
  • the explanatory variable display priority order determination system 1 of the present embodiment calculates an estimated value based on the value of each explanatory variable at each time point for which an actual measurement value has already been obtained, and the estimated value and the actual measurement value at each time point. Find the error with.
  • the explanatory variable display priority determination system 1 derives an estimation formula (hereinafter referred to as a residual estimation formula) for obtaining a residual that is an estimated value of the error, and each explanation in the residual estimation formula. Based on the coefficient of the variable, the display priority order of each explanatory variable to which the value is input is determined.
  • a residual estimation formula an estimation formula for obtaining a residual that is an estimated value of the error
  • each explanatory variable input to the explanatory variable display priority determination system 1 is associated with time information as illustrated in FIG.
  • the actual measurement value input to the explanatory variable display priority determination system 1 is also associated with the time information.
  • the estimating means 12 uses the estimated expression expressed in the form of the predetermined formula (1) and the value of each explanatory variable at each time point.
  • the estimated value y is calculated. Since the operation of calculating the estimated value y using the estimation formula has been described in the first embodiment, description thereof is omitted here.
  • the estimating means 12 selects one estimation formula from a plurality of estimation formulas, as in the modification of the first embodiment, and the estimation formula The estimated value y may be calculated using
  • the estimation unit 12 sends the calculated estimated value y at each time point to the display priority order determination unit 13 and the display unit 4.
  • the display priority order determination means 13 calculates an error between the estimated value y calculated by the estimation means 12 and the actual measurement value input to the explanatory variable display priority determination system 1 for each time point. That is, assuming that the actual measurement value is Y and the error between the estimated value y and the actual measurement value Y is Z, the display priority determining means 13 calculates the error Z by calculation of the following equation (2) at each time point. calculate.
  • the display priority order determination means 13 derives an estimation formula (residual estimation formula) for calculating a residual that is an estimated value of the error after calculating the error Z at each time point.
  • the residual is represented by the symbol z.
  • the display priority determination means 13 derives a residual estimation formula including each explanatory variable x 1 , x 2 ,..., X n in the estimation formula shown in Formula (1).
  • the display priority determination means 13 may derive a residual estimation formula by performing regression analysis using the value of each explanatory variable and the error Z at each time point, for example.
  • the error estimation formula is expressed as the following formula (3).
  • d is a constant term
  • c 1 to c n are coefficients of x 1 to x n , respectively.
  • the display priority order determination means 13 receives each value that is input based on the coefficient (more specifically, the absolute value of the coefficient) of each explanatory variable in the residual estimation expression expressed as Expression (3). Determine the display priority of explanatory variables.
  • the display priority determining means 13 determines the display priority based on the coefficient of each explanatory variable in the residual estimation formula.
  • the display priority determining means 3 is as shown in Expression (1). This is the same as the operation of determining the display priority based on the coefficient of each explanatory variable in the estimated expression. That is, the display priority order determination unit 13 calculates, for each categorical variable, the sum of the absolute values of the coefficients of each explanatory variable in the residual estimation formula corresponding to each value of the categorical variable.
  • the display priority order determination means 13 is based on the sum of the absolute values of the coefficients calculated for each categorical variable and the absolute values of the coefficients of each explanatory variable in the residual estimation formula corresponding to each continuous variable.
  • the display priority of each explanatory variable that is a categorical variable and each explanatory variable that is a continuous variable is determined.
  • the display priority order determining means 13 is arranged in descending order of the value calculated for each categorical variable (sum of absolute values of coefficients) and the absolute value of coefficients in the residual estimation formula corresponding to each continuous variable.
  • the display priority of each explanatory variable that is a categorical variable and each explanatory variable that is a continuous variable is determined.
  • the display priority order determination means 13 sends the display priority order of each explanatory variable thus determined to the display means 4.
  • the estimation unit 12, the display priority order determination unit 13, and the display unit 4 are realized by, for example, a CPU of a computer that performs an input device and a display device.
  • the CPU reads the explanatory variable display priority determination program from a program recording medium such as a computer program storage device (not shown in FIG. 9), for example, and according to the explanatory variable display priority determination program, the estimation means 12, What is necessary is just to operate
  • a program recording medium such as a computer program storage device (not shown in FIG. 9)
  • FIG. 10 is a flowchart illustrating an example of processing progress of the second embodiment.
  • the estimating means 12 calculates the value of each explanatory variable at each time point.
  • the estimated value y at each time point is calculated using the estimation formula (step S12).
  • the display priority order determination means 13 calculates the error Z between the estimated value y calculated by the estimation means 12 and the actual measurement value Y input in step S11 for each time point. Calculated by (2). Then, the display priority determination means 13 uses the error Z at each time point and the value of each explanatory variable at each time point input in step S11, for example, in the form of equation (3) by regression analysis. An error estimation expression is derived (step S13).
  • the display priority determining means 13 determines the display priority of each explanatory variable to which a value is input based on the coefficient of each explanatory variable in the residual estimation formula (step S14). As described above, the operation in which the display priority determining unit 13 determines the display priority based on the coefficient of each explanatory variable in the residual estimation formula is performed by the display priority determining unit 3 in the first embodiment. This is the same as the operation for determining the display priority based on the coefficient of each explanatory variable in the estimation formula expressed as 1).
  • step 14 The process of step 14 will be specifically described. Assume that the residual derivation formula derived in step S13 is the formula shown in FIG. As in the case shown in FIG. 6, the explanatory variables x 1 to x 7 in the residual estimation formula shown in FIG. 11 correspond to the respective values of the explanatory variable “day of the week” that is a categorical variable. The explanatory variable x 8 in the residual estimation formula corresponds to the explanatory variable “temperature” which is a continuous variable. Further, the explanatory variables x 9 and x 10 in the residual estimation formula correspond to the respective values of the explanatory variable “time segment” which is a categorical variable.
  • the explanatory variable x 11 residual in estimation formula corresponds to a continuous variable explanatory variables "humidity".
  • the residual estimation formula shown in FIG. 11 is schematically shown for the sake of simplicity. What is the number of x n in the residual estimation formula and what is x n in the residual estimation formula? Whether it corresponds to the explanatory variable is not limited to the example shown in FIG.
  • the display priority determination means 13 calculates the sum of the absolute values of the coefficients of each explanatory variable in the residual estimation formula corresponding to each value of the categorical variable for each categorical variable.
  • the display priority determining means 13 calculates the sum of absolute values of the coefficients x 1 to x 7 corresponding to the values of “day of the week” for the categorical variable “day of the week”. That is, the display priority order determination unit 13 calculates
  • the display priority determination means 13 calculates the sum of absolute values of the respective coefficients of x 9 and x 10 corresponding to the respective values of the “time segment” with respect to the categorical variable “time segment”. That is, the display priority order determination means 13 calculates
  • the display priority determining means 13 calculates the coefficients c1to7 and c9to10 calculated for each categorical variable and the coefficients of the explanatory variables in the residual estimation formula corresponding to the continuous variables “temperature” and “humidity”. Based on the absolute value, the display priorities of the explanatory variables “day of the week” and “time division” which are categorical variables and the explanatory variables “temperature” and “humidity” which are continuous variables are determined.
  • the absolute value of the coefficient of the explanatory variable x 8 in the residual estimation formula corresponding to “temperature” is
  • the absolute value of the coefficient of the explanatory variable x 11 in the residual estimation formula corresponding to “humidity” is
  • the display priority determining means 13 determines the display priority of “day of the week”, “time division”, “temperature”, and “humidity” in descending order of c 1to7 , c 9to10 ,
  • Step S15 is the same as step S4 in the first embodiment.
  • the display unit 4 displays a change in the estimated value y and a change in the value of each explanatory variable along a common time axis.
  • the display unit 4 may display the change in the actual measurement value Y together with the change in the estimation value y in the estimated value display area 11.
  • the display priority determining means 13 determines the display priority based on the absolute value of the coefficient of the explanatory variable in the residual estimation formula. Accordingly, it is possible to preferentially display the change in the value of the explanatory variable that has a high degree of causing the error.
  • the effect of this embodiment will be specifically described.
  • the analyst can grasp whether the explanatory variable greatly affects the residual by looking at the order in which the explanatory variable is displayed. Thereby, the analyst can obtain hints for explanatory variables that must be newly added to the estimation, for example.
  • the display unit 4 displays the explanatory variables in the order of “day of the week”, “time division”, “temperature”, and “humidity”.
  • the analyst who has seen this display result further analyzes the error for each day of the week in detail.
  • the error on Friday is larger than the error on other days of the week.
  • the analyst can notice the existence of an explanatory variable that greatly affects the residual, the analyst can use this as a trigger to notice the existence of a new explanatory variable that has not been noticed until now.
  • the analyst checks, for example, in detail the change in the temperature value.
  • the explanatory variable “temperature” includes a lot of noise.
  • the analyst can come up with performing a data cleansing process on the explanatory variable “temperature”.
  • the explanatory variable “time division” has a great influence on the residual.
  • the only possible values for the explanatory variable “time division” are “non-business hours” and “within business hours”.
  • the analyst can imagine that it is better to subdivide the possible values of the explanatory variable “time segment”. For example, the analyst can imagine subdividing the possible values of the explanatory variable “time division” into “outside business hours”, “in the morning business hours”, “in the afternoon business hours”, and the like.
  • the explanatory variable “age (10-year unit)” greatly affects the residual, the explanatory variable is more detailed “age (1 year unit)”. It can be conceived that it is better to treat as.
  • explanatory variables In data mining, it is not uncommon for the types of explanatory variables to be analyzed to be hundreds or thousands. In such a case, it is not easy for the analyst to conduct a detailed examination on all of the explanatory variables. By prioritizing the explanatory variables in the order in which they greatly affect the residual as in the present embodiment, the analyst can select the explanatory variables to be watched more from among the large number of explanatory variables. This increases the efficiency of data analysis work.
  • the display priority order determination means 13 may use another formula instead of the residual estimation formula.
  • the display priority determination means 13 may derive an estimation formula for the absolute value of the error and determine the display priority of each explanatory variable using the estimation formula.
  • the display priority determining means 13 derives an expression for discriminating and analyzing whether or not the absolute value of the error is a certain value or more, and using the expression, the display priority of each explanatory variable is determined. May be determined.
  • the algorithm that creates the residual estimation formula and the various formulas exemplified above do not necessarily match the algorithm that creates the objective variable estimation formula.
  • discriminant analysis of “whether an error of 10 or more occurs” may be performed using a decision tree.
  • the display unit 4 may display a change in the estimated value and a change in the explanatory variable over time. Further, the value of each explanatory variable and the actual measurement value of the estimation target may be input in association with information other than time information, and the display unit 4 may change the estimated value or change of the explanatory variable in an order other than time. May be displayed.
  • the explanatory variable display priority determination system 1 of the present invention may be implemented in an estimation device that performs estimation using an estimation formula obtained by learning.
  • the explanatory variable display priority determination system 1 of this invention may be mounted in the learning apparatus which learns estimation formulas.
  • the learning device may also have an estimation function based on the estimation formula for the purpose of checking the learned estimation formula.
  • the explanatory variable display priority determination system 1 may be mounted on such a learning device.
  • FIG. 12 is a schematic block diagram showing a configuration example of a computer according to each embodiment of the present invention.
  • the computer 1000 includes a CPU 1001, a main storage device 1002, an auxiliary storage device 1003, an interface 1004, a display device 1005, and an input device 1006.
  • the explanatory variable display priority determination system 1 of each embodiment is implemented in a computer 1000.
  • the operation of the explanatory variable display priority determination system 1 is stored in the auxiliary storage device 1003 in the form of a program (explanatory variable display priority determination program).
  • the CPU 1001 reads out the program from the auxiliary storage device 1003, develops it in the main storage device 1002, and executes the above processing according to the program.
  • the auxiliary storage device 1003 is an example of a tangible medium that is not temporary.
  • Other examples of the non-temporary tangible medium include a magnetic disk, a magneto-optical disk, a CD-ROM, a DVD-ROM, and a semiconductor memory connected via the interface 1004.
  • this program is distributed to the computer 1000 via a communication line, the computer 1000 that has received the distribution may develop the program in the main storage device 1002 and execute the above processing.
  • the program may be for realizing a part of the above-described processing.
  • the program may be a differential program that realizes the above-described processing in combination with another program already stored in the auxiliary storage device 1003.
  • FIG. 13 is a block diagram showing an example of the minimum configuration of the present invention.
  • the explanatory variable display priority determination system of the present invention includes a display priority determination means 73 and a display means 74.
  • the display priority order determining means 73 determines the display priority order of each explanatory variable used in the estimation of the value by the estimation formula, the estimated value by the estimation formula and the actual measurement value. Is determined based on the residual, which is an estimated amount of error. More specifically, the display priority order determination unit 73 determines the display priority order of the explanatory variables based on the magnitude of the influence of the explanatory variables on the residual.
  • Display means 74 (for example, display means 4 of the second embodiment) displays the explanatory variables according to the display priority order.
  • the effect of the present invention can be obtained by such a configuration.
  • the display priority order determining unit 73 and the display unit 74 may operate as follows.
  • the display priority order determining means 73 (for example, the display priority order determining means 3 of the first embodiment) sets the display priority order of each explanatory variable used in the estimation of the value by the estimation formula for each explanatory variable in the estimation formula. Determine based on the coefficient.
  • the display unit 74 (for example, the display unit 4 of the first embodiment) displays the change in the estimated value based on the estimation formula and the change in the value of the explanatory variable along a predetermined axis.
  • Display priority determination for determining the display priority of each explanatory variable used in the estimation of the value by the estimation formula based on the residual that is the estimated amount of error between the estimated value by the estimation formula and the actual measurement value Means for displaying the explanatory variable according to the display priority, and the display priority determining means sets the display priority of the explanatory variable based on the magnitude of the influence of the explanatory variable on the residual.
  • An explanatory variable display priority determination system characterized by determining.
  • the display priority determining means derives a residual estimation formula for estimating a residual that is an estimated amount of error between the estimated value and the measured value, and each of the residual estimation formulas
  • the said display priority determination means calculates the sum of the absolute value of the coefficient of each explanatory variable in the residual estimation formula corresponding to each value of a categorical variable for every categorical variable, Each explanatory variable and continuous variable that is a categorical variable based on the sum of the absolute values of the coefficients calculated for each and the absolute value of the coefficient of each explanatory variable in the residual estimation formula corresponding to each continuous variable.
  • the explanatory variable display priority determination system according to attachment 2 wherein the display priority order of each explanatory variable is determined.
  • the said display means further displays the change of the estimated value by the said estimation formula with the change of the measured value corresponding to the said estimated value,
  • the said display means displays the change of the estimated value by the said estimation formula, the change of the said actual value, and the change of the value of the said explanatory variable along the predetermined axis,
  • the explanatory variable of Additional remark 4 Display priority determination system.
  • the display priority determining means sets the display priority higher as the explanatory variable having the larger absolute value of the coefficient, and the display means sets the value of the explanatory variable as the explanatory variable having the higher display priority.
  • the said display priority order determination means calculates the sum of the absolute value of the coefficient of each explanatory variable in the estimation formula corresponding to each value of a categorical variable for every categorical variable, Each explanatory variable that is a categorical variable and each explanation that is a continuous variable based on the sum of the absolute values of the calculated coefficients and the absolute value of the coefficient of each explanatory variable in the estimation formula corresponding to each continuous variable.
  • the explanatory variable display priority determination system according to appendix 6 or appendix 7, wherein the display priority order of variables is determined.
  • the display priority order determining unit performs all estimations corresponding to each value of the categorical variable for each categorical variable. Calculate the sum of the absolute values of the coefficients of each explanatory variable in the equation, and for each continuous variable, calculate the sum of the absolute values of the coefficients of each explanatory variable in all the estimation equations corresponding to the continuous variable, Based on the sum of absolute values of coefficients calculated for each categorical variable and the sum of absolute values of coefficients calculated for each continuous variable, each explanatory variable that is a categorical variable and each explanatory variable that is a continuous variable 8.
  • the explanatory variable display priority determination system according to appendix 6 or appendix 7, wherein the display priority order is determined.
  • the display priority of each explanatory variable used in the estimation of the value by the estimation formula is determined based on the residual that is the estimated amount of error between the estimated value by the estimation formula and the actual measurement value, and the display priority
  • the explanatory variable is displayed according to the ranking, and the display priority of the explanatory variable is determined based on the magnitude of the influence of the explanatory variable on the residual when the display priority is determined. Prioritization method.
  • each explanatory variable used by the estimation of the value by an estimation formula is determined based on the coefficient of each explanatory variable in the said estimation formula, the change of the estimated value by the said estimation formula, and the said description
  • An explanatory variable display priority determination method characterized by displaying changes in variable values along a predetermined axis.
  • the display which determines the display priority of each explanatory variable used by estimation of the value by an estimation formula on the computer based on the residual which is an estimated amount of the error between the estimated value by the estimation formula and the actual measurement value
  • a priority determination process and a display process for displaying the explanatory variable in accordance with the display priority order, and the display priority determination process, based on the magnitude of the influence of the explanatory variable on the residual,
  • An explanatory variable display priority determination program for determining display priority.
  • the present invention can be suitably applied to an apparatus that presents changes in values of various explanatory variables.

Landscapes

  • Business, Economics & Management (AREA)
  • Engineering & Computer Science (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Development Economics (AREA)
  • Game Theory and Decision Science (AREA)
  • General Physics & Mathematics (AREA)
  • Marketing (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Business, Economics & Management (AREA)
  • Finance (AREA)
  • Accounting & Taxation (AREA)
  • Educational Administration (AREA)
  • Tourism & Hospitality (AREA)
  • Quality & Reliability (AREA)
  • Operations Research (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

 推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数を表示することができる説明変数表示優先順位決定システムを提供する。表示優先順位決定手段73は、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する。このとき、表示優先順位決定手段73は、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定する。表示手段74は、表示優先順位に従って説明変数を表示する。

Description

説明変数表示優先順位決定システム、方法およびプログラム
 本発明は、説明変数を表示する際の優先順位を決定する説明変数表示優先順位決定システム、説明変数表示優先順位決定方法および説明変数表示優先順位決定プログラムに関する。
 種々のビジネスの分野において、入手可能なデータから、将来の推定を行うことは業務改善に有効である。例えば、商店において、直近2週間の売り上げデータから将来の売り上げを推定できれば、在庫管理を適切に行うことができる。
 非特許文献1には、統計専門家等の分析者が行う入手可能なデータの解析を支援するソフトウェアが開示されている。非特許文献1が開示するソフトウェアは、推定機能と、推定結果を可視化する機能とを備える。
 非特許文献2には、複数の予測式の中から予測式を自動的に選択し、その予測式を用いて予測値を算出する場合に、予測値および実績値のグラフとともに、選択した予測式の推移を示すグラフを表示することが記載されている。
 ここで、本明細書では、直近2週間の売り上げデータ等、推定の手がかりとするデータを「説明変数」と呼び、将来の売り上げ等、推定したい変数を「目的変数」と呼ぶことにする。
 また、目的変数と説明変数との間に見出された規則性を表す式を「推定式」と呼ぶことにする。また、推定式を用いて推定された値を「推定値」と呼ぶことにする。
 推定式は、例えば、以下の形式で表される。
 y=a+a+・・・+a+b
 上記の式において、yは推定値である。また、x,x,・・・,xは、説明変数である。bは定数項であり、a,a,・・・,a,bは、予め学習用データを用いて決定されている。説明変数の値が与えられた場合、上記の式を用いて、推定値yを算出することができる。
"SAS Visual Analytics"、SAS Institute Japan株式会社、[2014年10月23日検索]、インターネット<URL:http://www.sas.com/ja_jp/software/business-intelligence/visual-analytics.html> 「一歩進んだ機械学習 IoTで激増するデータの活用現場に浸透」、日経BP社、「日経ビッグデータ」、2014年06号、p.7-12
 分析者にとっては、推定値の変化の表示とともに、与えられた各説明変数(例えば、各説明変数の値の変化)も把握できることが好ましい。しかし、一般に、説明変数の種類は多く、ランダムな順序で全ての説明変数を表示した場合、分析者にとって説明変数と推定値の関連性を把握しづらくなることが生じ得る。
 そこで、本発明は、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数を表示することができる説明変数表示優先順位決定システム、説明変数表示優先順位決定方法および説明変数表示優先順位決定プログラムを提供することを目的とする。
 本発明による説明変数表示優先順位決定システムは、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定手段と、表示優先順位に従って説明変数を表示する表示手段とを備え、表示優先順位決定手段が、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定することを特徴とする。
 また、本発明による説明変数表示優先順位決定システムは、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定する表示優先順位決定手段と、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示する表示手段とを備えることを特徴とする。
 また、本発明による説明変数表示優先順位決定方法は、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定し、表示優先順位に従って説明変数を表示し、表示優先順位を決定する際に、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定することを特徴とする。
 また、本発明による説明変数表示優先順位決定方法は、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定し、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示することを特徴とする。
 また、本発明による説明変数表示優先順位決定プログラムは、コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定処理、および、表示優先順位に従って説明変数を表示する表示処理を実行させ、表示優先順位決定処理で、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定させることを特徴とする。
 また、本発明による説明変数表示優先順位決定プログラムは、コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定する表示優先順位決定処理、および、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示する表示処理を実行させることを特徴とする。
 本発明によれば、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数を表示することができる。
本発明の第1の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。 説明変数表示優先順位決定システムに入力される説明変数の例を示す図である。 算出された推定値yの例を示す図である。 表示手段による表示例を示す模式図である。 第1の実施形態の処理経過の例を示すフローチャートである。 推定手段が用いる推定式の例を示す模式図である。 推定式を選択するためのモデルの一例を示す模式図である。 推定手段が用いる複数の推定式の例を示す模式図である。 本発明の第2の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。 第2の実施形態の処理経過の例を示すフローチャートである。 残差導出式の例を示す模式図である。 本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。 本発明の最小構成の例を示すブロック図である。
 以下、図面を参照して本発明の実施形態を説明する。
 既に説明したように、推定式は、例えば、以下に示す式(1)のように表される。
 y=a+a+・・・+a+b     式(1)
 yは推定値である。式(1)によって推定される対象の例として、例えば、交通量等が挙げられるが、推定される対象は、特に限定されない。
 式(1)内で、説明変数は、x,x,・・・,xと表される。式(1)内に表される説明変数の数は、特に限定されない。
 推定値算出のために説明変数が与えられた場合、式(1)を用いて推定値yが得られる。
 ここで、推定値算出のために与えられる説明変数の種類として、連続型変数とカテゴリ型変数がある。
 連続型変数は値として数値をとる。連続型変数の例として、例えば、気温等が挙げられる。
 カテゴリ型変数は値として項目をとる。カテゴリ型変数の例として、例えば、「性別」が挙げられる。「性別」を例にして説明すると、カテゴリ型変数である「性別」の取り得る値は、「男性」、「女性」である。また、カテゴリ型変数の他の例として、例えば、曜日等が挙げられる。「曜日」を例にして説明すると、カテゴリ型変数である「曜日」の取り得る値は、例えば、「日曜日」、「月曜日」、・・・、「土曜日」である。
 1つの連続型変数は、推定式内の説明変数(換言すれば、推定式に含まれる説明変数)x,x,・・・,xのうちの1つに対応する。そして、連続型変数に該当する説明変数の値(数値)が与えられた場合、その値は、推定式内の対応する説明変数に代入される。
 また、1つのカテゴリ型変数の各値は、推定式内の説明変数x,x,・・・,xのうちの1つに対応する。例えば、カテゴリ型変数である「曜日」の取り得る各値(「日曜日」、「月曜日」等の各項目)は、それぞれ、推定式内の説明変数x,x,・・・,xのうちの1つに対応する。カテゴリ型変数に該当する説明変数の値(項目)が与えられた場合、そのカテゴリ型変数の各値に対応する推定式内の各説明変数には、二値(例えば、0と1)のうちいずれかの値が代入される。より具体的には、カテゴリ型変数に該当する説明変数の値(項目)が与えられた場合、その値に対応する推定式内の説明変数には1が代入され、そのカテゴリ型変数の他の各値に対応する推定式内の各説明変数にはそれぞれ0が代入される。例えば、カテゴリ型変数である「曜日」の値として「月曜日」が与えられた場合、月曜日に対応する推定式内の説明変数には1が代入され、月曜日以外の各曜日に対応する推定式内の各説明変数には、それぞれ0が代入される。以下の説明では、二値として0または1が代入されるものとして説明する。
 このように、連続型変数に対応する推定式内の説明変数にその連続型変数の値が入力され、カテゴリ型変数の各値に対応する推定式内の各説明変数に二値のいずれかが代入されることで、推定値yが得られる。
 なお、上記のように、1つのカテゴリ型変数の各値は、推定式内の説明変数x,x,・・・,xのうちの1つに対応する。従って、1つのカテゴリ型変数と、推定式内の複数の説明変数とが対応しているということができる。
 本発明は、推定値yを算出するために与えられる説明変数(種々の連続型変数や種々のカテゴリ型変数)の表示優先順位を決定する。
実施形態1.
 図1は、本発明の第1の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。第1の実施形態の説明変数表示優先順位決定システム1は、推定手段2と、表示優先順位決定手段3と、表示手段4とを備える。
 説明変数表示優先順位決定システム1には、連続型変数やカテゴリ型変数に該当する種々の説明変数の値が、入力デバイス(図1において図示略)を介して入力される。
 推定手段2は、各説明変数の値が入力されると、予め定められた式(1)の形式で表される推定式を用いて、推定値を算出する。推定手段2が用いる推定式は、予め学習用データを用いて決定されている。
 推定手段2は、入力された連続型変数に該当する説明変数の値を、その連続型変数に対応する推定式内の説明変数に代入する。また、推定手段2は、入力されたカテゴリ型変数に該当する説明変数の値に対応する推定式内の説明変数に1を代入し、そのカテゴリ型変数の他の各値に対応する推定式内の各説明変数にそれぞれ0を代入する。そして、推定手段2は、推定式を計算することによって、推定値yを算出する。
 各説明変数の値は、説明変数表示優先順位決定システム1に入力され、推定手段2は、各説明変数の値と推定式とによって、推定値yを算出する。各説明変数の値は、例えば、時間情報と関連付けされている。この場合には、推定手段2は、個々の時点での各説明変数の値と、推定式とによって、個々の時点における推定値yを算出する。
 図2は、説明変数表示優先順位決定システム1に入力される説明変数の例を示す図である。図2では、「日付」および「時間」が時間情報に該当する。そして、説明変数「曜日」、「気温」、「時間区分」および「湿度」がこの時間情報に関連付けられている。なお、「曜日」および「時間区分」は、カテゴリ型変数である。本例では、「時間区分」の取り得る値は、「営業時間内」と「営業時間外」であるとする。「気温」および「湿度」は、連続型変数である。図2に例示するように時間情報に関連付けられた各説明変数の値が入力された場合、推定手段2は、図2に例示する行毎に、推定値yを算出すればよい。
 推定手段2は、算出した推定値yを表示手段4に送る。各説明変数の値が時間情報と関連付けされている場合、推定手段2は、算出した推定値yと、推定値yに対応する時間情報とを関連付けて、表示手段4に送る。
 図3は、算出された推定値yの例を示す図である。図3では、推定値yとして消費電力量を例示している。また、この推定値(消費電力量)は、図2に示す各説明変数の値と、推定式とによって得られた値である。図3に示す「日付」および「時間」は、図2に示す「日付」および「時間」と同様であり、図3においても、「日付」および「時間」が時間情報に該当する。推定手段2は、図3に例示する行毎に、推定値yと時間情報とを関連付けて表示手段4に送ればよい。
 なお、ここでは、説明を簡単にするため、推定手段2が用いる推定式が1つである場合を例にして説明する。
 表示優先順位決定手段3は、説明変数表示優先順位決定システム1に入力される説明変数の値の変化を表示する際の各説明変数の表示優先順位を決定する。「説明変数の値の変化」とは、例えば、時間軸に沿った説明変数の値の変化である。表示優先順位決定手段3は、推定手段2が推定値yを算出するために用いる推定式内の各説明変数x,x,・・・,xの係数(より具体的には係数の絶対値)に基づいて、表示優先順位を決定する。表示優先順位決定手段3は、値が入力される説明変数に対応する推定式内の説明変数の係数の絶対値が大きいほど、説明変数の表示優先順位を高くし、係数の絶対値が小さいほど、説明変数の表示優先順位を低くする。
 説明を簡単にするため、値が入力される説明変数が全て連続型変数(例えば、気温、湿度等)であり、推定式内の個々の説明変数x,x,・・・,xもそれぞれ連続型変数に対応しているとする。この場合、表示優先順位決定手段3は、その各連続型変数に対応する推定式内の各説明変数の係数の絶対値を比較し、係数の絶対値の降順に、各連続型変数の表示優先順位を決定すればよい。
 推定式において、係数の絶対値が大きい説明変数ほど、推定値yへの影響が大きいと言える。例えば、式(1)において、a=-10であり、a=0.1であるとすると、xに対応する説明変数の方が、xに対応する説明変数よりも、推定値yへの影響が大きい。従って、係数の絶対値の降順に各連続型変数の表示優先順位を決定することによって、推定値yへの影響が大きい説明変数の値の変化を優先的に表示することができる。
 上記の例では、説明を簡単にするため、推定値yの計算に用いられる説明変数が全て連続型変数であるものとして説明した。ただし、推定値yの計算に用いられる説明変数は、連続型変数のみとは限らず、カテゴリ型変数も含まれることがある。その場合、カテゴリ型変数の値も説明変数表示優先順位決定システム1に入力される。また、推定式内には、そのカテゴリ型変数の各値(各項目)に対応する説明変数が含まれる。このように、推定値yの計算に用いられる説明変数の中にカテゴリ型変数が含まれる場合、表示優先順位決定手段3は、以下のように、各説明変数の表示優先順位を決定する。
 表示優先順位決定手段3は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出する。この場合、カテゴリ型変数毎に1つの値が算出されることになる。そして、表示優先順位決定手段3は、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。具体的には、カテゴリ型変数毎に算出した値(係数の絶対値の和)および各連続型変数に対応する推定式内の係数の絶対値の降順に、表示優先順位決定手段3は、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。
 表示優先順位決定手段3は、決定した各説明変数の表示優先順位を表示手段4に送る。
 表示手段4は、推定手段2によって算出された推定値の変化を表示するとともに、表示優先順位決定手段3によって決定された表示優先順位に従って、説明変数の値の変化を表示する。図4は、表示手段4による表示例を示す模式図である。表示手段4は、例えば、画面上部に定められた推定値表示領域11に推定値yの変化を表示する(図4参照)。図4に示す例では、推定値yの変化が軸間軸(横軸)に沿って表示されている。そして、表示手段4は、推定値表示領域11の下方に、表示優先順位に従って、種々の説明変数の値の変化を表示する(図4参照)。図4に示す例では、説明変数の値の変化が時間軸に沿って表示されている。ここで、推定値表示領域11における時間軸と、説明変数の値の変化を表示する際の時間軸とは、互いに揃っていることが好ましい、言い換えると、推定値yの変化と、説明変数の値の変化とを、共通の時間軸に沿って表示することが好ましい。このように表示することにより、分析者は、推定値yと説明変数の値とが時間軸に沿ってどのように相関しているかを直感的に把握できるようになる。図4に示す例において、括弧書きで示す値は、表示優先順位を表している。そして、表示手段4は、表示優先順位の順に、推定値表示領域11に近い側から、説明変数「気温」の値の変化、説明変数「時間区分」の値の変化、説明変数「曜日」の値の変化、説明変数「湿度」の値の変化を表示している。
 表示手段4は、表示優先順位の順に、全ての説明変数の値の変化を表示してもよい。あるいは、表示手段4は、表示優先順位の上位所定番目までの説明変数の値の変化を表示してもよい。
 また、図4では、表示手段4が、説明変数の値の変化を、ヒートマップ形式(値に応じた色や模様を表示する形式)で表す場合を例示しているが、説明変数の値の変化の表示態様は特に限定されない。例えば、表示手段4は、説明変数の値の変化を折れ線グラフ等で表示してもよい。また、分析者の操作に応じて、表示手段4は、個々の説明変数の値の変化の表示態様を切り替えてもよい。
 また、図4では、推定値yと説明変数の値とを時間軸(横軸)に沿って表示しているが、横軸は時間軸に限定されない。横軸に対応する情報と説明変数の値とが関連付けされていれば、横軸に対応する情報は、時間情報に限られず、任意の情報でよい。
 推定手段2、表示優先順位決定手段3および表示手段4は、例えば、入力デバイスおよびディスプレイ装置をするコンピュータのCPUによって実現される。この場合、CPUは、例えば、コンピュータのプログラム記憶装置(図1において図示略)等のプログラム記録媒体から説明変数表示優先順位決定プログラムを読み込み、その説明変数表示優先順位決定プログラムに従って、推定手段2、表示優先順位決定手段3および表示手段4として動作すればよい。なお、表示手段4に関しては、ディスプレイ装置に表示を実行させる部分が、CPUによって実現される。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
 説明変数表示優先順位決定システム1は、2つ以上の物理的に分離した装置が有線または無線で接続されている構成であってもよい。この点は、後述の実施形態においても同様である。
 次に、処理経過について説明する。図5は、第1の実施形態の処理経過の例を示すフローチャートである。
 表示優先順位決定手段3は、値が入力される各説明変数の表示優先順位を、推定手段2が推定値算出に用いる推定式内の各説明変数の係数に基づいて決定する(ステップS1)。
 ステップS1の処理を具体的に説明する。推定手段2が用いる推定式が図6に示す推定式であるとする。図6に示す例では、推定式内の説明変数x~xは、それぞれ、カテゴリ型変数である説明変数「曜日」の各値(「日曜日」、「月曜日」、・・・、「土曜日」)に対応している。また、推定式内の説明変数xは、連続型変数である説明変数「気温」に対応している。また、推定式内の説明変数x,x10は、それぞれ、カテゴリ型変数である説明変数「時間区分」の各値(「営業時間内」、「営業時間外」)に対応している。また、推定式内の説明変数x11は、連続型変数である説明変数「湿度」に対応している。なお、図6に示す推定式は、説明を簡単にするために模式的に示したものであり、推定式内のxの数や、推定式内のxがどのような説明変数に対応しているかは、図6に示す例に限定されない。
 なお、図6に示す推定式が用いられる場合、説明変数表示優先順位決定システム1には、例えば、個々の時点における「曜日」の値、「気温」の値、「時間区分」の値、「湿度」の値の組が、入力される。
 表示優先順位決定手段3は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出する。図6に示す例では、表示優先順位決定手段3は、カテゴリ型変数「曜日」に関して、「曜日」の各値に対応するx~xの各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a|+|a|+|a|+|a|+|a|+|a|を計算する。この計算結果をa1to7と記す。同様に、表示優先順位決定手段3は、カテゴリ型変数「時間区分」に関して、「時間区分」の各値に対応するx,x10の各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a10|を計算する。この計算結果をa9to10と記す。
 そして、表示優先順位決定手段3は、カテゴリ型変数毎に算出した値a1to7,a9to10および各連続型変数「気温」、「湿度」に対応する推定式内の各説明変数の係数の絶対値に基づいて、カテゴリ型変数である説明変数「曜日」、「時間区分」および連続型変数である説明変数「気温」、「湿度」の表示優先順位を決定する。「気温」に対応する推定式内の説明変数xの係数の絶対値は|a|である。「湿度」に対応する推定式内の説明変数x11の係数の絶対値は|a11|である。表示優先順位決定手段3は、a1to7,a9to10,|a|,|a11|の降順に、「曜日」、「時間区分」、「気温」、「湿度」の表示優先順位を決定する。例えば、|a|>a9to10>a1to7>|a11|であれば、表示優先順位決定手段3は、「気温」、「時間区分」、「曜日」、「湿度」の順に、表示優先順位を、1位、2位、3位、4位と決定する。
 また、各説明変数の値が説明変数表示優先順位決定システム1に入力されると(ステップS2)、推定手段2は、各説明変数の値と推定式とによって、推定値yを算出する(ステップS3)。例えば、ある時点における各説明変数「曜日」、「気温」、「時間区分」および「湿度」の値として、「日曜日」、「25℃」、「営業時間外」および「60%」が入力されたとする。推定手段2は、x=1,x=25,x10=1,x11=60を代入し、図6に示す推定式内のその他の説明変数には0を代入することによって、その時点における推定値yを算出する。推定手段2は、他の時点における推定値も同様に算出する。推定手段2は、算出した推定値yと、推定値yに対応する時間情報とを関連付けて、表示手段4に送る。
 次に、表示手段4は、例えば、図4に例示するように、推定値yの変化を表示するとともに、ステップS1で決定された表示優先順位に従って、説明変数の値の変化を表示する(ステップS4)。上記に例示したように、「気温」、「時間区分」、「曜日」、「湿度」の表示優先順位がそれぞれ1位、2位、3位、4位である場合、表示手段4は、推定値表示領域11(図4参照)に近い側から、気温の変化、時間区分の変化、曜日の変化、湿度の変化を表示すればよい。また、表示手段4は、表示優先順位の上位所定番目(例えば、上位3番目)までの説明変数の値の変化を表示してもよい。上位何番目までの説明変数の値の変化を表示するかは、例えば、予め定めておけばよい。
 本実施形態によれば、上記のように、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数の値の変化を表示することができる。その結果、推定値yへの影響が大きい説明変数の値の変化を優先的に表示できる。
 また、本実施形態によれば、表示手段4は、推定値の変化を所定の軸(典型的には時間軸)に沿って表示し、さらに、説明変数の値の変化も、共通の時間軸に沿って表示する。言い換えると、表示手段4は、推定値の変化と説明変数の値の変化とを、同一の軸に沿って表示する。これにより、分析者にとって、推定値の変化と説明変数の変化とが、所定の軸に沿ってどのように連動しているかを直感的に把握しやすくなる。
 また、表示優先順位に従って表示される対象は、説明変数の値の変化に限定されない。例えば、表示手段4は、説明変数の名称を並べて表示する際に、表示優先順位に従って、説明変数の名称を表示してもよい。この点は、後述の実施形態でも同様である。
 上記の実施形態では、推定手段2が用いる推定式が1つである場合を例にして説明したが、推定手段2が用いる推定式が2つ以上存在していてもよい。例えば、推定手段2が複数の推定式の中から1つの推定式を選択し、選択した推定式を用いて推定値を算出してもよい。以下、第1の実施形態の変形例として、この場合の動作について説明する。なお、既に説明した動作と同様の動作については、説明を省略する。
 本変形例における説明変数表示優先順位決定システムの構成は、図1に示す構成と同様である。ただし、推定手段2および表示優先順位決定手段3の動作が一部異なる。表示優先順位決定手段3の動作については後述する。
 本変形例において、推定手段2は、推定式を選択するためのモデルを記憶している。このモデルは、個々の時点における各説明変数の値に応じて一つの推定式を定めることが可能なモデルである。図7は、推定式を選択するためのモデルの一例を示す模式図である。推定手段2は、ある時点の各説明変数の値に応じて、図7に模式的に示すモデルから推定式を選択し、その時点の各説明変数の値および選択した推定式によって推定値を算出する。推定式を選択した後、その推定式を用いて推定値yを算出する動作は、前述の第1の実施形態における動作と同様である。複数の推定式、および推定式を選択するためのモデルは、予め学習用データを用いて決定されている。
 なお、図7では、木構造のモデルを表しているが、モデルは、共通のリーフを有し、ルートが異なる複数の木構造を有するモデルであってもよい。
 本変形例における処理経過は、図5における処理経過と同様である。ただし、ステップS1において、表示優先順位決定手段3は、値が入力される各説明変数の表示優先順位を、推定手段2が推定値算出に用いる複数の推定式内の各説明変数の係数に基づいて決定する。
 推定手段2が用いる複数の推定式が図8に示す2つの推定式であるとする。ここでは、説明を簡単にするため、推定式が2つであるものとして説明するが、推定式の数は3以上であってもよい。図8に示す例では、2つの推定式にはそれぞれ説明変数x~x11が含まれている。図6に示す場合と同様に、図8に示す各推定式内の説明変数x~xは、それぞれ、カテゴリ型変数である説明変数「曜日」の各値に対応している。また、各推定式内の説明変数xは、連続型変数である説明変数「気温」に対応している。また、各推定式内の説明変数x,x10は、それぞれ、カテゴリ型変数である説明変数「時間区分」の各値に対応している。また、各推定式内の説明変数x11は、連続型変数である説明変数「湿度」に対応している。図8に示す2つの推定式は、説明を簡単にするために模式的に示したものであり、推定式内のxの数や、推定式内のxがどのような説明変数に対応しているかは、図8に示す例に限定されない。
 表示優先順位決定手段3は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出する。図8に示す例では、表示優先順位決定手段3は、カテゴリ型変数「曜日」に関して、1番目の推定式で「曜日」の各値に対応するx~xの各係数の絶対値、および2番目の式で「曜日」の各値に対応するx~xの各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a|+|a|+|a|+|a|+|a|+|a|+|a’|+|a’|+|a’|+|a’|+|a’|+|a’|+|a’|を計算する。この計算結果をAとする。同様に、表示優先順位決定手段3は、カテゴリ型変数「時間区分」に関して、1番目の推定式で「時間区分」の各値に対応するx,x10の各係数の絶対値、および2番目の式で「時間区分」の各値に対応するx,x10の各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a10|+|a’|+|a10’|を計算する。この計算結果をAとする。このように、表示優先順位決定手段3は、カテゴリ型変数毎に1つの値を算出する。
 また、表示優先順位決定手段3は、連続型変数毎に、連続型変数に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出する。図8に示す例では、表示優先順位決定手段3は、連続型変数「気温」に関して、1番目の推定式で「気温」に対応するxの係数の絶対値、および2番目の推定式で「気温」に対応するxの係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a|+|a’|を計算する。この計算結果をAとする。同様に、表示優先順位決定手段3は、連続型変数「湿度」に関して、1番目の推定式で「湿度」に対応するx11の係数の絶対値、および2番目の推定式で「湿度」に対応するx11の係数の絶対値の和を計算する。すなわち、表示優先順位決定手段3は、|a11|+|a11’|を計算する。この値をAとする。このように、表示優先順位決定手段3は、連続型変数毎に1つの値を算出する。
 そして、表示優先順位決定手段3は、カテゴリ型変数毎に算出した係数の絶対値の和(本例では、A,A)と、連続型変数毎に算出した係数の絶対値の和(本例では、A,A)とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。本例では、表示優先順位決定手段3は、A,A,A,Aの降順に、「曜日」、「時間区分」、「気温」、「湿度」の表示優先順位を決定する。例えば、A>A>A>Aであれば、表示優先順位決定手段3は、「気温」、「時間区分」、「曜日」、「湿度」の順に、表示優先順位を、1位、2位、3位、4位と決定する。
 各説明変数の値が説明変数表示優先順位決定システム1に入力されると(ステップS2)、推定手段2は、各説明変数の値と前述のモデル(推定式を選択するためのモデル)とによって、推定式を選択し、その各説明変数の値および選択した推定式によって推定値を算出する(ステップS3)。
 ステップS4は、既に説明したステップS4と同様であり、説明を省略する。
 本変形例においても、第1の実施形態と同様の効果が得られる。
 なお、第1の実施形態およびその変形例において、ステップS1の実行タイミングは上記の例に限定されない。例えば、説明変数表示優先順位決定システム1は、ステップS3の後にステップS1を実行してもよい。
実施形態2.
 図9は、本発明の第2の実施形態の説明変数表示優先順位決定システムの構成例を示すブロック図である。第2の実施形態の説明変数表示優先順位決定システム1は、推定手段12と、表示優先順位決定手段13と、表示手段4とを備える。表示手段4は、第1の実施形態における表示手段4と同様であり、説明を省略する。
 本実施形態の説明変数表示優先順位決定システム1には、第1の実施形態と同様に、各説明変数の値が入力デバイス(図9において図示略)を介して入力される。また、説明変数の組に対応する推定対象の実測値も、説明変数表示優先順位決定システム1に入力デバイスを介して入力される。本実施形態の説明変数表示優先順位決定システム1は、既に実測値が得られている個々の時点での各説明変数の値に基づいて推定値を算出し、個々の時点における推定値と実測値との誤差を求める。そして、説明変数表示優先順位決定システム1は、その誤差の推定値である残差を求めるための推定式(以下、残差推定式と記す。)を導出し、残差推定式内の各説明変数の係数に基づいて、値が入力される各説明変数の表示優先順位を決定する。
 以下の説明では、説明変数表示優先順位決定システム1に入力される各説明変数は、図2に例示するように、時間情報に関連付けられているものとする。同様に、説明変数表示優先順位決定システム1に入力される実測値も、時間情報に関連付けられているものとする。
 推定手段12は、個々の時点における各説明変数の値が入力されると、予め定められた式(1)の形式で表される推定式と、個々の時点における各説明変数の値とを用いて、推定値yを算出する。推定式を用いて推定値yを算出する動作は、第1の実施形態で説明しているので、ここでは説明を省略する。
 なお、推定手段12は、個々の時点における推定値yを算出する際に、第1の実施形態の変形例と同様に、複数の推定式の中から1つの推定式を選択し、その推定式を用いて推定値yを算出してもよい。
 推定手段12は、算出した各時点の推定値yを表示優先順位決定手段13および表示手段4に送る。
 表示優先順位決定手段13は、個々の時点毎に、推定手段12によって算出された推定値yと、説明変数表示優先順位決定システム1に入力された実測値との誤差を算出する。すなわち、実測値をYとし、推定値yと実測値Yとの誤差をZとすると、表示優先順位決定手段13は、個々の時点毎に、以下に示す式(2)の計算によって誤差Zを算出する。
  Z=|y-Y|     式(2)
 表示優先順位決定手段13は、個々の時点における誤差Zを算出後、誤差の推定値である残差を求めるための推定式(残差推定式)を導出する。以下、残差を記号zで表す。ここで、表示優先順位決定手段13は、式(1)に示す推定式内の各説明変数x,x,・・・,xを含む残差推定式を導出する。表示優先順位決定手段13は、例えば、個々の時点における各説明変数の値および誤差Zを用いて回帰分析を行うことによって、残差推定式を導出すればよい。誤差推定式は、以下に示す式(3)のように表される。
 z=c+c+・・・+c+d     式(3)
 dは定数項であり、c~cはそれぞれ、x~xの係数である。
 表示優先順位決定手段13は、式(3)のように表される残差推定式内の各説明変数の係数(より具体的には係数の絶対値)に基づいて、値が入力される各説明変数の表示優先順位を決定する。
 表示優先順位決定手段13が残差推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作は、第1の実施形態において表示優先順位決定手段3が式(1)のように表される推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作と同様である。すなわち、表示優先順位決定手段13は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出する。そして、表示優先順位決定手段13は、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する残差推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。具体的には、カテゴリ型変数毎に算出した値(係数の絶対値の和)および各連続型変数に対応する残差推定式内の係数の絶対値の降順に、表示優先順位決定手段13は、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する。
 表示優先順位決定手段13は、決定した各説明変数の表示優先順位を表示手段4に送る。
 推定手段12、表示優先順位決定手段13および表示手段4は、例えば、入力デバイスおよびディスプレイ装置をするコンピュータのCPUによって実現される。この場合、CPUは、例えば、コンピュータのプログラム記憶装置(図9において図示略)等のプログラム記録媒体から説明変数表示優先順位決定プログラムを読み込み、その説明変数表示優先順位決定プログラムに従って、推定手段12、表示優先順位決定手段13および表示手段4として動作すればよい。また、各手段が、それぞれ別々のハードウェアで実現されていてもよい。
 次に、処理経過について説明する。図10は、第2の実施形態の処理経過の例を示すフローチャートである。
 個々の時点での各説明変数の値、およびその個々の時点での推定対象の実測値Yが入力されると(ステップS11)、推定手段12は、個々の時点での各説明変数の値と推定式とによって、個々の時点における推定値yを算出する(ステップS12)。
 ステップS12の次に、表示優先順位決定手段13は、個々の時点毎に、推定手段12によって算出された推定値yと、ステップS11で入力された実測値Yとの誤差Zを、前述の式(2)によって算出する。そして、表示優先順位決定手段13は、個々の時点における誤差Zと、ステップS11で入力された個々の時点における各説明変数の値と用いて、例えば、回帰分析によって、式(3)の形式で表される誤差推定式を導出する(ステップS13)。
 次に、表示優先順位決定手段13は、残差推定式内の各説明変数の係数に基づいて、値が入力される各説明変数の表示優先順位を決定する(ステップS14)。前述のように、表示優先順位決定手段13が残差推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作は、第1の実施形態において表示優先順位決定手段3が式(1)のように表される推定式内の各説明変数の係数に基づいて表示優先順位を決定する動作と同様である。
 ステップ14の処理を具体的に説明する。ステップS13で導出された残差導出式が図11に示す式であるとする。図6に示す場合と同様に、図11に示す残差推定式内の説明変数x~xは、それぞれ、カテゴリ型変数である説明変数「曜日」の各値に対応している。また、残差推定式内の説明変数xは、連続型変数である説明変数「気温」に対応している。また、残差推定式内の説明変数x,x10は、それぞれ、カテゴリ型変数である説明変数「時間区分」の各値に対応している。また、残差推定式内の説明変数x11は、連続型変数である説明変数「湿度」に対応している。図11に示す残差推定式は、説明を簡単にするために模式的に示したものであり、残差推定式内のxの数や、残差推定式内のxがどのような説明変数に対応しているかは、図11に示す例に限定されない。
 表示優先順位決定手段13は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出する。図11に示す例では、表示優先順位決定手段13は、カテゴリ型変数「曜日」に関して、「曜日」の各値に対応するx~xの各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段13は、|c|+|c|+|c|+|c|+|c|+|c|+|c|を計算する。この計算結果をc1to7と記す。同様に、表示優先順位決定手段13は、カテゴリ型変数「時間区分」に関して、「時間区分」の各値に対応するx,x10の各係数の絶対値の和を計算する。すなわち、表示優先順位決定手段13は、|c|+|c10|を計算する。この計算結果をc9to10と記す。
 そして、表示優先順位決定手段13は、カテゴリ型変数毎に算出した値c1to7,c9to10および各連続型変数「気温」、「湿度」に対応する残差推定式内の各説明変数の係数の絶対値に基づいて、カテゴリ型変数である説明変数「曜日」、「時間区分」および連続型変数である説明変数「気温」、「湿度」の表示優先順位を決定する。「気温」に対応する残差推定式内の説明変数xの係数の絶対値は|c|である。「湿度」に対応する残差推定式内の説明変数x11の係数の絶対値は|c11|である。表示優先順位決定手段13は、c1to7,c9to10,|c|,|c11|の降順に、「曜日」、「時間区分」、「気温」、「湿度」の表示優先順位を決定する。
 次に、表示手段4は、例えば、図4に例示するように、推定値yの変化を表示するとともに、ステップS14で決定された表示優先順位に従って、説明変数の値の変化を表示する(ステップS15)。ステップS15は、第1の実施形態におけるステップS4と同様である。例えば、表示手段4は、推定値yの変化と、各説明変数の値の変化とを、それぞれ、共通の時間軸に沿って表示する。なお、表示手段4は、例えば、推定値表示領域11内に、推定値yの変化とともに実測値Yの変化を表示してもよい。
 本実施形態によれば、上記のように、推定値算出のために与えられる説明変数に対して表示優先順位を定め、説明変数の値の変化を表示することができる。特に、本実施形態では、表示優先順位決定手段13は、残差推定式内の説明変数の係数の絶対値に基づいて表示優先順位を定める。従って、誤差が大きくなる要因となる度合いの高い説明変数の値の変化を優先的に表示できる。
 本実施形態の効果を具体的に説明する。分析者は、説明変数が表示される順番を見ることにより、その説明変数が残差に大きく影響するかを把握することができる。これにより、分析者は、例えば、推定に対して新たに追加しなくてはならない説明変数について、ヒントを得ることができる。例えば、仮に、表示手段4が、説明変数を「曜日」、「時間区分」、「気温」、「湿度」の順に表示したとする。この表示結果を見た分析者は、例えば、さらに曜日毎の誤差を詳細に分析する。ここで、例えば、金曜日の誤差が他の曜日の誤差と比較して大きかったとする。そして、分析者がさらによく調べてみると、例えば、毎月の第3週の金曜日のみ、目的変数(例えば、消費電力量等)に大きく影響するようなイベントが開催されていることが分かったとする。分析者は、これを受けて、新しく「イベントの有無」という説明変数を追加することを思いつくことができる。
 このように、分析者が、残差に大きく影響する説明変数の存在に気付くことができると、分析者は、今まで気付かなかった新たな説明変数の存在に気付くきっかけとすることができる。
 また、例えば、仮に、説明変数「気温」が残差に大きく影響することが分かったとする。それをきっかけに、分析者は、例えば、気温の値の変化を詳細に確認する。その結果、例えば、説明変数「気温」にノイズが多く含まれていたとする。これを受けて、分析者は、説明変数「気温」に対してデータクレンジング処理を実行することを思い付くことができる。
 このように、分析者が、残差に大きく影響する説明変数の存在に気付くと、分析者は、それをきっかけに、データクレンジング処理を実行する必要がある説明変数の存在に気付くことができる。
 また、例えば、仮に「時間区分」という説明変数が、残差に大きく影響することが分かったとする。上記の例では、説明変数「時間区分」が取り得る値は「営業時間外」および「営業時間内」のみである。「時間区分」という説明変数が残差に大きく影響することに基づいて、分析者は、説明変数「時間区分」が取り得る値を、より細分化した方がよいということを着想できる。例えば、分析者は、説明変数「時間区分」が取り得る値を、「営業時間外」、「午前営業時間内」および「午後営業時間内」等のように細分化することを着想できる。同様に、例えば、「年代(10年単位)」という説明変数が残差に大きく影響することが分かった場合には、その説明変数を、より詳細な「年齢(1年単位)」という説明変数として扱った方がよい等ということを着想できる。
 このように、分析者が、残差に大きく影響する説明変数の存在に気付くことができると、分析者は、それをきっかけに、詳細化や細分化の必要がある説明変数の存在に気付くことができる。
 データマイニングにおいては、分析対象である説明変数の種類が、数百種類、数千種類になることも珍しくない。このよう場合、分析者が、この全ての説明変数について詳細な検討を実施することは容易ではない。本実施形態のように、説明変数を、残差に大きく影響する順に優先順位付けすることにより、分析者は、大量の説明変数の中から、より注視すべき説明変数を選択することができる。これにより、データ分析作業の効率が上がる。
 第2の実施形態において、表示優先順位決定手段13は、残差推定式の代わりに、他の式を用いてもよい。例えば、表示優先順位決定手段13は、誤差の絶対値の推定式を導出し、その推定式を用いて、各説明変数の表示優先順位を決定してもよい。また、例えば、表示優先順位決定手段13は、誤差の絶対値が一定以上の値になるか否かを判別分析するための式を導出し、その式を用いて、各説明変数の表示優先順位を決定してもよい。
 また、残差推定式や上記に例示した種々の式を作るアルゴリズムと、目的変数の推定式を作るアルゴリズムとは、必ずしも一致していなくてよい。また、回帰分析によって目的変数の推定式を作った後に、決定木で「10以上の誤差になるかどうか」の判別分析を行ってもよい。
 上記の各実施形態では、各説明変数の値や推定対象の実測値が時間情報と関連付けて入力される場合を例示した。この場合、表示手段4は、時間経過に伴う推定値の変化や説明変数の変化を表示すればよい。また、各説明変数の値や推定対象の実測値は、時間情報以外の情報と関連付けて入力されてもよく、表示手段4は、時間以外の順序に沿った推定値の変化や説明変数の変化を表示すればよい。
 また、本発明の説明変数表示優先順位決定システム1は、学習によって得られた推定式によって推定を行う推定装置に実装されてもよい。あるいは、推定式等の学習を行う学習装置に本発明の説明変数表示優先順位決定システム1が実装されてもよい。例えば、学習装置も、学習した推定式の検算等のために、推定式による推定機能を有する場合がある。そのような学習装置に、説明変数表示優先順位決定システム1が実装されてもよい。
 図12は、本発明の各実施形態に係るコンピュータの構成例を示す概略ブロック図である。コンピュータ1000は、CPU1001と、主記憶装置1002と、補助記憶装置1003と、インタフェース1004と、ディスプレイ装置1005と、入力デバイス1006とを備える。
 各実施形態の説明変数表示優先順位決定システム1は、コンピュータ1000に実装される。説明変数表示優先順位決定システム1の動作は、プログラム(説明変数表示優先順位決定プログラム)の形式で補助記憶装置1003に記憶されている。CPU1001は、プログラムを補助記憶装置1003から読み出して主記憶装置1002に展開し、そのプログラムに従って上記の処理を実行する。
 補助記憶装置1003は、一時的でない有形の媒体の一例である。一時的でない有形の媒体の他の例として、インタフェース1004を介して接続される磁気ディスク、光磁気ディスク、CD-ROM、DVD-ROM、半導体メモリ等が挙げられる。また、このプログラムが通信回線によってコンピュータ1000に配信される場合、配信を受けたコンピュータ1000がそのプログラムを主記憶装置1002に展開し、上記の処理を実行してもよい。
 また、プログラムは、前述の処理の一部を実現するためのものであってもよい。さらに、プログラムは、補助記憶装置1003に既に記憶されている他のプログラムとの組み合わせで前述の処理を実現する差分プログラムであってもよい。
 次に、本発明の最小構成を示す。図13は、本発明の最小構成の例を示すブロック図である。本発明の説明変数表示優先順位決定システムは、表示優先順位決定手段73と、表示手段74とを備える。
 表示優先順位決定手段73(例えば、第2の実施形態の表示優先順位決定手段13)は、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する。より具体的には、表示優先順位決定手段73は、残差に対する説明変数の影響の大きさに基づいて、説明変数の表示優先順位を決定する。
 表示手段74(例えば、第2の実施形態の表示手段4)は、表示優先順位に従って説明変数を表示する。
 そのような構成によって、本発明の効果を得ることができる。
 また、表示優先順位決定手段73および表示手段74は、以下のように動作してもよい。
 表示優先順位決定手段73(例えば、第1の実施形態の表示優先順位決定手段3)は、推定式による値の推定で用いられる各説明変数の表示優先順位を、推定式内の各説明変数の係数に基づいて決定する。
 表示手段74(例えば、第1の実施形態の表示手段4)は、推定式による推定値の変化と、説明変数の値の変化とを、所定の軸に沿って表示する。
 上記の各実施形態は、以下の付記のようにも記載され得るが、以下に限定されるわけではない。
(付記1)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定手段と、前記表示優先順位に従って前記説明変数を表示する表示手段とを備え、前記表示優先順位決定手段は、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定することを特徴とする説明変数表示優先順位決定システム。
(付記2)前記表示優先順位決定手段は、前記推定値と前記実測値との誤差の推定量である残差を推定するための残差推定式を導出し、当該残差推定式内の各説明変数の係数に基づいて、前記表示優先順位を決定する付記1に記載の説明変数表示優先順位決定システム。
(付記3)前記表示優先順位決定手段は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する残差推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する付記2に記載の説明変数表示優先順位決定システム。
(付記4)前記表示手段は、さらに、前記推定式による推定値の変化を、前記推定値に対応する実測値の変化とともに表示する付記1から付記3のうちのいずれかに記載の説明変数表示優先順位決定システム。
(付記5)前記表示手段は、前記推定式による推定値の変化および前記実測値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する付記4に記載の説明変数表示優先順位決定システム。
(付記6)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定手段と、前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示手段とを備えることを特徴とする説明変数表示優先順位決定システム。
(付記7)前記表示優先順位決定手段は、前記係数の絶対値が大きい説明変数ほど表示優先順位を高く設定し、前記表示手段は、前記表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、前記推定値の変化を表示する領域の近くに表示する付記6に記載の説明変数表示優先順位決定システム。
(付記8)前記表示優先順位決定手段は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する付記6または付記7に記載の説明変数表示優先順位決定システム。
(付記9)前記表示優先順位決定手段は、推定値を算出するために選択される推定式が複数存在する場合に、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、連続型変数毎に、連続型変数に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、連続型変数毎に算出した係数の絶対値の和とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する付記6または付記7に記載の説明変数表示優先順位決定システム。
(付記10)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定し、前記表示優先順位に従って前記説明変数を表示し、表示優先順位を決定する際に、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定することを特徴とする説明変数表示優先順位決定方法。
(付記11)推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定し、前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示することを特徴とする説明変数表示優先順位決定方法。
(付記12)コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定処理、および、前記表示優先順位に従って前記説明変数を表示する表示処理を実行させ、前記表示優先順位決定処理で、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定させるための説明変数表示優先順位決定プログラム。
(付記13)コンピュータに、推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定処理、および、前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示処理を実行させるための説明変数表示優先順位決定プログラム。
 以上、実施形態を参照して本願発明を説明したが、本願発明は上記の実施形態に限定されるものではない。本願発明の構成や詳細には、本願発明のスコープ内で当業者が理解し得る様々な変更をすることができる。
 この出願は、2014年10月24日に出願された日本特許出願2014-216839を基礎とする優先権を主張し、その開示の全てをここに取り込む。
産業上の利用の可能性
 本発明は、種々の説明変数の値の変化を提示する装置に好適に適用可能である。
 1 説明変数表示優先順位決定システム
 2,12 推定手段
 3,13 表示優先順位決定手段
 4 表示手段

Claims (13)

  1.  推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定手段と、
     前記表示優先順位に従って前記説明変数を表示する表示手段とを備え、
     前記表示優先順位決定手段は、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定する
     ことを特徴とする説明変数表示優先順位決定システム。
  2.  前記表示優先順位決定手段は、前記推定値と前記実測値との誤差の推定量である残差を推定するための残差推定式を導出し、当該残差推定式内の各説明変数の係数に基づいて、前記表示優先順位を決定する
     請求項1に記載の説明変数表示優先順位決定システム。
  3.  前記表示優先順位決定手段は、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する残差推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する残差推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する
     請求項2に記載の説明変数表示優先順位決定システム。
  4.  前記表示手段は、さらに、前記推定式による推定値の変化を、前記推定値に対応する実測値の変化とともに表示する
     請求項1から請求項3のうちのいずれか1項に記載の説明変数表示優先順位決定システム。
  5.  前記表示手段は、前記推定式による推定値の変化および前記実測値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する
     請求項4に記載の説明変数表示優先順位決定システム。
  6.  推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定手段と、
     前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示手段とを備える
     ことを特徴とする説明変数表示優先順位決定システム。
  7.  前記表示優先順位決定手段は、前記係数の絶対値が大きい説明変数ほど表示優先順位を高く設定し、
     前記表示手段は、前記表示優先順位が高い説明変数ほど、当該説明変数の値の変化を、前記推定値の変化を表示する領域の近くに表示する
     請求項6に記載の説明変数表示優先順位決定システム。
  8.  前記表示優先順位決定手段は、
     カテゴリ型変数毎に、カテゴリ型変数の各値に対応する推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、各連続型変数に対応する推定式内の各説明変数の係数の絶対値とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する
     請求項6または請求項7に記載の説明変数表示優先順位決定システム。
  9.  前記表示優先順位決定手段は、
     推定値を算出するために選択される推定式が複数存在する場合に、カテゴリ型変数毎に、カテゴリ型変数の各値に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、連続型変数毎に、連続型変数に対応する、全ての推定式内の各説明変数の係数の絶対値の和を算出し、カテゴリ型変数毎に算出した係数の絶対値の和と、連続型変数毎に算出した係数の絶対値の和とに基づいて、カテゴリ型変数である各説明変数および連続型変数である各説明変数の表示優先順位を決定する
     請求項6または請求項7に記載の説明変数表示優先順位決定システム。
  10.  推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定し、
     前記表示優先順位に従って前記説明変数を表示し、
     表示優先順位を決定する際に、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定する
     ことを特徴とする説明変数表示優先順位決定方法。
  11.  推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定し、
     前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する
     ことを特徴とする説明変数表示優先順位決定方法。
  12.  コンピュータに、
     推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式による推定値と実測値との誤差の推定量である残差に基づいて決定する表示優先順位決定処理、および、
     前記表示優先順位に従って前記説明変数を表示する表示処理を実行させ、
     前記表示優先順位決定処理で、残差に対する説明変数の影響の大きさに基づいて、前記説明変数の表示優先順位を決定させる
     ための説明変数表示優先順位決定プログラム。
  13.  コンピュータに、
     推定式による値の推定で用いられる各説明変数の表示優先順位を、前記推定式内の各説明変数の係数に基づいて決定する表示優先順位決定処理、および、
     前記推定式による推定値の変化と、前記説明変数の値の変化とを、所定の軸に沿って表示する表示処理
     を実行させるための説明変数表示優先順位決定プログラム。
PCT/JP2015/004284 2014-10-24 2015-08-26 説明変数表示優先順位決定システム、方法およびプログラム Ceased WO2016063446A1 (ja)

Priority Applications (3)

Application Number Priority Date Filing Date Title
US15/521,275 US20170308825A1 (en) 2014-10-24 2015-08-26 Priority order determination system, method, and program for explanatory variable display
JP2016555053A JP6558375B2 (ja) 2014-10-24 2015-08-26 説明変数表示優先順位決定システム、方法およびプログラム
EP15852193.0A EP3211579A4 (en) 2014-10-24 2015-08-26 Priority order determination system, method and program for explanatory variable display

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
JP2014-216839 2014-10-24
JP2014216839 2014-10-24

Publications (1)

Publication Number Publication Date
WO2016063446A1 true WO2016063446A1 (ja) 2016-04-28

Family

ID=55760510

Family Applications (1)

Application Number Title Priority Date Filing Date
PCT/JP2015/004284 Ceased WO2016063446A1 (ja) 2014-10-24 2015-08-26 説明変数表示優先順位決定システム、方法およびプログラム

Country Status (4)

Country Link
US (1) US20170308825A1 (ja)
EP (1) EP3211579A4 (ja)
JP (1) JP6558375B2 (ja)
WO (1) WO2016063446A1 (ja)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019039077A1 (ja) * 2017-08-23 2019-02-28 日本電気株式会社 現金需要予測システム、現金需要予測方法および現金需要予測プログラム
WO2019163160A1 (ja) * 2018-02-22 2019-08-29 株式会社日立製作所 分析装置、分析方法、および分析プログラム
JP2020077033A (ja) * 2018-11-05 2020-05-21 日本電気株式会社 解析装置および解析方法
JP2021141637A (ja) * 2020-03-02 2021-09-16 富士電機株式会社 情報処理装置、情報処理方法及びプログラム
JPWO2022064679A1 (ja) * 2020-09-28 2022-03-31
WO2024154398A1 (ja) * 2023-01-19 2024-07-25 株式会社Nttドコモ 推定装置

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021220999A1 (ja) * 2020-04-30 2021-11-04 パナソニックIpマネジメント株式会社 特性表示装置、特性表示方法およびプログラム

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062521A (ja) * 2002-07-29 2004-02-26 Nippon Telegr & Teleph Corp <Ntt> 日毎雷害故障数予測装置及び日毎雷害故障数予測方法
JP2005149162A (ja) * 2003-11-17 2005-06-09 Sansaara Corporation:Kk 情報表示解析システムおよび方法
JP2012128800A (ja) * 2010-12-17 2012-07-05 Nippon Steel Engineering Co Ltd プロセスの状態予測方法及びそれを用いたプロセス制御装置

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2893808A1 (fr) * 2005-11-22 2007-05-25 Thomson Licensing Sas Procede et dispositif de codage d'une image video
US8560346B2 (en) * 2009-01-05 2013-10-15 Siemens Medical Solutions Usa, Inc. System and method for ranking quality improvement factors in patient care
US20150112891A1 (en) * 2012-06-13 2015-04-23 Sony Corporation Information processor, information processing method, and program

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2004062521A (ja) * 2002-07-29 2004-02-26 Nippon Telegr & Teleph Corp <Ntt> 日毎雷害故障数予測装置及び日毎雷害故障数予測方法
JP2005149162A (ja) * 2003-11-17 2005-06-09 Sansaara Corporation:Kk 情報表示解析システムおよび方法
JP2012128800A (ja) * 2010-12-17 2012-07-05 Nippon Steel Engineering Co Ltd プロセスの状態予測方法及びそれを用いたプロセス制御装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
See also references of EP3211579A4 *

Cited By (14)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019039077A1 (ja) * 2017-08-23 2019-02-28 日本電気株式会社 現金需要予測システム、現金需要予測方法および現金需要予測プログラム
JPWO2019039077A1 (ja) * 2017-08-23 2020-09-17 日本電気株式会社 現金需要予測システム、現金需要予測方法および現金需要予測プログラム
JP7184040B2 (ja) 2017-08-23 2022-12-06 日本電気株式会社 現金需要予測システム、現金需要予測方法および現金需要予測プログラム
US11507881B2 (en) 2018-02-22 2022-11-22 Hitachi, Ltd. Analysis apparatus, analysis method, and analysis program for calculating prediction error and extracting error factor
WO2019163160A1 (ja) * 2018-02-22 2019-08-29 株式会社日立製作所 分析装置、分析方法、および分析プログラム
JP2019144970A (ja) * 2018-02-22 2019-08-29 株式会社日立製作所 分析装置、分析方法、および分析プログラム
JP2020077033A (ja) * 2018-11-05 2020-05-21 日本電気株式会社 解析装置および解析方法
JP7225688B2 (ja) 2018-11-05 2023-02-21 日本電気株式会社 解析装置、解析方法、および解析プログラム
JP2021141637A (ja) * 2020-03-02 2021-09-16 富士電機株式会社 情報処理装置、情報処理方法及びプログラム
JP7413843B2 (ja) 2020-03-02 2024-01-16 富士電機株式会社 情報処理装置、情報処理方法及びプログラム
WO2022064679A1 (ja) * 2020-09-28 2022-03-31 日本電気株式会社 予測装置、予測方法、及び、記録媒体
JPWO2022064679A1 (ja) * 2020-09-28 2022-03-31
JP7567922B2 (ja) 2020-09-28 2024-10-16 日本電気株式会社 予測装置、予測方法、及び、プログラム
WO2024154398A1 (ja) * 2023-01-19 2024-07-25 株式会社Nttドコモ 推定装置

Also Published As

Publication number Publication date
US20170308825A1 (en) 2017-10-26
EP3211579A4 (en) 2018-03-14
EP3211579A1 (en) 2017-08-30
JPWO2016063446A1 (ja) 2017-08-03
JP6558375B2 (ja) 2019-08-14

Similar Documents

Publication Publication Date Title
JP6558375B2 (ja) 説明変数表示優先順位決定システム、方法およびプログラム
JP6708204B2 (ja) 精度推定モデル生成システムおよび精度推定システム
JP2015108904A (ja) 表示方法、表示装置及び表示プログラム
JP6529096B2 (ja) シミュレートシステム、シミュレート方法およびシミュレート用プログラム
EP3214585A1 (en) Estimated result display system, estimated result display method and estimated result display program
US20160155081A1 (en) Process flow header
JP5993273B2 (ja) 意思決定支援システム及び方法
JP6399206B2 (ja) 推定器管理システム
EP3211569A1 (en) Estimation results display system, estimation results display method, and estimation results display program
WO2018154662A1 (ja) 価格最適化システム、価格最適化方法および価格最適化プログラム
US20180240046A1 (en) Display system for displaying analytical information, method, and program
WO2016132684A1 (ja) 影響度可視化システム、方法およびプログラム
JP7352378B2 (ja) 製造制御装置、製造制御方法及びプログラム
JP5160670B2 (ja) マーケティング支援システム
JP6414321B2 (ja) 人数予測システム、人数予測方法および人数予測プログラム
US10504254B2 (en) Predictor visualization system, predictor visualization method, and predictor visualization program
US20230044694A1 (en) Action evaluation system, action evaluation method, and recording medium
WO2023013194A1 (ja) レイアウト分析装置及びレイアウト分析方法
JP5574206B1 (ja) チャート表示装置、チャート表示方法、プログラムおよびチャート表示システム
JP7565500B2 (ja) 品質推定装置および方法
JP6216600B2 (ja) 紹介者候補抽出システム
JP2012123532A (ja) 特許情報解析システム
JP2016021144A (ja) グラフ表示方法、グラフ表示装置およびグラフ表示プログラム
Siripanthana et al. Sufficient reduction methods for multivariate time-dependent health surveillance data
JP2021068173A (ja) 予測装置および予測方法

Legal Events

Date Code Title Description
121 Ep: the epo has been informed by wipo that ep was designated in this application

Ref document number: 15852193

Country of ref document: EP

Kind code of ref document: A1

ENP Entry into the national phase

Ref document number: 2016555053

Country of ref document: JP

Kind code of ref document: A

REEP Request for entry into the european phase

Ref document number: 2015852193

Country of ref document: EP

WWE Wipo information: entry into national phase

Ref document number: 15521275

Country of ref document: US

NENP Non-entry into the national phase

Ref country code: DE