TWI552002B - 公共雲資源動態配置方法及系統 - Google Patents

公共雲資源動態配置方法及系統 Download PDF

Info

Publication number
TWI552002B
TWI552002B TW103114547A TW103114547A TWI552002B TW I552002 B TWI552002 B TW I552002B TW 103114547 A TW103114547 A TW 103114547A TW 103114547 A TW103114547 A TW 103114547A TW I552002 B TWI552002 B TW I552002B
Authority
TW
Taiwan
Prior art keywords
server
area
servers
level
reduction
Prior art date
Application number
TW103114547A
Other languages
English (en)
Other versions
TW201541260A (zh
Inventor
丁韋智
王濬哲
陳家旻
黃俊龍
Original Assignee
財團法人工業技術研究院
國立交通大學
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 財團法人工業技術研究院, 國立交通大學 filed Critical 財團法人工業技術研究院
Priority to TW103114547A priority Critical patent/TWI552002B/zh
Priority to CN201410244947.7A priority patent/CN105007287B/zh
Priority to US14/511,647 priority patent/US20150304176A1/en
Publication of TW201541260A publication Critical patent/TW201541260A/zh
Application granted granted Critical
Publication of TWI552002B publication Critical patent/TWI552002B/zh

Links

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • H04L67/1001Protocols in which an application is distributed across nodes in the network for accessing one among a plurality of replicated servers
    • H04L67/1031Controlling of the operation of servers by a load balancer, e.g. adding or removing servers that serve requests
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/50Network services
    • H04L67/51Discovery or management thereof, e.g. service location protocol [SLP] or web services
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5083Techniques for rebalancing the load in a distributed system
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0283Price estimation or determination
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/50Network service management, e.g. ensuring proper service fulfilment according to agreements
    • H04L41/5041Network service management, e.g. ensuring proper service fulfilment according to agreements characterised by the time relationship between creation and deployment of a service
    • H04L41/5054Automatic deployment of services triggered by the service manager, e.g. service implementation by automatic configuration of network components
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/10Protocols in which an application is distributed across nodes in the network
    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/44Arrangements for executing specific programs
    • G06F9/455Emulation; Interpretation; Software simulation, e.g. virtualisation or emulation of application or operating system execution engines
    • G06F9/45533Hypervisors; Virtual machine monitors
    • G06F9/45558Hypervisor-specific management and integration aspects
    • G06F2009/4557Distribution of virtual machine instances; Migration and load balancing

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Strategic Management (AREA)
  • Physics & Mathematics (AREA)
  • Development Economics (AREA)
  • General Physics & Mathematics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Economics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • General Business, Economics & Management (AREA)
  • Game Theory and Decision Science (AREA)
  • Human Resources & Organizations (AREA)
  • General Engineering & Computer Science (AREA)
  • Marketing (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Tourism & Hospitality (AREA)
  • Educational Administration (AREA)
  • Computer And Data Communications (AREA)

Description

公共雲資源動態配置方法及系統
本揭露係關於一種公共雲(public cloud)資源動態配置方法及系統。
網路直播服務如雨後春筍般發展,使用者可以經由網路即時觀賞影片直播,例如遊戲類、娛樂類、新聞類、體育節目類、科技類等。隨著普及的網路直播串流,即時串流服務需要大量且穩定的頻寬。同儕網路的串流影音技術利用網路中各節點間互相分享資料的方法,來增加串流傳輸的效率。在同儕網路中,使用者數目的波動、使用者設備的不良、使用者設備的頻寬的不足、使用者設備距離機房太遠等因素,可能使得即時串流服務網提供的串流品質不穩定。結合伺服器與同儕網路的架構利用分散式伺服器提供穩定的串流輸出來維持使用者的觀看品質。
隨著普及的行動裝置,例如手持式攝影裝置,使用者可 以是串流提供者。不論是播放者或是觀看者,都可以隨時隨地的播放與觀看。此趨勢下,串流平台對於伺服器需求量的負擔將不斷增加,服務業者搭配公共雲業者在公共雲建置分散式伺服器,利用伺服器做為轉繼站(relay),來符合彈性化的需求。例如,預先評估使用網路直播服務的可容納的最大上線人數,以及事先建立數量足夠的虛擬機器(virtual Machines,VM)如雲端伺服器。
即使能夠預估網路直播服務的使用者的數量與行為,要滿足如尖峰時段時的使用者的觀看品質,需要建立龐大數量的伺服器來進行待命。在不確定影響範圍的情境下,例如在離峰時段,難以預估使用者數量以及觀看行為的狀況下,需要人員密切注意雲端伺服器的連線情形,也不適合將閒置的伺服器貿然關閉。在轉播工作中,也會發現一些雲端伺服器連線數不多,形同空轉的狀況。此類因伺服器閒置所造成的巨額維運成本也日漸擴大。因此,如何建立自動維運機制才能兼顧使用者觀看品質以及所耗成本最小的彈性伺服器擴充及關閉,已成為一個重要的議題。
雲端伺服器的擴展可以透過垂直擴展(Vertical scaling)以及水平擴展(Horizontal scaling)。垂直擴展是更改伺服器的硬體資源,例如提高中央處理單元(CPU)/記憶體/頻寬等的等級,而伺服器的數量不變。水平擴展是增減伺服器的數量, 而規格不變,例如透過租賃者預先設定好的範本、伺服器映像檔、或是預設指令腳本,建立許多與標的物同樣規格的虛擬伺服器。目前有些業者需要由租賃者預先將伺服器設為自動擴展(auto-scaling)群組,只有在群組內的伺服器擁有自動擴展功能。有的業者提供服務業者針對不同等級的雲端進行效能評測(benchmarking)。實現方法可採用量測服務的完成時間,來釐清性價比(performance cost ratio)最佳的伺服器等級(instance type),再藉由訂定政策(policy)實現自動擴展,其政策可基於門檻值觸發、或是固定時間觸發。
現有的伺服器動態增減技術可分成兩類。一類是公共雲業者提供以基礎架構層次(infrastructure-level)為主的反應式(reactive)動態增減,來服務廣大租賃者。此類技術量測目前伺服器的/記憶體/網路使用狀況等,並且有多種指標供租賃者自由選擇。達到門檻值來判斷增減,門檻值可以由使用者(公共雲租賃者)自行設定,或採用預設最佳實務設定。一旦達到其門檻值,透過負載平衡器(load balancer)調配每一伺服器的服務量。另一類是租賃者基於其自身應用的特性,判斷應用層等級(application-level)的服務壓力,透過公共雲業者的編程介面(Application Programming Interface,API)設定企業邏輯,此類大部分是主動式(proactive)技術。技術的參考指標可以是佇列(queue)中待處理資料的數量、平均回應時間、使用者連線數量(number of connections)等。
有一技術提供緊密整合的自動化管理,包括跨雲自動化管理,讓使用者設定各種範本、巨集、腳本等,觀察指標可以排入一陣列,對於增減的邏輯則由租賃者自行判斷。有一技術提出主動式的人工神經網絡訓練的二維矩陣,判斷是否增減伺服器。有一技術認為網頁文件存取有其固定的導覽路線,要找出當中壓力最重的路線進行伺服器擴展。有一技術解決兩層式應用服務,此技術透過一鏈結系統(linkage system)去觀察第一層的反應效能,以決定第二層是否開始擴展(scale-up)。有一技術根據目前虛擬機器(VMs)的總體流量狀態,控制負載平衡器調配負載至其他伺服器。有些技術指出可以根據計費週期來關閉機器。
有一技術考慮違反服務層級協議(Service Level Agreement,SLA)付出的代價與節省經費兩者之間的最佳平衡點。此技術用在多層(multi-tier)的應用,並且基於應用的容量做擴展以及預測系統所需的容量,同時考慮成本模型(cost model)與資源模型(resource model),所有的要求(requests)都會經由閘道器與負載平衡器。大部份的虛擬機器(VM)具有相同的一般資源配置,其中一部分的虛擬機器具有較低的資源配置。當應用的容量需要擴展(scale up)時,將較低配置的虛擬機器垂直擴展至一般資源配置。當應用的容量需要縮減(scale down)時,進行垂直擴展或水平擴展至較低的資源配 置。
在上述現行的伺服器動態增減技術中,有的技術未評估關閉伺服器後,對於服務提供商的衝擊。有的技術只根據前一台伺服器的狀態,從一群機器中任意選一台關閉。有的技術無法透過負載平衡器來完全控制用戶向誰取得資料。有的技術未充分利用公共雲的特性於節省費用,例如未充分利用不同資料中心的位置與價格並不相同、公共雲的租用計費週期不足1小時仍以1小時計算、串流服務商可以利用多個公共雲服務商的雲端伺服器等特性。因此,如何建立公共雲的自動維運機制來兼顧服務品質以及所耗成本最小的彈性伺服器擴充與縮減,是值得研究的議題。
本揭露的實施例可提供一種公共雲資源動態配置方法及系統。
本揭露的一實施例是關於一種公共雲資源動態配置方法。此方法可包含:藉由一負載監視器(Load Monitor),取得一目前伺服器配置,該目前伺服器配置至少包括多台伺服器的各伺服器的身份資訊(Identity Information),以及該多台伺服器的各伺服器的一目前連線數(current number of connections)、一伺服器等級(level)、以及一所在區域(located area);藉由一擴展與縮減引擎(Scaling Engine),判斷該多台伺服器中是否有符合至少一觸發條件(trigger condition)的至少一伺服器;藉由該擴展與縮減引擎,將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合(server candidate set);以及藉由該擴展與縮減引擎,接收一性價比資訊,並且根據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序。
本揭露的另一實施例是關於一種公共雲資源動態配置系統。此系統包含一負載監視器、以及一擴展與縮減引擎。 此負載監視器取得一目前伺服器配置,該目前伺服器配置至少包括多台伺服器的各台伺服器的身份資訊,以及該多台伺服器的各伺服器的一目前連線數、一伺服器等級、以及一所在區域。此擴展與縮減引擎判斷該多台伺服器中是否有符合至少一觸發條件的至少一伺服器;將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合;以及接收一性價比資訊,並且根據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序。
茲配合下列圖示、實施例之詳細說明及申請專利範圍,將上述及本發明之其他優點詳述於後。
S、M、L、XL、CC2.8XL‧‧‧伺服器等級
t‧‧‧門檻值
210‧‧‧一計費週期
A、C、D‧‧‧候選者伺服器
310‧‧‧藉由一負載監視器,取得一目前伺服器配置,該目前伺服器配置至少包括多台伺服器的各伺服器的身分資訊,以及該多台伺服器的各伺服器的一目前連線數、一伺服器等級、以及一所在區域
320‧‧‧藉由一擴展與縮減引擎,判斷該多台伺服器中是否有符合至少一觸發條件的至少一伺服器
330‧‧‧藉由該擴展與縮減引擎,將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合
340‧‧‧藉由該擴展與縮減引擎,接收一性價比資訊,並且根據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序
400‧‧‧公共雲資源動態配置系統
410‧‧‧負載監視器
420‧‧‧擴展與縮減引擎
422‧‧‧伺服器候選者集合
424‧‧‧性價比資訊
426‧‧‧伺服器擴展或縮減程序
412‧‧‧目前伺服器配置
430‧‧‧伺服器擴展或縮減指令
610‧‧‧接收性價比資訊,此性價比資訊至少包含該至少一區域的各區域內各伺服器等級各自對應的每條連線的單位價格的資訊、以及該區域內各伺服器等級各自對應的最大連線數的資訊
620‧‧‧根據此性價比資訊,計算一目標配置,從而產生該至少一區域的各區域內各伺服器等級各自對應的一伺服器數量
630‧‧‧發出一或多個伺服器擴展或縮減指令,調整該至少一區域的各區域中各伺服器等級對應的伺服器數量至該目標配置中各伺服器等級各自對應的伺服器數量
710‧‧‧將該伺服器候選者集合中該區域中所有伺服器的目前連線數的總合做為一未分派連線數
720‧‧‧根據該區域內各伺服器等級各自對應的每條連線的單位價格、該區域內各伺服器等級各自對應的最大連線數、以及該未分派連線數,分配該區域內各伺服器等級各自對應的一目標伺服器數量
910‧‧‧計算一服務容量與一目前總連線數,其中服務容量=該伺服器候選者集合中所有伺服器的伺服器等級對應的最大連線數的總合,目前總連線數=該伺服器候選者集合中所有伺服器的目前連線數的總合
920‧‧‧依照該伺服器候選者集合中所有伺服器的閒置率由高至低排序
930‧‧‧從閒置率最高的伺服器開始,當該服務容量與該伺服器的伺服器等級對應的最大連線數相減後的差大於等於該目前總連線數時,判定關閉該伺服器
940‧‧‧當該服務容量與該伺服器的伺服器等級對應的最大連線數相減後的差小於該目前總連線數時,判定不關閉該伺服器
1010‧‧‧曲線,代表原始方法所產生的跨區域百分比
1020‧‧‧曲線,代表考慮t值的跨區域百分比
1030‧‧‧曲線,代表原始方法的節省費用比
1040‧‧‧曲線,代表考慮t值的節省費用比
第一圖是根據本揭露的一實施例,定義公共雲的租賃費用率的一範例。
第二圖是根據本揭露的一實施例,說明伺服器縮減的觸發時機的一示意圖。
第三圖是根據本揭露的一實施例,說明一種公共雲資源動態配置方法。
第四A圖是根據本揭露的一實施例,說明一種公共雲資源動態配置系統。
第四B圖是根據本揭露的一實施例,說明第四A圖之系統的一應用情境的範例。
第四C圖是根據本揭露的一實施例,說明以封包的往返時間來劃分區域的一範例。
第五A圖是根據本揭露的一實施例,說明一區域的各伺服器等級對應的每條連線的單位價格的資訊的一範例。
第五B圖是根據本揭露的一實施例,說明一區域的各伺服器等級對應的最大連線數的資訊的一範例。
第六圖是根據本揭露的一實施例,說明至少一區域的各區域內的伺服器擴展或縮減的運作流程。
第七圖是根據本揭露的一實施例,說明如何計算一目標配置的運作。
第八A圖與第八B圖是根據本揭露的一實施例,舉一範例說明一區域內的伺服器擴展或縮減,其中,第八A圖是調整前,該區域內各伺服器的狀態資訊;第八B圖是調整後, 該區域內各伺服器的狀態資訊。
第九圖將是根據本揭露的一實施例,說明跨區域的伺服器縮減的運作流程。
第十圖是根據本揭露的一實施例,說明t值的選擇、與跨區域百分比、節省費用比,之間的關係。
以下,參考伴隨的圖式,詳細說明依據本揭露的實施例,俾使本領域者易於瞭解。所述之發明創意可以採用多種變化的實施方式,當不能只限定於這些實施例。本揭露省略本領域者已熟知部分(well-known part)的描述,並且相同的參考號於本揭露中代表相同的元件。
依據本揭露的實施例,提供一種公共雲資源動態配置方法及系統。其技術蒐集目前服務在一或多個公共雲所有伺服器的配置狀態,考量對租賃者(向公共雲業者租賃機器者)的服務在公共雲上進行效能測量,從而了解如各等級之伺服器的連線數、以及所在區域等,而一公共雲有至少一伺服器。第一圖是根據本揭露的一實施例,定義公共雲的租賃費用率的一範例。在第一圖的範例中,可依伺服器等級(instance type)定義五種等級(即小、中、大、超大、CPU增強,分別記為等級S、等級M、等級L、等級XL、等級CC2.8XL)的租賃費用率。例如,等級S的租賃費用率為每小時0.060元,等 級M的租賃費用率為每小時0.120元,等級L的租賃費用率為每小時0.240元,等級XL的性價比為每小時0.480元,等級CC2.8XL的性價比為每小時1.920元。
租賃者根據這些伺服器的連線數,可計算各等級的伺服器的性價比。租賃者可根據其服務的需求,設定至少一觸發條件,依據本揭露的一實施例,符合觸發條件的伺服器可被加入於一伺服器候選者集合;當符合該觸發條件的情況發生時,可根據輸入的性價比資訊、以及該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序。
依據本揭露的實施例,此至少一觸發條件可被設定為有一伺服器的一或多種運行狀態已達到一門檻值時觸發、以一排程方式於一整點時觸發、有一伺服器已達到距離一計費週期的一結尾的一時間區間內時觸發、一固定時段週期性地觸發,之前述一種或一種以上的觸發條件任意組合。例如,此至少一觸發條件可設定有一伺服器的CPU、記憶體、頻寬等的所謂的閒置率或資源利用率已達到門檻值時觸發,或是以排程方式於整點觸發,或是有一伺服器接近一計費週期的結尾時觸發,或是每分鐘觸發。而閒置率一般可定義為數值1減去資源利用率。
在本揭露中,根據一實施範例,性價比的定義是平均每 條連線所需的單位價格(unit price)。第五A圖是根據本揭露的一實施例,定義性價比的一應用範例。在第五A圖的範例中,可依伺服器等級(instance type)定義五種等級(即小、中、大、超大、CPU增強,分別記為等級S、等級M、等級L、等級XL、等級CC2.8XL)的性價比,其每條連線的單位價格。例如,等級S的性價比為每小時0.0012元,等級M的性價比為每小時0.0010元,等級L的性價比為每小時0.0008元,等級XL的性價比為每小時0.0006元,等級CC2.8XL的性價比為每小時0.0024元。在第五B圖的範例中,其中等級S的最大連線數為50台伺服器,等級M的最大連線數為120台伺服器,等級L的最大連線量為300台伺服器,等級XL的最大連線數為800台伺服器,等級CC2.8XL的最大連線數為800台伺服器。伺服器例如可以是虛擬機器、主機等的其中一種或一種以上的組合。對於租賃者,各等級的伺服器的性價比需要做效能評測,性價比越高越好。
如之前所述,當判斷出有已符合至少一觸發條件的伺服器時,可根據輸入的性價比資訊,以及伺服器候選者集合進行至少一區域的擴展或縮減程序。擴展伺服器的範例,譬如可以在某一區域增加一台高性價比的伺服器、或是增加一台等級最小的伺服器、或是增加一台等級最大的伺服器、或是增加一台各等級中最大連線數最大的伺服器,然後等待下一次的觸發。縮減伺服器的範例,譬如可將資源利用率較低的 伺服器關閉,或是將低性價比的伺服器關閉,讓使用者分散到其他高性價比的伺服器去。
當使用者隨時間的經過而逐漸減少,閒置的伺服器將因而增加。根據本揭露一實施例,可將低性價比的伺服器關閉,讓使用者分散到其他高性價比的伺服器去,以節省多餘的伺服器的成本花費。擴展或縮減伺服器的觸發的時間點,譬如可以採用如CPU、記憶體、頻寬等的閒置率已達到門檻值(例如,以CPU的閒置率(idle rate)為80%與20%分別作為上限門檻值與下限門檻值)時觸發,或是以排程方式於整點觸發,或是有任何一台伺服器接近計費週期結尾時觸發,或是每分鐘觸發。觸發時可以考慮將目前所有的伺服器全部列入伺服器候選者集合、或是考慮將該伺服器是否已接近其計費週期的結尾才列入伺服器候選者集合。第二圖是根據本揭露的一實施例,說明伺服器縮減的觸發時機的一示意圖,其中一伺服器的一計費週期如標號210所示。
在第二圖中,係考慮將一或多台使用中已接近其計費週期(billing cycle)結尾的伺服器列入要被關閉的候選者(reducing candidate)集合,其實施方式例如可設定一門檻值t,並且將離計費週期t分鐘內即將完成一計費週期的一或多台伺服器列入伺服器候選者集合。在第二圖的範例中,根據此門檻值t,伺服器A、伺服器C、以及伺服器D都是接 近其計費週期結尾的伺服器候選者。因此,伺服器A、伺服器C、以及伺服器D也可以觸發伺服器縮減(server reduction)。也就是說,根據本揭露的實施例,可採用條件式觸發來產生伺服器擴展或縮減程序。
第三圖是根據本揭露的一實施例,說明一種公共雲資源動態配置方法。參考第三圖,此方法可包含:藉由一負載監視器,取得一目前伺服器配置,該目前伺服器配置至少包括多台伺服器的各伺服器的身份資訊,以及該多台伺服器的各伺服器的一目前連線數、一伺服器等級、以及一所在區域(步驟310);藉由一擴展與縮減引擎,判斷該多台伺服器中是否有符合至少一觸發條件的至少一伺服器(步驟320);藉由該擴展與縮減引擎,將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合(步驟330);以及藉由該擴展與縮減引擎,接收一性價比資訊,並且根據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序(步驟340)。挑選自該目前伺服器配置中的該至少一伺服器的該伺服器候選者集合,其中也包括了每一伺服器的身份資訊、一目前連線數、一伺服器等級、以及一所在區域等資訊。
依此,根據本揭露的一實施例,一種公共雲資源動態配置系統400可如第四A圖所示。系統400可包含一負載監視器410、以及一擴展與縮減引擎420。此負載監視器410取 得一目前伺服器配置412,該目前伺服器配置至少包括多台伺服器的各伺服器的身份資訊,以及該多台伺服器的各伺服器的一目前連線數、一伺服器等級、以及一所在區域。此擴展與縮減引擎420判斷該至少一伺服器中是否有符合至少一觸發條件的至少一伺服器;將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合422;以及接收一性價比資訊424,並且根據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序426。挑選自該目前伺服器配置中的該至少一的伺服器候選者集合,此其中也包括了每一伺服器的的身份資訊、一目前連線數、一伺服器等級、以及一所在區域等資訊。
第四B圖是根據本揭露的一實施例,說明第四A圖之系統的一應用情境的範例。在第四B圖的範例中,負載監視器410可取得一或多個公共雲上的一目前伺服器配置,此目前伺服器配置例如是位於多個不同區域(例如新加坡、日本、美國、巴西、…)的多台伺服器的目前狀態資訊,此狀態資訊包括至少此多台伺服器的每一伺服器的身分資訊、目前連線數、伺服器等級、以及所在區域等的狀態資訊。身分資訊可為例如是一伺服器代號,用以區分不同的伺服器。擴展與縮減引擎420從負載監視器410取得這些狀態資訊,當此多台伺服器中有符合觸發條件者(例如位於新加坡的伺服器),擴展與縮減引擎420可對位於此區域(新加坡)的伺服器 可藉由,但不限定是發出一或多個伺服器擴展或縮減指令(scaling commands)430,以執行伺服器擴展或縮減程序426,將成本效益較低的伺服器關閉,令使用者分散到其他成本效益較高的伺服器去。其中縮減指令例如是「aws ec2 terminate-instances」。其中擴展指令例如是「aws ec2 run-instances」、「aws ec2 terminate-instances」、「aws ec2 modify-instance-attribute」這三種的其中之一或二或三種的任意組合。根據本揭露的實施例,公共雲資源動態配置系統400可在單一公共雲上運行,也可以跨越在多個公共雲上運行。
本揭露所謂的「區域(area)」,可以是以地理位置(geographical location)來劃分的區域、或是以封包的往返時間(Round Trip Time,RTT)來劃分的區域。第四C圖是根據本揭露的一實施例,說明以封包的往返時間來劃分區域的一範例。在第四C圖的範例中,有六個在不同所在位置的雲端中心(記為雲端中心431~雲端中心436),其中雲端中心431~雲端中心433的各雲端中心的封包的往返時間皆小於等於120毫秒(即RTT≦120ms),而雲端中心434~雲端中心436的各雲端中心的封包的往返時間皆小於等於500毫秒且大於等於120毫秒(即120ms<RTT≦500ms),依此,雲端中心431~雲端中心433被劃分在區域441,而雲端中心434~雲端中心436被劃分在區域442。
根據本揭露的實施例,性價比資訊至少包含該至少一區域的各區域的各伺服器等級對應的每條連線的單位價格的資訊、以及該至少一區域的各區域的各伺服器等級對應的最大連線數的資訊。第五A圖是根據本揭露的一實施例,說明一區域的各伺服器等級對應的每條連線的單位價格的資訊的一範例。第五A圖的範例說明了並非越高等級的伺服器的單位成本越便宜,可由租賃者自行進行各等級的效能評測,例如租用最貴的叢集CPU等級的伺服器可能對於多媒體的應用毫無幫助,其性價比會非常低。一般而言,因為頻寬的關係會在較高伺服器等級如L、XL等級得到較高的性價比。某些服務消耗記憶體非常大,此時可以選針對記憶體優化的伺服器等級的性價比較高。第五B圖是根據本揭露的一實施例,說明該區域的各伺服器等級對應的最大連線數的資訊的一範例。
根據本揭露的一實施例,伺服器擴展或縮減程序可以分為兩階段,第一階段是區域內(inter-area)的伺服器擴展或縮減,第二階段是跨區域(intra-area)的伺服器縮減。也就是說,當有符合至少一觸發條件的伺服器時,先對該至少一區域的各區域內執行一伺服器擴展或縮減後,再執行一跨區域的伺服器縮減。根據本揭露的實施例,此兩階段的伺服器擴展或縮減程序,第一階段在不造成跨區域連線的前提之下,先把 所有區域的每一區域內各自的伺服器運行成本縮減到最低,以減少大部分的跨區域連線,讓大部分的使用者都能經由同區域的伺服器提供連線,第二階段的伺服器縮減可能造成少部分的使用者必須由跨區域的伺服器提供連線。此伺服器擴展或縮減程序從而能夠在節省伺服器成本以及滿足使用者品質(減少跨區域連線)上達成平衡。
第六圖是根據本揭露的一實施例,說明至少一區域的各區域內的伺服器擴展或縮減的運作流程。參考第六圖,擴展與縮減引擎420接收一性價比資訊,此性價比資訊至少包含該至少一區域的各區域內各伺服器等級各自對應的每條連線的單位價格的資訊、以及該至少一區域的各區域內各伺服器等級各自對應的最大連線數的資訊(步驟610);根據此性價比資訊,計算一目標配置,從而產生該至少一區域的各區域內各伺服器等級各自對應的一伺服器數量(步驟620);以及發出一或多個伺服器擴展或縮減指令,調整該至少一區域的各區域中各伺服器等級對應的伺服器數量至該目標配置中各伺服器等級各自對應的伺服器數量(步驟630)。當需要從多個相同等級的伺服器中關閉其中至少一伺服器時,可優先考量,但不限定是,關閉該多個相同等級的伺服器中目前連線數最少的伺服器。
第七圖是根據本揭露的一實施例,說明如何計算一區域 的一目標配置的運作。參考第七圖,擴展與縮減引擎420將該伺服器候選者集合中該區域中所有伺服器的目前連線數的總合做為一未分派連線數(步驟710);並且根據該區域內各伺服器等級各自對應的每條連線的單位價格、該區域內各伺服器等級各自對應的最大連線數、以及該未分派連線數,分配該區域內各伺服器等級各自對應的一目標伺服器數量(步驟720)。一伺服器等級對應的每條連線單位價格越低,其性價比越高。計算一伺服器等級對應的該目標伺服器數量有多種方式,以下的公式是其中的一個範例。
一伺服器等級對應的目標伺服器數量=該未分派連線數/該伺服器等級對應的最大連線數;以及,更新該未分派連線數如下:該未分派連線數=該未分派連線數Mod該伺服器等級對應的最大連線數;其中,Mod是一模數運算。
在步驟720中,有多種實施方式可分配該區域內各伺服器等級各自對應的該目標伺服器數量。例如根據一實施例,可由該區域內多台伺服器等級對應的一最低的單位價格至一最高的單位價格高,依序地分配該區域內各伺服器等級各自對應的該目標伺服器數量。假設將距離一計費週期(60分鐘)結束t分鐘內的伺服器加入一伺服器候選者集合,或將 所有伺服器皆加入關閉的伺服器候選者集合(即t=60)。則一區域內的伺服器擴展或縮減程序可運作如下。加總該伺服器候選者集合內所有伺服器的連線數做為一未分派連線數。依序從性價比高(伺服器等級對應的每條連線單位價格最低)的伺服器等級開始分配連線數。例如,XL等級的伺服器其性價比最高並且假設最多可以支援800條連線,則先分配[未分派連線數/800]台XL等級的伺服器。分配後,將該未分派連線數更新為[未分派連線數Mod 800]。當更新後的未分派連線數尚未歸零時,再繼續分配下一等級伺服器的目標伺服器數量,直到該未分派連線數成為零。若該未分派連線數小於該伺服器等級對應的最大連線數,該目標伺服器數量加1。欲積極節費的租賃者可調整公式為放棄該未分派連線數,使用該目標伺服器數量。有多種實施方式可在此進行微調,仍不違背由性價比高的伺服器開始分配之精神。此時已完成一區域的目標配置(包含該區域內各伺服器等級對應的伺服器數量)。根據該目標配置與該區域內目前的伺服器配置數量上的差異進行調整,此時可能會增加或減少各種等級的伺服器。當需要增加伺服器時,可直接增加;當需要關閉伺服器時,可採用,但不限定於,一最小編輯距離(minimum edit distance;Levenshtein)為原則來進行伺服器數量的調整,其依據為目前使用該伺服器的連線數。舉例來說,若有兩台同樣是XL等級的伺服器要關閉其中一台伺服器,此時可選擇目前連線數較少的那台伺服器。
依據上述的實施例,第八A圖與第八B圖舉一範例說明一區域內的伺服器擴展或縮減程序,其中,假設一伺服器候選者集合中一區域內總共有1628使用者之連線。第八A圖是調整前,該區域內各伺服器的狀態資訊。租賃者經過效能評測後,認為XL等級伺服器之性價比較高,優先將連線數分派給XL等級的伺服器,並且根據上述目標配置的運作流程及求得目標伺服器數量的公式範例,計算出該區域內的的目標配置是2台XL等級的伺服器、以及1台S等級的伺服器。
根據此目標配置與該區域內目前的伺服器配置數量上的差異,因此,應關閉一台XL等級的伺服器、一台L等級的伺服器、以及一台S等級的伺服器。縮減伺服器時,可考慮同等級伺服器中具有最小編輯距離者,例如,目前的XL等級的伺服器共有三台可選,可從中選擇關閉目前連線人數最低的XL等級的伺服器,因而關閉伺服器代號為i-PSRHEDNF的XL等級的伺服器(XL等級的伺服器中目前連線數最低者)、伺服器代號為i-PHAQQQYT的L等級的伺服器、以及伺服器代號為i-KGMUCWEE的S等級的伺服器(S等級的伺服器中目前連線數最低者),如第八B圖所示之調整後,該區域內各伺服器的狀態資訊,其中刪除線表示關閉該伺服器。
根據本揭露的一實施例,第二階段的跨區域的伺服器縮減係依據伺服器候選者集合422中所有伺服器的閒置率或資源利用率以進行縮減,譬如可依照這些伺服器的閒置率由高至低排序或資源利用率由低至高排序,依序進行縮減。一伺服器的資源利用率計算方法,其中的一個範例如以下的公式:資源利用率=該伺服器的目前連線數與該伺服器對應的伺服器等級所對應的最大連線數的比值。
第九圖將是根據本揭露的一實施例,說明跨區域的伺服器縮減的運作流程。
參考第九圖,擴展與縮減引擎420計算一服務容量與一目前總連線數,其中服務容量=該伺服器候選者集合中所有伺服器的伺服器等級對應的最大連線數的總合,目前總連線數=該伺服器候選者集合中所有伺服器的目前連線數的總合(步驟910);依照該伺服器候選者集合中所有伺服器的閒置率由高至低排序(步驟920);然後,從閒置率最高的一伺服器開始依次進行判定,當該服務容量與該伺服器的伺服器等級對應的最大連線數相減後的差大於等於該目前總連線數時,擴展與縮減引擎420判定關閉該伺服器(步驟930)。當該服務容量與該伺服器的伺服器等級對應的最大連線數相減後的 差小於該目前總連線數時,擴展與縮減引擎420判定不關閉該伺服器(步驟940)。直到該伺服器候選者集合中不再有伺服器可以被關閉。
也就是說,跨區域的伺服器縮減可依據該伺服器候選者集合中所有伺服器的伺服器等級對應的最大連線數的總合、該伺服器候選者集合中所有伺服器的目前連線數的總合、以及各伺服器等級所對應的最大連線數,判定是否關閉該伺服器。
根據本揭露實施例的公共雲資源動態配置技術,於第二階段經過跨區域縮減後才會產生跨區域連線,若租賃者不希望產生任何跨區域連線,可以設定擴展與縮減引擎420不執行跨區域的伺服器縮減階段,但是獲得較差的節費效果。第十圖是根據本揭露的一實施例,說明t值的選擇、與跨區域百分比、節省費用比,之間的關係。其中,橫軸代表t值(單位:分鐘),橫軸代表百分比。曲線1010代表觸發時不考慮t值而將所有伺服器全部列入伺服器候選者集合的一種原始方法所產生的跨區域百分比,曲線1020代表只將距離計費週期結尾t分鐘內的伺服器列入伺服器候選者集合的跨區域百分比,曲線1030代表該原始方法的節省費用比,曲線1040代表考慮t值時的節省費用比。
參考第十圖,從曲線1040可以看出,t值的選擇越高,跨區域的伺服器縮減所產生的節省費用效果越強;其代價是所產生的跨區域連線數也越高。若t值設為60分鐘表示所有伺服器都被列入考慮關閉的伺服器候選者集合即等同於該原始方法。假如t值選擇為5分鐘,則節省費用效果很差,若t值增加為10分鐘,則節省費用效果很明顯提升近1倍。當t值選擇為35分鐘以上開始出現節省費用的邊際效益遞減。
綜上所述,依據本揭露的實施例提供一種公共雲資源動態配置方法及系統。其技術利用一負載監視器,取得公共雲上的一目前伺服器配置,提供給一擴展與縮減引擎。此擴展與縮減引擎採用條件觸發式產生伺服器縮減事件,並且可動態調整各等級伺服器的目標伺服器數量,從而降低伺服器的運行成本並維持租賃者的服務品質。此技術可在單一公共雲上運行,也可以跨越在多個公共雲上運行。
以上所述者僅為依據本揭露的實施範例,當不能依此限定本揭露實施之範圍。即大凡發明申請專利範圍所作之均等變化與修飾,皆應仍屬本揭露專利涵蓋之範圍。
310‧‧‧藉由一負載監視器,取得一目前伺服器配置,該目前伺服器配置至少包括多台伺服器的各伺服器的身分資訊,以及該多台伺服器的各伺服器的一目前連線數、一伺服器等級、以及一所在區域
320‧‧‧藉由一擴展與縮減引擎,判斷該多台伺服器中是否有符合至少一觸發條件的至少一伺服器
330‧‧‧藉由該擴展與縮減引擎,將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合
340‧‧‧藉由該擴展與縮減引擎,接收一性價比資訊,並且根 據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序

Claims (19)

  1. 一種公共雲資源動態配置方法,包含:藉由一負載監視器,取得一目前伺服器配置,該目前伺服器配置至少包括多台伺服器的各伺服器的身分資訊,以及該多台伺服器的各伺服器的一目前連線數、一伺服器等級、以及一所在區域;藉由一擴展與縮減引擎,判斷該多台伺服器中是否有符合至少一觸發條件的至少一伺服器;藉由該擴展與縮減引擎,將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合;以及藉由該擴展與縮減引擎,接收一性價比資訊,並且根據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序。
  2. 如申請專利範圍第1項所述之方法,其中該性價比資訊至少包括該至少一區域的各區域內各伺服器等級各自對應的每條連線的單位價格的資訊、以及該至少一區域的各區域內各伺服器等級各自對應的最大連線數的資訊。
  3. 如申請專利範圍第1項所述之方法,其中執行該伺服器擴展或縮減程序是先對該至少一區域的各區域內執行一伺服器擴展或縮減後,再執行一跨區域的伺服器縮減。
  4. 如申請專利範圍第1項所述之方法,其中該至少一觸發條件被設定為有一伺服器的一或多種運行狀態已達到一門檻值時觸發、以一排程方式於一整點時觸發、有一伺 服器已達到距離一計費週期的一結尾的一時間區間內時觸發、一固定時段週期性地觸發,之前述一種或一種以上的觸發條件任意組合。
  5. 如申請專利範圍第2項所述之方法,其中該方法還包括:根據該性價比資訊,計算一目標配置,從而產生該至少一區域的各區域內各伺服器等級各自對應的一伺服器數量;以及發出一或多個伺服器擴展或縮減指令,調整目前該至少一區域的各區域中各伺服器等級對應的伺服器數量至該目標配置中各伺服器等級各自對應的伺服器數量。
  6. 如申請專利範圍第5項所述之方法,其中計算該目標配置還包括:將該伺服器候選者集合中該至少一區域的各區域中所有伺服器的目前連線數的總合做為一未分派連線數;以及根據該至少一區域的各區域內各伺服器等級各自對應的每條連線的單位價格、該至少一區域的各區域內各伺服器等級各自對應的最大連線數、以及該未分派連線數,分配該至少一區域的各區域內各伺服器等級各自對應的一目標伺服器數量。
  7. 如申請專利範圍第6項所述之方法,其中該方法係由該至少一區域的各區域內各伺服器等級各自對應的一最低的每條連線的單位價格至一最高的每條連線的單位價格,依序地分配該至少一區域的各區域內各伺服器等級 各自對應的該目標伺服器數量。
  8. 如申請專利範圍第1項所述之方法,其中當需要從多個相同等級的伺服器中關閉其中至少一伺服器時,被關閉的該至少一伺服器係該多個相同等級的伺服器中目前連線數最少的伺服器。
  9. 如申請專利範圍第3項所述之方法,其中該跨區域的伺服器縮減係將該伺服器候選者集合中所有伺服器依據該些伺服器的一閒置率或一資源利用率以進行縮減。
  10. 如申請專利範圍第9項所述之方法,其中該閒置率是數值1減去該資源利用率,該資源利用率是該伺服器的一目前連線數與該伺服器對應的一伺服器等級所對應的一最大連線數的比值。
  11. 如申請專利範圍第3項所述之方法,其中該跨區域的伺服器縮減係依據該伺服器候選者集合中所有伺服器的伺服器等級各自對應的最大連線數的總合、該伺服器候選者集合中所有伺服器的目前連線數的總合、以及一伺服器的伺服器等級所對應的最大連線數,判定是否關閉該伺服器。
  12. 一種公共雲資源動態配置系統,包含:一負載監視器,取得一目前伺服器配置,該目前伺服器配置至少包括多台伺服器的各伺服器的身分資訊,以及該多台伺服器的各伺服器的一目前連線數、一伺服器等級、以及一所在區域;以及 一擴展與縮減引擎,判斷該多台伺服器中是否有符合至少一觸發條件的至少一伺服器,將符合該至少一觸發條件的該至少一伺服器加入一伺服器候選者集合;以及接收一性價比資訊,並且根據該伺服器候選者集合,對至少一區域執行一伺服器擴展或縮減程序。
  13. 如申請專利範圍第12項所述之系統,其中當該至少一伺服器中有符合該至少一觸發條件的該至少一伺服器時,該擴展與縮減引擎對位於該至少一區域的該至少一伺服器發出一或多個伺服器擴展或縮減指令,以執行該伺服器擴展或縮減程序。
  14. 如申請專利範圍第12項所述之系統,其中該伺服器擴展或縮減程序分為兩階段,其中第一階段是區域內的伺服器擴展或縮減,第二階段是跨區域的伺服器縮減。
  15. 如申請專利範圍第12項所述之系統,其中該至少一觸發條件被設定為有一伺服器的一或多種運行狀態已達到一門檻值時觸發、以一排程方式於一整點時觸發、有一伺服器已達到距離一計費週期的一結尾的一時間區間內時觸發、一固定時段週期性地觸發,之前述一種或一種以上的觸發條件任意組合。
  16. 如申請專利範圍第12項所述之系統,其中該擴展與縮減引擎從該負載監視器取得該目前伺服器配置的資訊。
  17. 如申請專利範圍第12項所述之系統,其中該性價比資訊至少包括該至少一區域的各區域內各伺服器等級各 自對應的每條連線的單位價格的資訊、以及該至少一區域的各區域內各伺服器等級各自對應的最大連線數的資訊。
  18. 如申請專利範圍第12項所述之系統,其中該至少一伺服器是至少一虛擬機器以及至少一主機,的其中一種或一種以上的組合。
  19. 如申請專利範圍第12項所述之系統,其中該系統係在一或多個公共雲上運行。
TW103114547A 2014-04-22 2014-04-22 公共雲資源動態配置方法及系統 TWI552002B (zh)

Priority Applications (3)

Application Number Priority Date Filing Date Title
TW103114547A TWI552002B (zh) 2014-04-22 2014-04-22 公共雲資源動態配置方法及系統
CN201410244947.7A CN105007287B (zh) 2014-04-22 2014-06-04 公共云资源动态配置方法及系统
US14/511,647 US20150304176A1 (en) 2014-04-22 2014-10-10 Method and system for dynamic instance deployment of public cloud

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
TW103114547A TWI552002B (zh) 2014-04-22 2014-04-22 公共雲資源動態配置方法及系統

Publications (2)

Publication Number Publication Date
TW201541260A TW201541260A (zh) 2015-11-01
TWI552002B true TWI552002B (zh) 2016-10-01

Family

ID=54322939

Family Applications (1)

Application Number Title Priority Date Filing Date
TW103114547A TWI552002B (zh) 2014-04-22 2014-04-22 公共雲資源動態配置方法及系統

Country Status (3)

Country Link
US (1) US20150304176A1 (zh)
CN (1) CN105007287B (zh)
TW (1) TWI552002B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI755415B (zh) * 2016-11-08 2022-02-21 香港商阿里巴巴集團服務有限公司 雲端環境下應用集群資源分配的方法、裝置和系統

Families Citing this family (26)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9606826B2 (en) * 2014-08-21 2017-03-28 International Business Machines Corporation Selecting virtual machines to be migrated to public cloud during cloud bursting based on resource usage and scaling policies
JP2016081119A (ja) * 2014-10-10 2016-05-16 富士通株式会社 情報処理システム、情報処理システムの制御方法および制御装置の制御プログラム
US9848041B2 (en) * 2015-05-01 2017-12-19 Amazon Technologies, Inc. Automatic scaling of resource instance groups within compute clusters
TWI579710B (zh) * 2015-12-03 2017-04-21 Chunghwa Telecom Co Ltd Dynamic Load Balancing Service System Based on Dynamic Behavior of Customers
US10069869B2 (en) * 2016-05-17 2018-09-04 Amazon Technologies, Inc. Versatile autoscaling
US10693732B2 (en) 2016-08-03 2020-06-23 Oracle International Corporation Transforming data based on a virtual topology
US10389628B2 (en) 2016-09-02 2019-08-20 Oracle International Corporation Exposing a subset of hosts on an overlay network to components external to the overlay network without exposing another subset of hosts on the overlay network
US10412022B1 (en) 2016-10-19 2019-09-10 Amazon Technologies, Inc. On-premises scaling using a versatile scaling service and an application programming interface management service
US10409642B1 (en) 2016-11-22 2019-09-10 Amazon Technologies, Inc. Customer resource monitoring for versatile scaling service scaling policy recommendations
JP6885067B2 (ja) * 2017-01-16 2021-06-09 富士フイルムビジネスイノベーション株式会社 情報処理装置及び情報処理システム
US10462013B2 (en) * 2017-02-13 2019-10-29 Oracle International Corporation Implementing a single-addressable virtual topology element in a virtual topology
US10291507B2 (en) 2017-02-13 2019-05-14 Oracle International Corporation Implementing a virtual tap in a virtual topology
TWI615712B (zh) * 2017-05-25 2018-02-21 Matsushita Electric Taiwan Co Ltd 系統記憶體優化方法、能優化系統記憶體的電子裝置及電腦可讀取的記錄媒體
CN107911419A (zh) * 2017-10-26 2018-04-13 广州市雷军游乐设备有限公司 服务器组内扩容的方法、装置、存储介质和系统
US10893000B2 (en) * 2017-11-21 2021-01-12 International Business Machines Corporation Diagonal scaling of resource allocations and application instances in a distributed computing environment
US10733015B2 (en) 2017-11-21 2020-08-04 International Business Machines Corporation Prioritizing applications for diagonal scaling in a distributed computing environment
US10635501B2 (en) 2017-11-21 2020-04-28 International Business Machines Corporation Adaptive scaling of workloads in a distributed computing environment
US10721179B2 (en) 2017-11-21 2020-07-21 International Business Machines Corporation Adaptive resource allocation operations based on historical data in a distributed computing environment
US10812407B2 (en) 2017-11-21 2020-10-20 International Business Machines Corporation Automatic diagonal scaling of workloads in a distributed computing environment
US10887250B2 (en) 2017-11-21 2021-01-05 International Business Machines Corporation Reducing resource allocations and application instances in diagonal scaling in a distributed computing environment
US10664324B2 (en) * 2018-05-30 2020-05-26 Oracle International Corporation Intelligent workload migration to optimize power supply efficiencies in computer data centers
JP6962295B2 (ja) * 2018-08-23 2021-11-05 日本電信電話株式会社 ネットワーク管理装置、および、ネットワーク管理方法
US11256696B2 (en) * 2018-10-15 2022-02-22 Ocient Holdings LLC Data set compression within a database system
US11153375B2 (en) * 2019-09-30 2021-10-19 Adobe Inc. Using reinforcement learning to scale queue-based services
US10915379B1 (en) * 2020-05-13 2021-02-09 Microsoft Technology Licensing, Llc Predictable distribution of program instructions
CN111405072B (zh) * 2020-06-03 2021-04-02 杭州朗澈科技有限公司 一种基于云厂家成本调度的混合云优化方法

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020184575A1 (en) * 1999-09-01 2002-12-05 Amnon Landan Post-deployment monitoring of server performance
US20030105868A1 (en) * 2001-12-04 2003-06-05 Kimbrel Tracy J. Dynamic resource allocation using known future benefits
US20090276771A1 (en) * 2005-09-15 2009-11-05 3Tera, Inc. Globally Distributed Utility Computing Cloud
CN102855171A (zh) * 2012-08-09 2013-01-02 浪潮电子信息产业股份有限公司 一种基于linux系统的CPI实时监测的方法

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8244827B2 (en) * 2007-12-19 2012-08-14 International Business Machines Corporation Transferring a logical partition (‘LPAR’) between two server computing devices based on LPAR customer requirements
US20110078303A1 (en) * 2009-09-30 2011-03-31 Alcatel-Lucent Usa Inc. Dynamic load balancing and scaling of allocated cloud resources in an enterprise network
US8909784B2 (en) * 2010-11-23 2014-12-09 Red Hat, Inc. Migrating subscribed services from a set of clouds to a second set of clouds
CN103248626B (zh) * 2013-05-07 2016-06-08 中国科学技术大学 一种信息传播方法及系统
US9473572B2 (en) * 2013-10-14 2016-10-18 International Business Machines Corporation Selecting a target server for a workload with a lowest adjusted cost based on component values
US10069906B2 (en) * 2014-04-29 2018-09-04 Hitachi, Ltd. Method and apparatus to deploy applications in cloud environments

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20020184575A1 (en) * 1999-09-01 2002-12-05 Amnon Landan Post-deployment monitoring of server performance
US20030105868A1 (en) * 2001-12-04 2003-06-05 Kimbrel Tracy J. Dynamic resource allocation using known future benefits
US20090276771A1 (en) * 2005-09-15 2009-11-05 3Tera, Inc. Globally Distributed Utility Computing Cloud
CN102855171A (zh) * 2012-08-09 2013-01-02 浪潮电子信息产业股份有限公司 一种基于linux系统的CPI实时监测的方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
TWI755415B (zh) * 2016-11-08 2022-02-21 香港商阿里巴巴集團服務有限公司 雲端環境下應用集群資源分配的方法、裝置和系統

Also Published As

Publication number Publication date
US20150304176A1 (en) 2015-10-22
TW201541260A (zh) 2015-11-01
CN105007287A (zh) 2015-10-28
CN105007287B (zh) 2018-11-06

Similar Documents

Publication Publication Date Title
TWI552002B (zh) 公共雲資源動態配置方法及系統
Ma et al. Dynamic task scheduling in cloud-assisted mobile edge computing
US9571347B2 (en) Reactive auto-scaling of capacity
CN107241384B (zh) 一种基于多云架构的内容分发服务资源优化调度方法
Sedaghat et al. A virtual machine re-packing approach to the horizontal vs. vertical elasticity trade-off for cloud autoscaling
Shi et al. MDP and machine learning-based cost-optimization of dynamic resource allocation for network function virtualization
KR20190038760A (ko) 클라우드 모니터링을 기반으로 한 부하 분산 최적화 방법 및 장치
CN109684074B (zh) 物理机资源分配方法及终端设备
US20110078303A1 (en) Dynamic load balancing and scaling of allocated cloud resources in an enterprise network
CN112311590B (zh) 云服务的租赁优化方法、装置、设备和介质
Tai et al. Ara: Adaptive resource allocation for cloud computing environments under bursty workloads
WO2019024445A1 (zh) 地理分布交互服务云资源协同优化方法
KR20120105212A (ko) 클라우드센터제어장치 및 그의 클라우드센터선택방법
WO2014127280A2 (en) System and method for network resource allocation considering user experience, satisfaction and operator interest
Kim et al. An energy-aware service function chaining and reconfiguration algorithm in NFV
CN102857548A (zh) 一种移动云计算资源优化配置方法
CN110442449A (zh) 一种资源调度方法和装置
Aksanli et al. Benefits of green energy and proportionality in high speed wide area networks connecting data centers
Metwally et al. A distributed auction-based framework for scalable IaaS provisioning in geo-data centers
CN107733805A (zh) 业务负载调度方法和装置
CN117687767A (zh) 一种资源规划的方法、装置及相关设备
CN109408230A (zh) 基于能耗优化的Docker容器部署方法及系统
Dong et al. An online cost-efficient transmission scheme for information-agnostic traffic in inter-datacenter networks
Yolken et al. Game based capacity allocation for utility computing environments
Zhang et al. PRMRAP: A proactive virtual resource management framework in cloud