亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频

蟲蟲首頁| 資源下載| 資源專輯| 精品軟件
登錄| 注冊

您現在的位置是:首頁 > 技術閱讀 >  高端文 | CPU負載均衡實現

高端文 | CPU負載均衡實現

時間:2024-02-12

在《一文讀懂 | 進程怎么綁定 CPU》這篇文章中介紹過,在 Linux 內核中會為每個 CPU 創建一個可運行進程隊列,由于每個 CPU 都擁有一個可運行進程隊列,那么就有可能會出現每個可運行進程隊列之間的進程數不一樣的問題,這就是所謂的 負載不均衡 問題,如下圖所示:

(圖1)

最極端的情況是,一個 CPU 的可運行進程隊列擁有非常多的進程,而其他 CPU 的可運行進程隊列為空,這就是著名的 一核有難,多核圍觀,如下圖:

(圖2)

為了避免這個問題的出現,Linux 內核實現了 CPU 可運行進程隊列之間的負載均衡。接下來,我們將會介紹 CPU 間的負載均衡的實現原理。

本文使用的內核版本為:Linux-2.6.23

CPU 間負載均衡原理

CPU 間負載不均衡的根本原因就是,CPU 的可運行進程隊列中的進程數量不均衡導致的。所以,要解決 CPU 間負載不均衡的方法就是:將最繁忙的 CPU 可運行進程隊列的一些進程遷移到其他比較空閑的 CPU 中,從而達到 CPU 間負載均衡的目的。

當然,在 2.6.0 版本的內核的確是這樣實現的,我們可以看看其實現代碼:

static void 
load_balance(runqueue_t *this_rq, int idle, cpumask_t cpumask)
{
    int imbalance, idx, this_cpu = smp_processor_id();
    runqueue_t *busiest;
    prio_array_t *array;
    struct list_head *head, *curr;
    task_t *tmp;

    // 1. 找到最繁忙的 CPU 運行隊列
    busiest = find_busiest_queue(this_rq, this_cpu, idle, &imbalance, cpumask);
    if (!busiest)
        goto out;
    ...

    head = array->queue + idx;
    curr = head->prev;

skip_queue:
    // 2. 從最繁忙運行隊列中取得一個進程
    tmp = list_entry(curr, task_t, run_list);
    ...

    // 3. 把進程從最繁忙的可運行隊列中遷移到當前可運行隊列中
    pull_task(busiest, array, tmp, this_rq, this_cpu);
    ...
}

load_balance 函數主要用于解決 CPU 間負載均衡問題,其主要完成以下 3 個步驟:

  • 從所有 CPU 的可運行隊列中找到最繁忙的可運行隊列。
  • 從最繁忙可運行隊列中取得一個進程。
  • 把進程從最繁忙的可運行隊列中遷移到當前可運行隊列中。

這是 2.6.0 版本的解決方案,但這個方案并不是最優的,因為現代 CPU 架構是非常復雜的,比如一個物理 CPU 有多個核心(多核),而每個核心又可以通過超線程(Hyper-Threading)來實現多個邏輯 CPU,如下圖所示:

(圖3)

如上圖所示,一個物理 CPU 中擁有 4 個核心,而每個核心又擁有 2 個超線程。在 Linux 內核中,會為每個超線程定義一個可運行進程隊列,所以 Linux 內核會為上面的 CPU 定義 8 個可運行進程隊列。

現在問題來了,在上面的 CPU 架構中,不同的可運行隊列之間的進程遷移代價是不一樣的。因為同一個核心的不同超線程共用了所有的緩存,所以同一個核心不同超線程間的進程遷移代價是最小的。

而同一個物理 CPU 不同核心間也會共用某些緩存,所以不同核心間的進程遷移的代價會比同一核心不同超線程間的進程遷移稍大。由于現在很多主板都支持安裝多個物理 CPU,而不同物理 CPU 間基本不會共用緩存,所以不同物理 CPU 間的進程遷移代價最大。如下圖所示(圖中的 L1、L2 和 L3 分別指一級、二級和三級緩存):

(圖4)

為了解決進程遷移成本的問題,新版本的 Linux 內核引入了 調度域 和 調度組

調度域與調度組

從前面的分析可知,根據 CPU 的物理架構可以劃分為:不同的物理 CPU、相同 CPU 不同的核心、相同核心不同的超線程等,如下圖所示:

(圖5)

在 Linux 內核中,把這個層級成為 調度域。從前面的分析可知,越下層的調度域共用的緩存就越多,所以在進程遷移時,優先從底層的調度域開始進行。

由于內核為每個超線程定義一個可運行隊列,所以圖 3 中的 CPU 擁有 8 個可運行隊列。而根據不同的調度域,可以把這 8 個可運行隊列劃分為不同的 調度組,如下圖所示:

(圖6)

如上圖所示,由于每個超線程都擁有一個可運行隊列,所以圖 3 的 CPU 擁有 8 個可運行隊列,而這些可運行隊列可以根據不同的核心來劃分為 4 個調度組,而這 4 個調度組可以根據不同的物理 CPU 來劃分成 1 個調度組。

由于越底層的調度域共用的緩存越多,所以對 CPU 可運行隊列進行負載均衡時,優先從底層調度域開始。比如把 Thread0 可運行隊列的進程遷移到 Thread1 可運行隊列的代價要比遷移到 Thread2 可運行隊列的小,這是由于 Thread0 與 Thread1 屬于同一個核心,同一個核心共用所有的 CPU 緩存。

在 Linux 內核中,調度域使用 sched_domain 結構表示,而調度組使用 sched_group 結構表示。我們來看看 sched_domain 結構的定義:

struct sched_domain {
    struct sched_domain *parent;    /* top domain must be null terminated */
    struct sched_domain *child;     /* bottom domain must be null terminated */
    struct sched_group  *groups;    /* the balancing groups of the domain */
    cpumask_t            span;      /* span of all CPUs in this domain */
    ...
};

下面介紹一下 sched_domain 結構各個字段的作用:

  • parent:由于調度域是分層的,上層調度域是下層的調度域的父親,所以這個字段指向的是當前調度域的上層調度域。
  • child:如上所述,這個字段用來指向當前調度域的下層調度域。
  • groups:每個調度域都擁有一批調度組,所以這個字段指向的是屬于當前調度域的調度組列表。
  • span:這個字段主要用來標記屬于當前調度域的 CPU 列表(每個位表示一個 CPU)。

我們接著分析一下 sched_group 結構,其定義如下:

struct sched_group {
    struct sched_group *next;
    cpumask_t           cpumask;
    ...
};

下面介紹一下 sched_group 結構各個字段的作用:

  • next:指向屬于同一個調度域的下一個調度組。
  • cpumask:用于標記屬于當前調度組的 CPU 列表(每個位表示一個 CPU)。

它們之間的關系如下圖所示:

(圖7)

CPU 間負載均衡實現

要實現 CPU 間的負載均衡,只需要將最繁忙的可運行隊列中的一部分進程遷移到空閑的可運行隊列中即可。但由于 CPU 緩存的原因,對使用不同的 CPU 緩存的可運行隊列之間進行進程遷移,將會導致緩存丟失,從而導致性能損耗。所以,Linux 內核會優先對使用相同 CPU 緩存的可運行隊列之間進行進程遷移。

1. CPU 間負載均衡觸發時機

當 CPU 的負載不均衡時,內核就需要對 CPU 進行負載均衡。負載均衡的觸發時機比較多,如進程被創建、進程被喚醒、進程休眠和時鐘中斷等,這里我們介紹一下在時鐘中斷時怎么進行 CPU 間的負載均衡。

在 Linux 內核中是通過 rq 結構來描述一個可運行進程隊列的,它有個名為 sd 的字段用于指向其所屬的 調度域 層級的最底層,如下所示:

struct rq {
    ...
    struct sched_domain *sd;
    ...
}

它與調度域和調度組的關系如下圖所示:

(圖8)

在時鐘中斷下半部處理中,會通過調用 run_rebalance_domains 函數來對 CPU 進行負載均衡處理,而 run_rebalance_domains 接著會通過調用 rebalance_domains 函數來完成負載均衡的工作,其實現如下:

static inline void 
rebalance_domains(int cpu, enum cpu_idle_type idle)
{
    int balance = 1;
    struct rq *rq = cpu_rq(cpu);
    unsigned long interval;
    struct sched_domain *sd;
    unsigned long next_balance = jiffies + 60*HZ;
    int update_next_balance = 0;

    // 遍歷可運行隊列的調度組層級 (從最底層開始)
    for_each_domain(cpu, sd) {
        ...
        // 由于對 CPU 進行負載均衡可能會導致 CPU 緩存丟失
        // 所以對 CPU 進行負載均衡不能太頻繁, 必須隔一段時間才能進行
        // 這里就是判斷上次進行負載均衡與這次的間隔是否已經達到合適的時間
        // 如果時間間隔已經達到一段時間, 那么就調用 load_balance 函數進行負載均衡
        if (time_after_eq(jiffies, sd->last_balance + interval)) {
            if (load_balance(cpu, rq, sd, idle, &balance)) {
                idle = CPU_NOT_IDLE;
            }
            sd->last_balance = jiffies;
        }
        ...
    }
    ...
}

由于每個 CPU(超線程)都有一個可運行隊列,而 rebalance_domains 函數的工作就是獲取當前 CPU (超線程)的可運行隊列,然后從最底層開始遍歷其調度域層級(由于越底層的調度域,進行進程遷移的代價越小)。

由于對 CPU 進行負載均衡可能會導致 CPU 緩存丟失,所以對 CPU 進行負載均衡不能太頻繁(需要隔一段時間才能進行)。那么在對 CPU 進行負載均衡前,就需要判斷上次進行負載均衡與這次的時間間隔是否合理。如果時間間隔合理, 那么就調用 load_balance 函數對調度域進行負載均衡。

load_balance 函數實現如下:

static int
load_balance(int this_cpu, struct rq *this_rq, struct sched_domain *sd,
             enum cpu_idle_type idle, int *balance)

{
    ...

redo:
    // 1. 從調度域中找到一個最繁忙的調度組
    group = find_busiest_group(sd, this_cpu, &imbalance, idle, &sd_idle,
                               &cpus, balance);
    ...

    // 2. 從最繁忙的調度組中找到一個最繁忙的運行隊列
    busiest = find_busiest_queue(group, idle, imbalance, &cpus);
    ...

    if (busiest->nr_running > 1) {
        ...
        // 3. 從最繁忙的運行隊列中遷移一些任務到當前任務隊列
        ld_moved = move_tasks(this_rq, this_cpu, busiest, imbalance, sd, idle,
                              &all_pinned);
        ...
    }
    ...
    return 0;
}

load_balance 函數主要完成 3 個工作:

  • 從 調度域 中找到一個最繁忙的 調度組
  • 從最繁忙的 調度組 中找到一個最繁忙的 可運行隊列
  • 從最繁忙的 可運行隊列 中遷移一些任務到當前 可運行隊列

這樣就完成了 CPU 間的負載均衡處理。

亚洲欧美第一页_禁久久精品乱码_粉嫩av一区二区三区免费野_久草精品视频
牛牛影视久久网| 欧美日韩三区| 久久久免费精品| 狠狠色狠狠色综合日日五| 免费亚洲一区二区| 久久久999成人| 欧美在线播放高清精品| 久久精品综合| 国产精品久久久久久久午夜| 欧美日韩精品欧美日韩精品| 久久精品国产免费观看| 久久激情综合网| 久久一二三区| 欧美日韩国产黄| 欧美日韩一区二区高清| 欧美性大战xxxxx久久久| 国产性做久久久久久| 久久久综合激的五月天| 久久蜜臀精品av| 欧美午夜在线一二页| 国产一区二区三区高清| 欧美3dxxxxhd| 国产精品一区在线观看| 亚洲国产精品一区制服丝袜| 中日韩高清电影网| 欧美成人精品| 欧美怡红院视频| 亚洲人成在线观看网站高清| 亚洲欧美精品在线| 1024成人网色www| 欧美丝袜一区二区| 乱中年女人伦av一区二区| 亚洲欧美日韩国产综合精品二区| 18成人免费观看视频| 老司机成人网| 99re成人精品视频| 国产精品激情av在线播放| 国产精品综合网站| 午夜在线视频一区二区区别| 亚洲激情在线激情| 免费日韩av| 亚洲欧美电影院| 91久久精品国产91性色| 精品动漫3d一区二区三区免费 | 国内在线观看一区二区三区| 国产日韩欧美一区二区三区在线观看 | 国产一区二区三区免费不卡| 亚洲精品你懂的| 午夜日韩福利| 欧美激情一区二区三区蜜桃视频| 国产精品亚洲人在线观看| 欧美日韩免费一区二区三区| 亚洲第一在线| 久久免费的精品国产v∧| 久久网站免费| 国产精品久久久久aaaa九色| 国产日韩欧美a| 亚洲日韩欧美视频| 欧美视频福利| 一本大道久久a久久精二百| 久久精品人人爽| 亚洲国产精品成人综合| 亚洲精品乱码久久久久久日本蜜臀 | 亚洲午夜av| 久久精品欧美| 亚洲精品你懂的| 午夜亚洲激情| 久久一区欧美| 国产亚洲欧美在线| 一本久道久久综合狠狠爱| 女女同性精品视频| 欧美精品一区二区在线观看| 亚洲高清视频在线观看| 亚洲第一精品夜夜躁人人爽| 亚洲专区在线视频| 国产精品高清一区二区三区| 亚洲女爱视频在线| 老色鬼精品视频在线观看播放| 国产色产综合产在线视频| 免费观看日韩av| 亚洲精选在线| 一区在线免费| 午夜精品在线视频| 亚洲精品国精品久久99热一| 国产精品久久一级| 欧美国产日韩亚洲一区| 国产欧美日韩视频一区二区三区| 女同性一区二区三区人了人一| 亚洲伊人一本大道中文字幕| 亚洲电影免费| 黄色成人在线| 国产精品亚洲成人| 欧美日韩在线第一页| 亚洲欧美另类在线观看| 久久色中文字幕| 欧美与欧洲交xxxx免费观看 | 在线精品视频一区二区三四| 在线观看视频亚洲| 影音先锋亚洲电影| 国内精品国语自产拍在线观看| 欧美夫妇交换俱乐部在线观看| 亚洲福利专区| 91久久国产精品91久久性色| 欧美日韩黄视频| 欧美成人国产| 午夜精品久久久久久久久久久久| 日韩性生活视频| 激情久久久久久久| 国产精品久久久久久五月尺| 欧美性猛交xxxx乱大交退制版| 欧美91大片| 欧美91大片| 欧美日韩一级大片网址| 国产精品久久97| 欧美国产亚洲视频| 欧美欧美全黄| 国产精品久久| 国产精品久久久久影院色老大| 国产精品国产自产拍高清av| 免费日韩av电影| 国产精品r级在线| 欧美一区二区免费视频| 一本色道久久88精品综合| 一本色道久久综合亚洲二区三区 | 亚洲午夜羞羞片| 亚洲免费成人av| 亚洲夜间福利| 欧美性大战久久久久| 国产一区二区视频在线观看| 国产综合色产| 久久福利视频导航| 欧美精品一卡二卡| 国产精品久久久久久久久搜平片 | 亚洲视频免费看| 国产精品99久久久久久宅男| 亚洲一区二区三区四区五区午夜| 亚洲国产一区二区三区高清| 亚洲国产精品视频一区| 一区二区电影免费在线观看| 欧美大成色www永久网站婷| 久久精品国产亚洲aⅴ| 性欧美videos另类喷潮| 欧美午夜久久久| 一区二区三区**美女毛片| 你懂的视频欧美| 韩日欧美一区| 久久精品卡一| 国产精品久久国产精麻豆99网站| 在线性视频日韩欧美| 欧美大片免费久久精品三p| 99成人在线| 欧美精品福利在线| 亚洲精品日韩激情在线电影| 欧美日韩国产三区| 久久婷婷蜜乳一本欲蜜臀| 国产精品国产三级国产a| 在线观看91精品国产麻豆| 欧美日韩国产不卡在线看| 亚洲国内精品| 国际精品欧美精品| 欧美激情一区二区| 亚洲少妇自拍| 精品av久久久久电影| 欧美日韩在线观看视频| 久久精品国产精品亚洲综合| 亚洲国产精品一区二区www| 久久激情五月丁香伊人| 欧美一乱一性一交一视频| 亚洲茄子视频| 亚洲精品一区二| 国外成人性视频| 国产精品久久久久9999| 欧美激情精品久久久久久变态| 久久婷婷蜜乳一本欲蜜臀| 一区二区三区欧美激情| 亚洲国产视频a| 欧美日韩一区二区三区四区五区| 久久精品国产在热久久 | 国产日韩欧美高清| 国产精品久久网| 国产欧美日本| 国产日韩欧美精品综合| 91久久精品一区二区别| 国产精品www| 鲁鲁狠狠狠7777一区二区| 欧美国产日韩精品| 亚洲影音先锋| 欧美在线资源| 欧美视频免费| 国语对白精品一区二区| 亚洲精品国产品国语在线app| 一区二区三区国产盗摄| 久久久一本精品99久久精品66| 欧美黄色免费网站| 国产乱码精品一区二区三区忘忧草 | 亚洲日本成人网| 久久久久久免费| 影音先锋欧美精品| 久久久久国产免费免费| 国产一区二区三区四区五区美女 |