當前位置:學者齋 >

IT認證 >IBM認證 >

IBM認證知識:HACMP心跳檢測

IBM認證知識:HACMP心跳檢測

與在許多其他型別的叢集中一樣,心跳檢測用於監視網路介面、通訊裝置和 IP 標籤(服務、非服務和持久 IP 標籤)的可用性,從而監視節點的可用性。

IBM認證知識:HACMP心跳檢測

從 HACMP V5.1 開始,心跳檢測完全基於 RSCT 拓撲服務(因而 HACMP V5.1 只是“Enhanced Scalability”版本;使用直接由叢集管理器守護程序監視的傳統網路介面模組 (NIM) 的心跳檢測已不再使用)。

執行心跳檢測的方法是通過每個通訊介面或裝置在叢集中的節點之間交換訊息(Keep Alive 資料包)。

每個叢集節點以特定間隔向其他叢集節點發送心跳訊號訊息,並預期以特定間隔接收來自對應節點的心跳訊號訊息。如果訊息接收停止,則 RSCT 將此情況視為故障,並告訴 HACMP,後者將採取適當的恢復操作。

  心跳訊號訊息可通過以下網路傳送:

TCP/IP 網路點對點非 IP 網路為了防止叢集分割(split brain),HACMP 必須能夠區分節點故障和 TCP/IP 網路故障。TCP/IP 網路故障可能由有故障的網路元素(交換機、集線器和電纜)導致;在這種情況下,叢集中的節點不能通過 IP 傳送和接收檢測訊號訊息(Keep Alive,KA),因此每個節點認為對等節點發生了故障,並嘗試獲取資源。這具有潛在的資料破壞風險,在使用併發資源時尤其是如此。

非 IP 網路是節點之間的直接連線(點對點),並且不使用 IP 來進行檢測訊號訊息交換,因此不太容易受到 IP 網路元素故障的影響。如果使用了這些網路型別,則在 IP 網路發生故障的情況下,節點仍然能夠交換訊息,因此得出的判斷是網路故障,從而不執行任何資源組活動。

為了避免 HACMP 中發生分割,我們建議:

配置冗餘網路(IP 和非 IP)同時使用 IP 和非 IP 網路。若要了解一個建議的兩節點叢集配置,圖 3。

圖 3 HACMP 叢集中的訊號檢測

  通過磁碟的訊號檢測

通過磁碟的心跳檢測 (diskhb) 是 HACMP V5.1 中引入的新功能,旨在提供預防叢集分割的附加保護和簡化的非 IP 網路配置,尤其是用於太難或無法實現 RS232、目標模式 SSA 或目標模式 SCSI 連線的環境。

此類網路可以使用任何型別的共享磁碟儲存(光纖通道、SCSI 或 SSA),只要用於交換 KA 訊息的磁碟是 AIX 增強併發卷組的一部分。用於訊號檢測網路的磁碟並不專門用於此目的;可以將它們用於儲存應用程式共享資料(有關更多資訊,請參見圖 3)。

客戶提出了使用目標模式的光纖通道連線請求,但是由於異構(非標準發起裝置和目標功能)的 FC 環境(介面卡、儲存子系統、SAN 交換機和集線器),此方法很難實現和支援。

通過使用共享磁碟來交換訊息,非 IP 網路的實現更加可靠,並且不依賴所使用的硬體型別。

此外,在 SAN 環境中,當使用光纖來連線裝置時,這種非 IP 連線的長度具有與 SAN 相同的距離限制,

因而允許實現超長的點對點網路。

通過將某個磁碟定義為增強的併發卷組的一部分,該磁碟的一部分(扇區)將不用於任何 LVM 操作,此磁碟部分將用於在兩個節點之間交換訊息。

  使用通過磁碟的訊號檢測的規範如下:

一個磁碟可用於兩個節點之間的一個網路。同時在兩個節點上使用 LVM 分配的物理卷 ID(physical volume ID,PVID)來標識要使用的`磁碟。用於磁碟訊號檢測網路的建議配置是在每個儲存機箱中將一個磁碟用於一對節點。要求將要使用的磁碟是某個增強併發卷組的一部分,雖然該卷組不一定要是活動的或者是某個資源組(併發或非併發)的一部分。唯一的限制在於,必須同時在兩個節點上定義該卷組(volume group,VG)。注意:增強併發卷組的叢集鎖機制不使用保留磁碟空間來進行通訊(“傳統”版本的 clvmd 要使用保留磁碟空間);它改為使用 RSCT 組服務。

  通過 IP 別名的心跳檢測

對於 IP 網路,現在引入了一個新的心跳檢測功能:通過 IP 別名的訊號檢測。此功能是為不能或不適宜更改通訊介面的基本 IP 地址的叢集而提供的。

用於訊號檢測的 IP 別名是在 HACMP 服務啟動時在現有 IP 地址之外配置的。用於此目的的 IP 地址必須與現有的 IP 地址在完全不同的子網中,並且不應該定義用於任何名稱解析(/etc/hosts、BIND 等等)。此配置不需要任何附加的可路由子網。

與使用基本/啟動 IP 地址來交換心跳訊號訊息不同,RSCT 使用 HACMP 定義的 IP 別名來為每個通訊介面建立通訊組(檢測訊號環)。

注意:在使用通過 IP 別名的心跳檢測時,通訊介面的基本/啟動 IP 地址由不由RSCT 拓撲服務(從而由 HACMP)進行監視。通訊介面將通過所分配的 IP 別名接受監視。

即使使用此技術,HACMP 仍然要求網路上的所有介面(所有節點中的介面)能夠彼此通訊(能夠彼此看到對方的 MAC 地址)。

用於 IP 別名的子網掩碼與用於服務 IP 地址的子網掩碼相同。在定義用於訊號檢測的 IP 地址時,必須指定要用於訊號檢測的起始地址,並且必須確保有足夠多與網路上使用的現有子網不發生衝突的子網可用(節點中的每個物理通訊介面對應一個子網)。


標籤: IBM HACMP 心跳 檢測
  • 文章版權屬於文章作者所有,轉載請註明 https://xuezhezhai.com/zh-tw/itrz/ibm/z3k642.html