Permabit Albireo SANblox 是一種專門構建的數據縮減設備,旨在從光纖通道 SAN 釋放更多容量。 Permabit 估計用戶將看到駐留在 SAN 上的數據足跡至少減少 6:1,從而允許存儲投資大幅改變標準價值主張。 SANblox 通過精簡配置提供重複數據刪除和壓縮,進一步增強了功能集。 所有數據縮減都是在線完成的,SANblox 設備簡單地滑入並虛擬化 SAN,SAN 和應用程序不會注意到 SANblox 解決方案的駐留。 SANblox 適用於任何 FC 存儲,無論磁盤配置如何——硬盤、混合和全閃存解決方案都將看到相同的數據佔用空間減少。
Permabit Albireo SANblox 是一種專門構建的數據縮減設備,旨在從光纖通道 SAN 釋放更多容量。 Permabit 估計用戶將看到駐留在 SAN 上的數據足跡至少減少 6:1,從而允許存儲投資大幅改變標準價值主張。 SANblox 通過精簡配置提供重複數據刪除和壓縮,進一步增強了功能集。 所有數據縮減都是在線完成的,SANblox 設備簡單地滑入並虛擬化 SAN,SAN 和應用程序不會注意到 SANblox 解決方案的駐留。 SANblox 適用於任何 FC 存儲,無論磁盤配置如何——硬盤、混合和全閃存解決方案都將看到相同的數據佔用空間減少。
6 倍的數據減少被普遍認為是標準企業混合應用程序工作負載的良好標誌。 但是,根據存儲的使用情況,數字可能會更高。 VDI 用例可以將 SANblox 的優勢提升一個數量級,例如,使用多個數據庫副本進行開發的 IT 商店將看到巨大的數據足跡減少。 事實上,僅僅為了開發目的而能夠分離數據副本可能會啟用新的業務流程,而之前部署完整數據集的成本可能太高了。
Permabit 長期以來一直從事重複數據刪除業務。 雖然數據縮減直到最近才在備份設備之外廣泛流行,但基於閃存的設備已經將這一概念推向了更主流的工作負載。 許多全閃存設備背後的重複數據刪除技術很可能是 Permabit 解決方案。 重複數據刪除並非無處不在,硬盤驅動器陣列甚至大多數混合驅動器根本就沒有考慮到這一概念,甚至許多閃存陣列也提供了一組有限的數據縮減服務。 Permabit 通過 SANblox 設備開放這些服務,為新的或現有的存儲提供一套新的技巧。
Permabit Albireo SANblox 現已發貨,廠商建議零售價根據與該設備配對的存儲供應商和促銷價格而有所不同。 顯然,當容量足夠大以實現規模經濟時,定價爭論最有效。 Permabit 提供了一個定價示例,以展示傳統閃存存儲如何與 SANblox 環境相媲美:
- 60 TB 原始數據的成本:720,000 美元
- 扣除數據保護開銷後的成本:12 美元/GB
- SANblox 6:1 容量節省成本:70,000 美元
- 扣除數據保護開銷後的 10TB 成本:120,000 美元
- 折扣前總成本:190,000 美元
- 折扣前每 GB(存儲 + sanblox)的有效成本:3.16 美元
- 淨儲蓄:74%
Permabit Albireo SANblox 規格
- 中央處理器:英特爾至強E5-1650v2
- 內存:128 GB
- FC 端口:4 x 16 Gb (Emulex)
- 最大限度。 可用容量:256 TiB
- 最大限度。 支持的 LUN:256
- 隨機 IO(4K IOPS):
- 閱讀:230,000
- 寫:111,000
- 混合 RW70:180,000
- 順序吞吐量:
- 讀取:1045MB/s
- 寫入:800MB/s
- 最小延遲:
- 讀取:300us
- 寫入:400us
- 可靠性:在確認寫入之前,所有數據/元數據都寫入後端存儲。 SANblox 上沒有緩存數據。
- 可用性:無縫高可用性可在 30 秒內提供透明的故障轉移。
- 可維護性:軟件和硬件組件的 SMTP 警報和透明昇級。
- 物理特性:
- 外形:1U 機架式
- 寬度:17.2“(437毫米)
- 重量:38磅(16.5千克)
- 電源:
- 電壓:100-240V,50-60Hz
- 瓦特:330
- 安培:最大 4.5
- 工作溫度:10°C 至 35°C(50°F 至 95°F)
- 工作相對濕度:8% 至 90%(非冷凝)
- 認證
- 電磁輻射:FCC A 類、ICES-003、CISPR 22 A 類、AS/NZS CISPR 22 A 類、EN 61000-3-2/-3-3、VCCI:V-3、KN22 A 類
- 電磁抗擾度:CISPR 24、KN 24、(EN 61000-4-2、EN 61000-4-3、EN 61000-4-4、EN 61000-4-5、EN 61000-4-6、EN 61000-4- 8、EN 61000-4-11)
- 電源效率:80 Plus 金牌認證
重複數據刪除
重複數據刪除只是防止重複數據佔用主存儲中寶貴空間的過程。 購買專門用於備份的數據縮減設備與專為主存儲設計的數據縮減設備之間的區別可能會讓一些購買者感到困惑。 具有數據縮減功能的主存儲旨在優化隨機訪問固定大小數據塊的性能交付。 為了達到更快的性能,主存儲數據縮減側重於固定的數據塊,通常是更多、更小的塊(但根據特定供應商的不同而有所不同)。 另一方面,重複數據刪除備份設備更側重於順序吞吐量,以加快備份和恢復過程。 具有連續焦點的備份重複數據刪除設備能夠處理大量數據流並將它們寫入具有可變塊大小的介質。 一方面,這意味著設備可以使用更大的塊,因此需要跟踪的塊更少; 另一方面,如果需要回讀的數據量很少,則必須讀取整個塊。
就重複數據刪除而言,主要有兩種執行方法:內聯或後處理。 內聯重複數據刪除只是意味著當數據向其目標移動時,重複項被發現並且永遠不會被寫入。 因為它是內聯的,混合陣列中的緩存和更快的存儲層都受益於有效容量的增加。 這是節省磁盤空間的理想選擇,更不用說節省對閃存介質的寫入(閃存在開始降級之前只能進行這麼多寫入)。 除了這些好處之外,內聯還允許立即復制以保護數據。 內聯重複數據刪除的不利方面是幾乎不可避免的性能下降。
後處理重複數據刪除意味著重複數據刪除過程在數據到達其存儲目標或到達存儲緩存時開始。 雖然這可以跳過寫入時的初始性能影響,但它確實引入了其他問題。 其一,重複項在等待重複數據刪除過程開始或追趕(如果它一直在運行)時正在佔用存儲空間。 如果先將數據發送到緩存,緩存會很快填滿。 因此,混合陣列可能只會在最低層節省容量。 在重複數據刪除之前先將所有內容寫入存儲介質也會對閃存造成更大的損失。 雖然可以跳過初始性能影響,但重複數據刪除過程一旦開始後處理仍將不得不使用資源。
從供應商的角度來看,性能通常是最關心的問題,因為他們不希望自己的設備運行速度比競爭對手慢(即使他們使用的磁盤空間總體上更少)。 性能影響和總體性能上限來自可用資源以及給定設備中使用的特定軟件的組合。 雖然性能也可能是客戶關注的問題,並且是一個主要問題,但他們也擔心數據丟失,因為重複數據刪除過程確實改變了數據的存儲方式和最初的寫入方式。
那麼 Permabit 在哪裡適合重複數據刪除的這種差異? Permabit 位於 SAN 前面,並在數據移向目標時對數據進行重複數據刪除。 Permabit 使用內聯、多核可擴展和低內存開銷的重複數據刪除方法。 具體來看我們正在測試的設備 Permabit Albireo SANblox,它可以在主存儲環境中以 4K 粒度為需要重複數據刪除的數據編制索引。 因此,Permabit Albireo SANblox 可以採用 256TB 的配置 LUN 並將其呈現為 2.5PB 的邏輯存儲,但它僅在 128GB 的 RAM 中實現。 這允許設備通過讀回更小的數據塊以及使用更少的資源來解決性能方面的問題。 解決 Permabit 性能問題的另一種方法是將其軟件嵌入到設備中。 Permabit 表示,使用此方法的客戶已經看到超過 600,000 IOPS 的性能。
任何公司都可以輕鬆地說出該設備(在本例中為重複數據刪除)的功能非常出色。 但是,在客戶和希望將 Permabit 與其 SAN 設備結合起來的供應商可以理解的上下文中提供一些證據總是更好。 幾年前,Permabit 與 Enterprise Strategy Group (ESG) 進行了一項研究。 該研究考察了各種環境下的數據縮減率,並比較了單獨使用壓縮、單獨使用重複數據刪除以及壓縮和重複數據刪除相結合的方法。
設置和配置
SANblox 設備是一個 1U 服務器,它基本上將自身插入到路由通過的 LUN 的數據路徑中。 當然,並非所有 LUN 都必須通過 SANblox。 SANblox 單元通常部署在 HA 對中,根據底層存儲的需求或功能,可以使用多個 HA 對來滿足任何存儲或性能要求。
在線獲取 SANblox 非常簡單快捷。 您為系統分配了兩個 IP 地址:一個用於 IPMI,另一個用於 Web 管理和 SSH 接口。 當它上線時,您可以獲取兩個後端 FC 端口(將連接到您的存儲系統的端口)的 WWN,並使用它們創建一個單獨的 FC 區域。
在陣列級別,您配置存儲,以便您有一個 1GB LUN 用於設備設置,多個 LUN 用於您的主要數據存儲。 所有元數據也都存儲在這些卷上,SANblox 不會在設備中保留任何數據,這是通過其同步、內聯功能實現的。 對於我們的屏幕截圖示例,我們使用了 DotHill Ultra48 陣列,為 SANblox 設置配置了 1 個 1GB LUN,為 SANblox 存儲池配置了 2 個 1TB LUN。
配置存儲後,SANblox 使用 1GB LUN 自動檢測和配置自己進行設備設置,並查看其他 LUN 以創建存儲池。 在這種情況下,它在創建池時將所有這些組合在一起,並允許您選擇是否要打開或關閉重複數據刪除,以及打開或關閉壓縮。
使用創建的池,Permabit SANblox 默認允許用戶以 10:1 的邏輯可尋址大小對物理存儲進行尋址。 因此,在創建卷時,1TB 原始空間變為 10TB 可用空間。 在我們的例子中,它將 1.8TB 的原始存儲映射為我們可以分配的 18TB 可用存儲。
整理好底層存儲後,界面的其餘部分與基本存儲陣列的工作方式類似。 您可以創建 LUN,將它們分配給主機或主機組,以及定義只讀訪問或讀/寫訪問等規則。
性能
並非所有高性能存儲都提供重複數據刪除。 X-IO ISE G3 閃存陣列系列就是一個很好的例子,最近評論 X-IO 伊勢 860 主要設計為表演遊戲。 X-IO 有意識地決定不疊加太多功能,所有這些功能都需要更多的 RAM 和 CPU,同時削弱了陣列提供領先性能的能力。 也就是說,在某些用例中,應用程序必須在性能和容量之間進行權衡,並且每 TB 的閃存成本仍然相對較高,重複數據刪除可以顯著改變性能存儲的經濟性,足以解決成本問題並保持高性能特性。 以此為背景,我們在 ISE 860 前面部署了 SANblox 以評估其功能。 主要關注重複數據刪除如何影響應用程序性能,我們利用我們的 Microsoft SQL Server、MySQL Sysbench 和 VMware VMmark 測試環境來對單個 SANblox 設備進行壓力測試。 這些測試中的每一個都在多個同時工作負載同時命中給定存儲陣列的情況下運行,從而為 Permabit SANblox 等數據減少系統提供了減少已部署工作負載的數據足蹟的絕佳機會。
在重複數據刪除和性能方面需要了解的一個重要因素是,當您減少數據佔用空間時,您也會增加後端存儲上的 I/O 負載。 在許多情況下,吞吐量會降低,因為您發送的數據比以前少得多,但小塊隨機 I/O 請求會大幅增加。 這是 DR 和閃存可以很好地結合在一起的原因之一,但這也意味著在某些情況下,您可以並且仍然會在某些情況下使後端存儲飽和。 幸運的是,SANblox 的專利技術將數據減少的開銷控制在最低限度,從而為擴展留出空間或將陣列本機用於其他應用程序。 對於具有大量 I/O 潛力的大型環境或平台,用戶可以擴展 SANblox 設備的數量以提高性能和容量。 雖然我們只獲得了一台設備進行審查,但我們很可能會看到兩對一起工作時測得的性能更高,而不是只有一對。
存儲評論的 Microsoft SQL Server OLTP 測試協議 採用事務處理性能委員會基準 C (TPC-C) 的當前草案,這是一種在線事務處理基準,模擬複雜應用程序環境中的活動。 TPC-C 基準比綜合性能基準更接近於衡量數據庫環境中存儲基礎設施的性能優勢和瓶頸。
此測試使用在 Windows Server 2014 R2012 來賓虛擬機上運行的 SQL Server 2,由戴爾的數據庫基準工廠進行壓力測試。 雖然我們對該基準測試的傳統用法是在本地或共享存儲上測試 3,000 規模的大型數據庫,但在本次迭代中,我們專注於在我們的 X-IO ISE 1,500 上均勻分佈四個 860 規模的數據庫,以更好地說明內部的總體性能一個 4 節點 VMware 集群。
二代SQL Server OLTP基準工廠LoadGen設備
- Dell PowerEdge R730 VMware ESXi vSphere 虛擬客戶端主機 (2)
- 集群中 5 個 2690GHz Intel E3-124 v2.6 CPU(每個節點兩個,12GHz,30 核,XNUMXMB 緩存)
- 512GB RAM(每個節點 256GB,16GB x 16 DDR4,每個 CPU 128GB)
- SD 卡引導 (Lexar 16GB)
- 2 個 Mellanox ConnectX-3 InfiniBand 適配器(用於 vMotion 和 VM 網絡的 vSwitch)
- 2點¯x Emulex 16GB 雙端口 FC HBA
- 2點¯x Emulex 10GbE 雙端口網卡
- VMware ESXi vSphere 6.0 / Enterprise Plus 4-CPU
- Dell PowerEdge R730 虛擬化 SQL 4 節點集群
- 集群中 5 個 2690GHz 的 Intel E3-249 v2.6 CPU(每個節點兩個,12GHz,30 核,XNUMXMB 緩存)
- 1TB RAM(每個節點 256GB,16GB x 16 DDR4,每個 CPU 128GB)
- SD 卡引導 (Lexar 16GB)
- 4 個 Mellanox ConnectX-3 InfiniBand 適配器(用於 vMotion 和 VM 網絡的 vSwitch)
- 4點¯x Emulex 16GB 雙端口 FC HBA
- 4點¯x Emulex 10GbE 雙端口網卡
- VMware ESXi vSphere 6.0 / Enterprise Plus 8-CPU
每個 SQL Server VM 配置有兩個虛擬磁盤,一個 100GB 用於啟動,另一個 500GB 用於數據庫和日誌文件。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。
查看在 X-IO ISE 860 上運行我們的 SQL TPC-C 工作負載與通過 Permabit SANblox 運行 SQL TPC-C 工作負載之間的 TPS 性能變化,從 12,564 到 12,431TPS 的下降相當小。
儘管我們看到數據減少對工作負載的影響,但將重點從事務性能轉移到延遲。 對於通過 SANblox 運行的工作負載,延遲從平均 13 毫秒增加到平均 84 毫秒; 略低於 5.5 倍的跳躍。 Permabit 解釋說,我們可能接近單個 SANblox 對的最大負載,稍微減少工作負載或添加第二個 SANblox 可以顯著降低平均延遲。
聯機事務處理平台 基準運行在 Percona MySQL 之上,利用在 CentOS 安裝中運行的 InnoDB 存儲引擎。 為了使我們對傳統 SAN 的測試與較新的超融合設備保持一致,我們已將許多基準測試轉移到更大的分佈式模型。 主要區別在於,我們現在不是在裸機服務器上運行一個基準測試,而是在虛擬化環境中運行該基準測試的多個實例。 為此,我們在 X-IO ISE 4 上部署了 8 個和 860 個 Sysbench VM,每個節點 1-2 個,並測量了集群上所有同時運行的總體性能。 我們繪製了 4 個和 8 個 VM 如何在閃存陣列原始上以及通過 Permabit SANblox 運行。
Dell PowerEdge R730 虛擬化 Sysbench 4 節點集群
- 集群中 5 個 2690GHz 的 Intel E3-249 v2.6 CPU(每個節點兩個,12GHz,30 核,XNUMXMB 緩存)
- 1TB RAM(每個節點 256GB,16GB x 16 DDR4,每個 CPU 128GB)
- SD 卡引導 (Lexar 16GB)
- 4 個 Mellanox ConnectX-3 InfiniBand 適配器(用於 vMotion 和 VM 網絡的 vSwitch)
- 4點¯x Emulex 16GB 雙端口 FC HBA
- 4點¯x Emulex 10GbE 雙端口網卡
- VMware ESXi vSphere 6.0 / Enterprise Plus 8-CPU
每個 Sysbench VM 配置了三個虛擬磁盤,一個用於啟動 (~92GB),一個用於預構建數據庫 (~447GB),第三個用於我們將測試的數據庫 (400GB)。 從系統資源的角度來看,我們為每個虛擬機配置了 16 個 vCPU、64GB DRAM 並利用了 LSI Logic SAS SCSI 控制器。
我們的 Sysbench 測試測量平均 TPS(每秒事務數)、平均延遲以及在 99 個線程的峰值負載下的平均 32% 延遲。
通過在具有 860VM 工作負載的 X-IO ISE 8 上本地運行 Sysbench,我們測得整個集群的總計為 6,568TPS。 將 SANblox 添加到組合中後,該速度降至 2,971TPS。 在負載 4 個虛擬機的情況下,我們發現下降幅度較小,從 4,424TPS 下降到 2,752TPS。 在這兩種情況下,通過數據縮減設備進行操作的開銷分別佔 55% 和 38%。 一個關鍵方面是這個開銷數字不會直接影響存儲陣列提供的 LUN。 作為外部系統,用戶可以選擇將更高優先級的流量路由到陣列本身,儘管沒有數據減少的成本優勢。
比較我們配置之間的平均延遲,我們看到 4VM 平均延遲從 29 毫秒增加到 47ms,而 8VM 平均延遲從 39 毫秒增加到 86ms。
在將 SANblox 添加到我們的環境後查看第 99 個百分位數的延遲,我們測量到 57 個虛擬機的延遲從 89 毫秒增加到 4 毫秒,83 個虛擬機的延遲從 178 毫秒增加到 8 毫秒。
VMmark 性能分析
與我們所有的應用程序性能分析一樣,我們試圖展示產品在實際生產環境中的性能與公司的性能聲明相比如何。 我們了解評估存儲作為大型系統組件的重要性,最重要的是存儲在與關鍵企業應用程序交互時的響應速度。 在這個測試中我們使用 VMware 的 VMmark 虛擬化基準測試 在多服務器環境中。
VMmark 的設計本身就是一個高度資源密集型基準測試,它廣泛地混合了基於 VM 的應用程序工作負載,強調存儲、網絡和計算活動。 在測試虛擬化性能時,幾乎沒有更好的基準測試了,因為 VMmark 考慮了很多方面,包括存儲 I/O、CPU,甚至 VMware 環境中的網絡性能。
Dell PowerEdge R730 VMware VMmark 4 節點集群規格
- Dell PowerEdge R730 服務器 (x4)
- CPU:八個 Intel Xeon E5-2690 v3 2.6GHz (12C/24T)
- 內存:64 x 16GB DDR4 RDIMM
- Emulex LightPulse LPe16002B 16Gb FC 雙端口 HBA
- Emulex OneConnect OCe14102-NX 10Gb 以太網雙端口 NIC
- VMware ESXi 6.0
ISE 860 G3(每個 DataPac 20×1.6TB SSD)
- RAID 前:51.2TB
- RAID 10 容量:22.9TB
- RAID 5 容量:36.6TB
- 原價:$ 575,000
在配置 Permabit SANblox 以使用 VMware 的 VMmark 進行測試時,我們優化了數據分佈方式。 傳統上,對於給定的陣列,VM 部署在“全有或全無”配置中,這意味著完整的數據被完全移動到被測試的存儲陣列上。 借助 SANblox,它位於存儲設備前面的獨特方式,我們能夠將存儲直接用於一些寫入密集型工作負載,以及通過 SANblox 用於大多數操作系統磁盤和 VMmark 工作負載,其中重複數據刪除節省了成本是最棒的.. 在我們的特定配置中,我們將所有 VM 遷移到 SANblox,除了我們直接放置在 X-IO ISE 40 上的單個 860GB Mailserver 郵箱虛擬磁盤。
通過我們的優化配置,我們能夠使用 X-IO ISE 8 前面的 Permabit SANblox 使用 VMmark 達到總共 860 個區塊。這與我們之前直接託管在陣列上測量的 26 個區塊的峰值相比。 從性能的角度來看,通過 SANblox 運行我們的工作負載有 70% 的開銷。 不過,就數據縮減而言,消耗的空間保持在 1 個 tile。 將額外的圖塊遷移到陣列上對消耗的空間沒有明顯影響。 在這種情況下,擁有第二個 HA 對 SANblox 設備將提高整體性能。
結論
Permabit Albireo SANblox 是一種易於部署的設備,通過大大減少組織的數據足跡提供巨大的好處。 Permabit 表示,Albireo SANblox 可以放在任何光纖通道 SAN 前面,客戶可以看到數據足跡減少了 6:1。 所有數據縮減都是在 SAN 不知道 SANblox 存在的情況下發生的。 除了典型的 6:1 數據縮減,SANblox 還提供自動精簡配置和壓縮。 Permabit 是重複數據刪除領域歷史悠久且廣受尊重的品牌,可以幫助客戶看到根據工作負載減少佔用空間的潛力。
從表面上看,重複數據刪除聽起來很棒。 組織可以充分利用他們購買的存儲,而不是讓它被重複的存儲填滿,甚至舊的基於磁盤的存儲也可以重獲新生。 Permabit Albireo SANblox 的工作原理與它後面的配置無關,這是考慮它的另一個重要理由。 重複數據刪除的最大缺點是性能必須受到影響,在某些情況下,性能受到的影響可能非常大。 潛在客戶不應將此視為破壞交易的因素,而應意識到雖然與原始全閃存相比性能受到打擊,但它仍然比同等價格範圍內的傳統 HDD 存儲陣列更快。
如果需要超高性能和極低延遲而不是利用他們所有的存儲投資,那麼他們應該跳過重複數據刪除。 但是,如果企業可以承受性能損失並且仍然在其定義的參數範圍內運行,那麼他們無論如何都應該考慮使用 Permabit Albireo SANblox 等設備。 還有一種折衷方案,第三種選擇是通過 SANblox 運行對性能要求較低的數據(例如開發),同時讓生產數據通過而不進行重複數據刪除。 如何看待我們的績效結果需要採用類似的思路。 這種比較不是“看看沒有 SANblox 時 X-IO 的性能有多好”,而是一種展示人們在將重複數據刪除應用到 SAN 時可以預期的性能類型的方式。
如前所述,將設備添加到存儲堆棧取決於許多變量。 最終,Permabit 提供的是存儲容量和壽命的擴展,尤其是在工作負載沒有性能需求的情況下。 在當今的 IT 環境中,像為開發而經常啟動數據庫這樣的任務正在成為標準做法,SANblox 可以在沒有數據足跡損失的情況下實現這一點。 集成到企業中也很簡單,如果需要調整和定制,該設備允許這樣做。
優點
- 簡單集成到存儲架構中
- 符合現代開發實踐
- 可以通過 LUN 打開/關閉
缺點
- 重複數據刪除有開銷,對延遲敏感的應用程序可能需要繞過設備
底線
Permabit Albireo SANblox 可輕鬆集成到現有系統中並執行在線數據縮減,使組織能夠充分利用其存儲投資的潛力。 數據縮減可以打開或關閉,或僅適用於某些工作負載,以最大限度地提高性能和容量。
討論這篇評論