您當前位置：首頁 > 數據庫 > 數據庫應用 > Aerospike-Architecture系列之系統概述（System Overview）

Aerospike-Architecture系列之系統概述（System Overview）

來源：程序員人生發布時間：2015-04-13 08:20:06 閱讀次數：4620次

系統概述（System Overview）

Aerospike是1個散布式可擴大的NoSql數據庫，為1下3個主要目標而構建：

創建1個滿足現今網絡平臺利用的彈性，可擴大平臺
提供與傳統數據庫1樣的魯棒性和可靠性（例如，ACID）
提供操作效力（最小人工參與）

最早發布于Proceedings of VLDB (Very Large Databases) in 2011，Aerospike架構包括3層：

集群可感知客戶端層（Client Layer ）包括實現Aerospike API的開源客戶端函數庫，追蹤節點并感知數據在集群中的所在位置
自管理集群（ Clustering）與數據散布層（ Data Distribution Layer）監控集群通訊與自動故障轉移，數據復制，跨數據中心同步，智能再平衡，數據遷移
flash-optimized數據存儲層（Data Storage）可靠存儲數據于內存和閃存

客戶端層

Aerospike“智能客戶端”為速度而設計。它被實現為1個開源可鏈接庫用于C、c#、Java、PHP和Python開發，開發者可用自由按需發布或修改。客戶端包括以下內容

實現Aerospike API，通過客戶端-服務器協議與集群直連
追蹤節點感知數據存儲位置，當節點啟動或停止時立即感知集群配置變化。
為提高效力實現TCP/IP連接池。檢測非集群節點失敗級別的事務失敗并重新路由事務到數據副本
透明地將要求直接發送到數據所在節點并根據需要重試或重新要求，1個例子是在集群重新配置期間。

這類架構減少了事務延遲，分流集群工作并消除開發者工作量。它確保在節點啟停是利用沒必要重啟。總之，它消除對額外集群管理服務器或代理服務器的需要。

散布層

Aerospike “shared nothing”架構被設計目的是可以可靠存儲TB及數據并支持自動容錯、復制、跨數據中心同步。本層實現線性擴大及ACID guarantees。散布層也旨在消除手工操作，實現系統所有集群管理功能的自動化。它包括3個模塊：

Cluster Management Module用于追蹤集群節點。關鍵算法是肯定哪些節點是集群的1部份的Paxos-like1致投票進程。Aerospike實現專門的心跳檢測（主動與被動），用于監控節點間的連通性。
當1個節點被添加或移除并且集群成員被肯定，每一個節點使用哈希算法講主索引空間切分為數據切片并指派其具有者。Data Migration Module（數據遷移模塊）然后智能平衡跨集群中各節點的數據散布，并依照系統配置的復制因子確保每一個數據塊夸節點和夸數據中心復制。數據分割是純潔算法，系統擴大無master，從而消除在同享環境下的其他額外配置。

Transaction Processing Module（事務處理模塊） 用于讀寫數據要求并保障1致性與隔離性，該模塊負責
1. Sync/Async Replication（同步/異步復制）：為保證寫1致性，在提交數據之前向所有副本傳播更新并將結果返回客戶端。
2. Proxy （代理）：集群重配置期間客戶端可能出現短暫過期，透明朝理要求到其他節點。
3. Duplicate Resolution（副本解析）：當集群從活動分區恢復時，解決不同數據副本之間的沖突。
  - 自動，以數據最晚的時間戳為標準
  - 用戶驅動，為判定數據等級，所有數據副本返回利用。

Clustering

1旦啟動集群，你可以在其他數據中心安裝配置cross data-center replication的其他集群，如果集群崩潰，遠端集群可以承接負載。

數據存儲層

Aerospike以無模式數據模型存儲鍵值對。組織數據的容器稱作命名空間（namespaces），相當于RDBMS系統中庫（databases ）的概念。在namespace中數據被細分為各個集合（set）（類似數據庫中的表）和記錄（records ）（類似數據庫中的行）。在set中每一個record有1個唯1的索引key和1個或多個bin（類似數據庫中的列）與之相干聯。

set和bin不需要預先定義，可以再運行時添加。
bin中的值是強類型，包括任何被支持的數據類型。bin本身不是類型，所以相同的bin名可以是不同類型的數據。

為了快速訪問，索引（ primary keys 和 secondary keys）存儲于內存，數據可以存儲于內存或SSD硬盤。每一個namespace可以分別配置，這樣小的namespace可以存儲在內存而大的namespace可以存儲在SSD上。

數據層特別為提高速度同時減少硬件本錢而設計。它可以作為緩沖層所有操作在內存中進行或利用優化過的flash存儲，后者數據不會丟失。

1億個keys只占用6.4GB空間。雖然key沒有大小限制，每一個key的有效存儲也只有64bytes
原生，多線程，多核Flash I/O和Aerospike日志結構文件系統利用低水平的SSD讀寫模式。另外，寫盤履行塊寫操作以減少延遲。這類方式繞過標準文件系統優化傳統磁盤。
內Smart Defragmenter（建智能碎片整理）和 Intelligent Evictor（智能清算器）。這些進程協同工作確保內存中的數據不丟失并安全的寫入磁盤
- 碎片整理程序跟蹤活動記錄在每塊并回收那些低于最低使用率的塊
- 清算器移除過期的記錄并在系統到達高水位線時回收內存。過期時間配置在每一個namespace中，record存活期從最后1次修改的時間開始計算，利用可以超出默許的數據生命周期重新指定過期時間，可以設定數據永不過期。

操作Aerospike

在傳統（非散布式）數據庫系統中，安裝完軟件你需要設置schema、創建數據庫和表。這與Aerospike數據庫有很大不同。

在散布式數據庫中，數據散布在集群中的各個服務器上。這意味著你不能在1臺服務器上訪問到所有數據。

使用Aerospike 數據庫，將按以下步驟創建和管理數據庫：

通過配置初始化數據庫設置。按Aerospike的術語，當安裝系統時1個庫被稱作1個namespace，集群中的每一個節點必須指明每一個namespace如何創建及副本數量。數據庫講在你重啟服務的時候被創建
通過利用程序履行數據庫操作。當利用程序第1次援用set和bin的時候數據庫schema被創建，利用程序簡單地將數據存儲于指定的bin。在Aerospike數據庫中，任務通常由DBA通過命令行程序履行。
根據需要修改配置文件。要更新namespace的配置參數，你需要動態修改或使用新的配置文件重啟服務。