亚洲另类色区欧美日韩图片,激情成人五月天第四色,亚洲日本中文字幕在线四区

對象存儲服務（Object Storage Service，簡稱OSS），是百分點對外提供的海量、安全、低成本、高可靠的對象存儲服務。用戶可以通過簡單的REST接口，進行數(shù)據(jù)的上傳和下載。同時，OSS提供Java語言的SDK，簡化用戶的編程?；贠SS，用戶可以搭建出各種個人和企業(yè)數(shù)據(jù)備份、業(yè)務數(shù)據(jù)應用等基于大規(guī)模數(shù)據(jù)存儲的服務。同時OSS還可以與其他組件搭配使用，廣泛應用于海量數(shù)據(jù)存儲與備份，數(shù)據(jù)加工與處理，內容加速分發(fā)，業(yè)務數(shù)據(jù)挖掘等多種業(yè)務場景。

1.架構設計

基于對OSS的要求，我們設計的架構如下圖所示：

我們采用了HBase+Ceph來進行底層存儲，對于小于1MB的數(shù)據(jù)進入HBase，對于大于1MB的數(shù)據(jù)進入Ceph，同時數(shù)據(jù)通過Tomcat提供對外服務?；谏厦娴募軜嫞覀兊腛SS可以實現(xiàn)以下的性能目標。

1.1 高吞吐性

OSS的底層存儲充分利用各組件的性能優(yōu)勢，來使整個集群可以達到較高的吞吐量。

HBase（Hadoop Database），是一個高可靠性、高性能、面向列、可伸縮的分布式存儲系統(tǒng)，利用HBase技術可在廉價PCServer上搭建起大規(guī)模結構化存儲集群。對于小于1MB的文件寫入HBase是一個很棒的設計。

那么大于1MB的文件，我們存入哪里呢？有這么幾種方案可供我們選擇，比如Hadoop，F(xiàn)astDFS，Ceph等組件。我們最終選擇了Ceph做大文件存儲。

Ceph是一種為優(yōu)秀的性能、可靠性和可擴展性而設計的統(tǒng)一的、分布式文件系統(tǒng)。Ceph的開發(fā)目標可以簡單定義為以下三項：

可輕松擴展到數(shù)PB容量
支持多種工作負載的高性能
高可靠性

1.2 高可用性

高可用性對文件存儲系統(tǒng)是極為重要的，因為數(shù)據(jù)是極為寶貴的，如果數(shù)據(jù)在OSS中很容易丟失或者不可靠，那么它的存在意義就不大了。

對于OSS的高可用，我們早就做了深思熟慮的思考。HBase的數(shù)據(jù)最終存儲HDFS中，而HDFS是指被設計成適合運行在通用硬件(commodity hardware)上的分布式文件系統(tǒng)（DistributedFile System）。我們可以通過定義它的多副本機制來達到它的高可用性。

和HBase類似，Ceph也可以通過多副本機制來實現(xiàn)它的高可用性。

同時，我們可以定義存儲的文件的過期時間來避免存儲的文件無限增長，在我們的應用中，默認設置為90天。

1.3 可擴展性

當系統(tǒng)的吞吐量越來越大，或者存儲容量以及快達到OSS所能承受的流量瓶頸時，我們可以通過橫向擴展相關組件來應對流量的變化。

對于直接對外提供Rest接口的Tomcat服務，如果單Tomcat服務器達到性能瓶頸時，我們可以增加Tomcat服務器來進行橫向擴展，同時為了對外提供統(tǒng)一的網(wǎng)關，我們增加了LVS+Keepalived這一層來實現(xiàn)，如下圖所示：

正常情況下，LVS使用DR模式代理若干臺Tomcat服務器，keepalived是實現(xiàn)LVS的高可用的。當其中一臺LVS出現(xiàn)故障下線后，keepalived通過虛擬IP技術快速切換到另外一臺可用的LVS上。

另外對于HBase和Ceph的擴展性是簡單易于實現(xiàn)的，只需要增加待擴展的機器，進行相關配置，即可快速加入集群，相應的數(shù)據(jù)也會進行rebalance。

1.4 限流算法

在上面的功能概覽中簡單的說明了在某些場景中我們需要進行流量限制，那么這里將詳細介紹限流的原理。

在OSS中，我們使用Guava的RateLimiter作為限流的組件。Guava的RateLimiter的限流方式有兩種：漏桶算法和令牌桶算法。我們采用的是令牌桶算法。

對于很多應用場景來說，除了要求能夠限制數(shù)據(jù)的平均傳輸速率外，還要求允許某種程度的突發(fā)傳輸。這時候漏桶算法可能就不合適了，令牌桶算法更為適合。如圖所示，令牌桶算法的原理是系統(tǒng)會以一個恒定的速度往桶里放入令牌，而如果請求需要被處理，則需要先從桶里獲取一個令牌，當桶里沒有令牌可取時，則拒絕服務。

我們的OSS就是采用令牌桶的方式來對流量進行限制的，當客戶端以某一穩(wěn)定的速率來向OSS寫入的時候，系統(tǒng)是穩(wěn)定的并且大多數(shù)的時候是這樣的。但是我們有時需要應對流量峰值，這個時候超過我們規(guī)定的流量就會被限制。現(xiàn)在問題來了，被限制的流量如果直接丟棄，那么可能重要的文件被丟棄，這樣顯然不符合我們對OSS定位為高可用存儲系統(tǒng)的要求。于是在限流的邏輯中我們加入了以下處理流程：當流量達到系統(tǒng)的瓶頸時，我們將被限流的流量寫入kafka，等到系統(tǒng)負載降低的時候，再從kafka中讀取這部分流量重放至OSS,這樣既保證了OSS的穩(wěn)定性，又解決因限流帶來的數(shù)據(jù)丟失問題。

2.功能概覽

2.1 文件上傳

客戶端以RESTFul接口方式向OSS服務器發(fā)送上傳文件的請求，OSS將文件存儲到HBase或Ceph中，然后向客戶端返回存儲的狀態(tài)。

我們將文件名作為存儲的唯一標識，這樣設計的好處有兩點，第一，我們不需要返回用戶文件在OSS服務器的存儲路徑；第二，也可以避免同名文件反復上傳。

2.2 文件下載

客戶端以RESTFul接口方式帶上需要查詢的文件名請求OSS服務器，OSS根據(jù)文件名查詢對應的文件，返回請求客戶端。

2.3 流量限制

流量限制是以一種被動的方式來對流量進行控制的方式。我們可以通過壓力測試來粗略估計OSS所能承受的最大壓力，然后在配置文件中配置限流的數(shù)值。這里要注意的是，需要根據(jù)業(yè)務的特點對限制的流量進行處理，其一，可以完全丟棄掉被限制的流量；其二，也可以對限制的流量進行相應的處理。

3.場景分析

現(xiàn)以公司某項目做講解來進一步說明OSS在項目中的實際應用以及最佳實踐。

3.1 項目的現(xiàn)狀

3.1.1 流量情況

以中期某城市交付為基準：每秒約120Gb流量，每天1.5億個文件，每秒大概1800個文件。

其它各分中心的數(shù)據(jù)均為上述城市的倍數(shù)，比如A中心的比例系數(shù)為33.33，那么它每秒的流量約4000Gb，每天約34億個文件，每秒大概6萬個文件，以此類推。

3.1.2 單機性能

目前單機Tomcat能支撐最大12000TPS，對于各中心每秒的數(shù)據(jù)量，單機顯然不能支撐這么大的數(shù)據(jù)量，我們需要采用Tomcat集群來支撐這么大的數(shù)據(jù)流量。

3.1.3 流量峰值

在進行機器數(shù)以及相關硬件進行評估時，需要考慮流量峰值的情況，我們一般以正常流量的2到3倍來進行規(guī)劃，比如，某個分中心的流量為每秒1300Gb，那么我們設計時就需要考慮峰值的情況，也就是最大能支撐每秒3900的流量。

3.2 集群的設計目標

基于上面描述的項目現(xiàn)狀，經過分析，我們的整個OSS集群需要實現(xiàn)以下設計目標：

各中心采用Tomcat集群來支撐數(shù)據(jù)流量
各中心的流量均衡打到每臺Tomcat服務器
負載均衡設備的高可用
存儲服務的穩(wěn)定性

3.3 最佳實踐

3.3.1 如何保證Tomcat單機的性能最優(yōu)

我們主要從以下幾個方面來優(yōu)化Tomcat的性能：

1）JVM內存大小

2）最大線程數(shù)（maxThreads）

3）最大連接數(shù)（maxConnections）

4）全連接隊列長度（acceptCount）

我們選用單臺機器來測試Tomcat的性能，硬件配置如下：

Tomcat的版本選用8.5.43。

測試的目標：

單臺Tomcat支持的最大并發(fā)數(shù)
單臺Tomcat支持的最大TPS
NIO模型和APR模型的性能對比

測試工具使用：ApacheBench。

我們使用對比測試的方法，分別測試在上傳1KB，10KB，100KB，1M，10M，100M的時候，Tomcat各項指標的數(shù)值。

Tomcat配置：maxThreads=100，minSpareThreads=10，acceptCount=102400，maxConnections=1000000，acceptorThreadCount=2

JVM配置：-Xmx16384m -Xms16384m

-Xmn1024m -XX:+UseConcMarkSweepGC

-XX:MaxPermSize=256m

1、使用NIO模型的測試結果如下：

根據(jù)以上測試結果可得出以下結論：

1）在上傳相同文件大小的情況下，隨著并發(fā)數(shù)的增大，會出現(xiàn)一定的丟包情況；

2）在相同并發(fā)量的情況下，隨著上傳文件大小增大，吞吐量會隨之下降。

2、使用APR模型的測試結果如下：

根據(jù)以上測試結果以及對比NIO模型的測試結果，我們可以得出以下結論：

1）小文件上傳APR模式不如NIO模式，大文件上傳APR模式要好于NIO模式；

2）隨著并發(fā)的增加，TPS先增加后減少，平均響應時間不斷增加；

3）小文件應該關注TPS，大文件應該關注平均響應時間；

4）小文件TPS大概在2萬到3萬之間，能接受的并發(fā)在300到500之間。

3.3.2 如何保證HBase存儲的穩(wěn)定性

HBase以高吞吐著稱，那么我們應該如何在保證高吞吐的情況下，能保證穩(wěn)定的存儲。主要應該關注兩個點：

1）GC的次數(shù)以及停頓時間；

2）HBase的compaction機制。

3.3.2.1 GC調優(yōu)

由于HBase是使用Java編寫的，所以垃圾收集（GC）對HBase的影響也是很大的，我們需要適當調整GC相關的參數(shù)，使得HBase能達到較好的性能和穩(wěn)定的運行。在JVM中，有很多種垃圾收集器，我們在項目中使用的是CMS GC，下面首先介紹CMS GC的工作原理，再詳細說明調優(yōu)的相關細節(jié)。

3.3.2.2 GC調優(yōu)目標

在介紹具體的調優(yōu)技巧之前，有必要先來看看GC調優(yōu)的最終目標和基本原則：

1）平均Minor GC時間盡可能短；

2）CMS GC次數(shù)越少越好。

3.3.2.3 HBase 場景內存分析

一般來講，每種應用都會有自己的內存對象特性，分類來說無非就兩種：一種是對象的生存期較短的工程，比如大多數(shù)的HTTP請求處理工程，這類的對象可能占到所有對象的70%左右；另一種是對象生存期居多的工程，比如類似于HBase，F(xiàn)link等這類大內存工程。這里以HBase為例，來看看具體的內存對象：

1）RPC請求對象

2）Memstore對象

3）BlockCache對象

因此可以看到，HBase系統(tǒng)屬于對象生存期居多的工程，因為GC的時候只需要將RPC這類對象生存期較短的Young區(qū)淘汰掉就可以達到最好的GC效果。

在HBase優(yōu)化中比較關鍵的兩個GC的參數(shù)。

1）年輕代Young區(qū)的大??；

2）年輕代Young區(qū)中的Survivor區(qū)的大小以及進入老年代的閾值。

3.3.2.4 生產環(huán)境中的GC配置

假設我們機器的物理內存是80G，所以根據(jù)上面的分析，我們可以對相關的參數(shù)做如下配置：

1）緩存模式采用BucketCache策略Offheap模式

2）內存我們采用如下配置：

-Xmx64g -Xms64g -Xmn4g -Xss256k

-XX:MaxPermSize=512m

-XX:SurvivorRatio=2

-XX:+UseConcMarkSweepGC

-XX:+UseParNewGC

-XX:+CMSParallelRemarkEnabled

-XX:MaxTenuringThreshold=15

-XX:+UseCMSCompactAtFullCollection

-XX:+UseCMSInitiatingOccupancyOnly

-XX:CMSInitiatingOccupancyFraction=75

-XX:-DisableExplicitGC

3.3.3 如何保證大流量情況下系統(tǒng)穩(wěn)定運行

4.OSS監(jiān)控

OSS在運行過程中，我們需要了解相關的監(jiān)控信息，比如每種文件類型在一段時間的占比，或者在一段時間的網(wǎng)絡吞吐量等等，下面就來一一介紹我們是如何來對OSS進行監(jiān)控的吧。

4.1 以文件類型劃分的指定時間段內的總存儲占比

該圖表用于統(tǒng)計當前OSS中各文件類型存儲的占比。

4.2 以文件類型劃分的指定時間段內的文件數(shù)量占比

該圖表用于統(tǒng)計當前OSS中各文件類型數(shù)量的占比。

4.3 OSS服務指定時間段內的網(wǎng)絡吞吐量

該圖表用于統(tǒng)計OSS的吞吐量。

4.4 OSS服務指定時間段內的每秒并發(fā)處理數(shù)（TPS）

該圖表用于統(tǒng)計當前OSS的負載情況。

5.結語與展望

我們認為，OSS一定會成為一個集安全性、可靠性于一體的底層存儲服務?；贠SS，在公安領域可以存儲天網(wǎng)中的卡口和視頻數(shù)據(jù)，并與公安內部的其他應用形成一個基于高可用存儲、多方向應用的解決方案；在社會治理方面，可以存儲網(wǎng)絡上的各種類型的數(shù)據(jù)，包括文字、音頻以及視頻，通過使用人工智能分析其中的關聯(lián)性，為社會提供更安全的保證。

分享到

百分點

xiesc

相關推薦

近期文章

熱門標簽