外包裝盒上展示了P3的主要信息,包括英睿達(dá)的公司logo,P3名稱,同時(shí)包裝上注明了這是1款2TB、PCIe 3.0的NVMe M.2 SSD。
P3的最高讀帶寬3500MB/s。SSD本體放在一個(gè)塑料殼中,此外還有一個(gè)用于固定的螺絲和一個(gè)說明書。
SSD正反面各有一個(gè)標(biāo)簽,正面的標(biāo)簽更多是一個(gè)產(chǎn)品標(biāo)識(shí),而反面則是盤的PN、SN、固件版本、認(rèn)證信息、電壓電流等基本信息。
同時(shí),我們拿到的這片P3 上顯示是ASSEMBLED IN MEXICO,也就是在墨西哥組裝生產(chǎn)的。
基本配置信息
從基本信息上看,P3 支持NVMe 1.4及PCIe 3.0協(xié)議,支持6w、3w、1.5w及0.0250W和0.0030W共5檔最高功耗,這使得用戶可以按照自身的需求控制P3功耗。
此外,P3支持512Byte和4096Bytes兩種Lba format格式,針對不同的系統(tǒng)和軟件,正確的選用合適的LBA format有助于提升性能。
性能與功耗
性能和功耗是NVMe SSD最主要的兩個(gè)維度,而性能則可以細(xì)分為順序讀寫、隨機(jī)讀寫兩類負(fù)載,加上大壓力大小、讀寫混合比等不同的指標(biāo),又可以進(jìn)一步劃分不同的評估指標(biāo),而功耗則可以分為idle功耗及帶負(fù)載的功耗。
測試平臺(tái)
CPU:AMD Ryzen 5 3600 6-Core Processor
Memory :16GB
Os: Windows 10
測試工具 : Crytal Diskmark
性能測試結(jié)果如下:
在上述測試過程中,我們讀取了不同的負(fù)載下的性能和功耗。如下圖:
test | item | Bandwidth (MB/s) | power consumption (w) |
idle | na | 0.47 | |
seq1mq8t1 | read | 3509 | 2.9 |
seq128kq32t1 | read | 2498 | 3 |
rnd4kq32t16 | read | 945 | 2.1 |
rnd4kq1t1 | read | 61 | 1.2 |
seq1mq8t1 | write | 3146 | 2.8 |
seq128kq32t1 | write | 3098 | 2.9 |
rnd4kq32t1 | write | 529 | 1.95 |
rnd4kq1t1 | write | 301 | 1.98 |
P3在idle狀態(tài)下,功耗只有470mW,這意味著當(dāng)用戶不使用時(shí),大量的SSD的資源被關(guān)閉,P3僅需極少電量就可以維持一個(gè)基本的運(yùn)行狀態(tài),在用戶使用時(shí)可以快速切換至運(yùn)行狀態(tài)。
這樣的低功耗模式廣泛應(yīng)用于消費(fèi)級的各類產(chǎn)品中。
可以看到1m block size下,盤確實(shí)可以達(dá)到標(biāo)稱的3.5GB/s,這是個(gè)很大的io size,降低block size到128k之后的讀帶寬會(huì)下降。
事實(shí)上P3的identify controller數(shù)據(jù)結(jié)構(gòu)中顯示mdts為6,依照nvme 協(xié)議,mdts顯示了一個(gè)盤最大處理的單個(gè)io的buffer size,超過256k的io將被系統(tǒng)分為多個(gè)io下發(fā)。
這里我們將io的block size設(shè)置為256k,可以看到和1m block size類似的結(jié)果。為了對盤的性能做進(jìn)一步評估,我們搭建了一個(gè)linux環(huán)境,并使用fio對盤做預(yù)處理操作,并盡可能讓P3進(jìn)到順序穩(wěn)態(tài)和隨機(jī)穩(wěn)態(tài)里,進(jìn)而評估其帶寬和IOPS、延時(shí)。
測試平臺(tái)2
CPU:AMD Ryzen 5 3600 6-Core Processor
Memory :16GB
Os: Centos8.4 (kernel 4.18.0-305)
測試工具:FIO 3.25
順序負(fù)載的測試
預(yù)處理為順序?qū)?~100GiB,之后的測試參數(shù)也均在這個(gè)lba 范圍里測試)。
順序讀寫帶寬測試(每項(xiàng)測試為1分鐘預(yù)熱,5分鐘測試)結(jié)果:
測試項(xiàng) | 帶寬(MB/s) |
256k 順序?qū)?QD 1×64 | 3240MB/s |
256k順序讀 QD 1×64 | 3669MB/s |
256k順序?qū)?QD 1×32 | 3242MB/s |
256k順序讀 QD 1×32 | 3668MB/s |
QD1x64和QD1x32 可以理解為負(fù)載壓力大小,可以看出,在穩(wěn)態(tài)下,P3的讀可以達(dá)到2.6GB/s,寫在小壓力下表現(xiàn)會(huì)優(yōu)于大壓力下的性能,對于個(gè)人PC而言,小壓力表現(xiàn)更可以評估其使用體驗(yàn),因?yàn)榇蟮膲毫π枰獞?yīng)用、CPU、內(nèi)存等整個(gè)系統(tǒng)級別的高效協(xié)作。
在上述測試之后,接著做了順序延時(shí)實(shí)驗(yàn),結(jié)果如下:
測試項(xiàng) | 延時(shí) (us) |
4k 順序?qū)慟D1x1 | 6 |
4k 順序讀QD1x1 | 21.3 |
隨機(jī)讀寫測試
預(yù)處理為大壓力全盤4k隨機(jī)寫20分鐘,由于盤之前已經(jīng)使用順序負(fù)載填滿了數(shù)據(jù),所以隨機(jī)預(yù)處理并不需要全盤寫滿。
4k隨機(jī)讀寫峰值IOPS:
測試項(xiàng) | IOPS |
4k 隨機(jī)寫 QD 4×32 | 15.8k |
4k隨機(jī)讀 QD 4×32 | 85.5k |
4k隨機(jī)寫QD 4×8 | 14.3k |
4k隨機(jī)讀 QD 4×8 | 85.8k |
4k 混合隨機(jī)讀寫 QD 4×32 | 36k |
測試項(xiàng) | 延時(shí) (us) |
4k 隨機(jī)寫QD1x1 | 70.99 |
4k 隨機(jī)讀QD1x1 | 136.89 |
管理工具
英睿達(dá)擁有一款SSD管理工具,可以方便的安裝在Windows系統(tǒng)中對P3進(jìn)行監(jiān)控和管理。
從上圖可以看到這片P3的溫度為30度,有1個(gè)namespace。從右側(cè)還可以看到一些命令可以做進(jìn)一步的管理和debug操作。
總結(jié)
雖然新一代的處理器已經(jīng)開始支持PCIe 5.0,但是從性價(jià)比的角度,PCIe 3.0的P3仍然是個(gè)不錯(cuò)的選擇。
首先從M.2規(guī)范角度看,其功耗和散熱都有其局限性,所以,PCIe 5.0并不會(huì)為M.2的SSD帶來性能的質(zhì)的提升,反而會(huì)消耗寶貴的PCIe 5.0的插槽或者PCIe lane資源。
另一方面,整個(gè)PC系統(tǒng)像是一個(gè)木桶,要發(fā)揮SSD的性能,就需要CPU、內(nèi)存、系統(tǒng)、應(yīng)用都做相應(yīng)的優(yōu)化,反而低負(fù)載下SSD的性能和延時(shí)表現(xiàn)更容易影響用戶的體驗(yàn)。
而P3的超3GB/s的讀寫帶寬和數(shù)萬隨機(jī)讀寫IOPS等基礎(chǔ)性能指標(biāo)已經(jīng)做的非常好了,在順序讀寫和隨機(jī)讀寫延時(shí)上都處于微秒級別。從吞吐帶寬到響應(yīng)性能表現(xiàn),均有不錯(cuò)表現(xiàn)。
另一方面,P3的idle功耗和各類負(fù)載下的功耗均表現(xiàn)良好,且有多檔功耗供用戶選擇,可以說是在多種因素上取得了較好的平衡。