就日常的服務(wù)器監(jiān)控而言,我覺得nmon是我的Linux系統(tǒng)管理工具包中最有用的一個(gè)程序。

pmap

pmap命令用來(lái)報(bào)告服務(wù)器的進(jìn)程所使用的內(nèi)存量。你可以用這個(gè)工具來(lái)確定服務(wù)器上哪些進(jìn)程被分配了內(nèi)存、這些進(jìn)程中有誰(shuí)在大量使用內(nèi)存。

ps和pstree

ps和pstree這兩個(gè)命令是Linux系統(tǒng)管理員的兩個(gè)得力助手。它們都能以列表的形式顯示所有目前在運(yùn)行的進(jìn)程。ps可以告訴你服務(wù)器的程序在使用多少的內(nèi)存和處理器時(shí)間。pstree顯示的信息比較少,但著重表明了哪些進(jìn)程是其他進(jìn)程的子進(jìn)程。掌握了這些信息,你就能發(fā)現(xiàn)失控的進(jìn)程,然后用Linux“不留活口”的kill命令,來(lái)終止這些進(jìn)程。

sar

sar程序好比是系統(tǒng)監(jiān)控工具領(lǐng)域的瑞士軍刀。sar命令實(shí)際上由三個(gè)程序組成:顯示數(shù)據(jù)的sar、收集數(shù)據(jù)的sa1以及保存數(shù)據(jù)的sa2。一旦安裝完畢,sar就能生成詳細(xì)的概要信息,顯示處理器使用率、內(nèi)存分頁(yè)活動(dòng)、網(wǎng)絡(luò)輸入/輸出和傳輸方面的統(tǒng)計(jì)信息、進(jìn)程創(chuàng)建活動(dòng)以及磁盤設(shè)備活動(dòng)。sar和nmon的一大區(qū)別在于,前者更適合長(zhǎng)期監(jiān)控系統(tǒng),我覺得nmon則比較適合幫助我快速查看服務(wù)器的運(yùn)行狀況。

strace

strace 經(jīng)常被認(rèn)為是程序員的調(diào)試工具,但它的功用不僅僅用來(lái)調(diào)試。它可以截獲和記錄進(jìn)程調(diào)用系統(tǒng)的情況。因而,它是一個(gè)實(shí)用的診斷、教學(xué)和調(diào)試工具。比如說,你可以使用strace來(lái)查出某個(gè)程序在啟動(dòng)時(shí)實(shí)際上使用哪個(gè)配置文件。

不過strace的確有一個(gè)缺陷。它在檢查某個(gè)進(jìn)程時(shí),該進(jìn)程的性能會(huì)一落千丈。因而,只有在我已經(jīng)有極其充分的理由認(rèn)為某個(gè)程序引起問題的情況下,才使用strace。

tcpdump

tcpdump是一個(gè)簡(jiǎn)單而可靠的網(wǎng)絡(luò)監(jiān)控實(shí)用工具。其基本的協(xié)議分析功能讓你能夠粗略查看網(wǎng)絡(luò)上的情況。不過想真正深入分析網(wǎng)絡(luò)方面的情況,你應(yīng)該使用Wireshark(下面有介紹)。

top

top命令顯示了活動(dòng)進(jìn)程方面的情況。默認(rèn)情況下,它顯示了服務(wù)器上運(yùn)行的最消耗處理器的任務(wù),而且每5秒鐘就刷新一次列表。你還可以按多個(gè)標(biāo)準(zhǔn)對(duì)進(jìn)程進(jìn)行分類,比如PID(進(jìn)程ID);年限,最新的列在最前面;時(shí)間,按累計(jì)時(shí)間;以及駐留內(nèi)存使用情況和自啟動(dòng)以來(lái)一直使用處理器的總時(shí)間。我覺得它提供了一種快速而簡(jiǎn)易的方法,便于查看有沒有進(jìn)程開始即將失控、帶來(lái)問題。

uptime

uptime可用來(lái)查看某臺(tái)服務(wù)器運(yùn)行了多久、有多少個(gè)用戶登錄上去。它還顯示了服務(wù)器平均負(fù)載的概要信息。負(fù)載的最佳值是1或更小,這意味著每個(gè)進(jìn)程可以立即訪問處理器、不存在處理器周期丟失的情況。

vmstat

大體上來(lái)說,你可以使用vmstat來(lái)監(jiān)控虛擬內(nèi)存方面的情況。Linux不斷使用虛擬內(nèi)存,以獲得最佳的存儲(chǔ)性能。

如果你的應(yīng)用程序在占用過多的內(nèi)存,你就會(huì)遇到頻繁被換出內(nèi)存(page-out)的情況——即程序從內(nèi)存進(jìn)入到系統(tǒng)硬驅(qū)上的交換空間。你的服務(wù)器可能會(huì)進(jìn)入到這個(gè)階段:花在管理內(nèi)存分頁(yè)上的時(shí)間比花在運(yùn)行應(yīng)用程序上的時(shí)間還多——這種情況被稱為抖動(dòng)(thrashing)。當(dāng)你的電腦抖動(dòng)時(shí),性能就一落千丈。Vmstat可以顯示平均的數(shù)據(jù)或?qū)嶋H樣本,可以幫助你發(fā)覺大量耗用內(nèi)存的程序和進(jìn)程,以免它們導(dǎo)致服務(wù)器運(yùn)行起來(lái)如同蝸牛緩行。

Wireshark

Wireshark之前名為Ethereal(而且現(xiàn)在仍經(jīng)常這么叫),是tcpdump的同類工具,不過它更為高級(jí),擁有先進(jìn)得多的協(xié)議分析和報(bào)告功能。Wireshark既有GUI界面,又有外殼界面。如果你從事專業(yè)級(jí)的網(wǎng)絡(luò)管理工作,只能使用ethereal。而如果你在使用Wireshark/ethereal,我強(qiáng)烈建議閱讀Chris Sander所著的《實(shí)用數(shù)據(jù)包分析》(Practical Packet Analysis),該書深入淺出地介紹了如何最充分地利用這款實(shí)用程序。

本文只是從總體上概述了一些Linux最有價(jià)值的系統(tǒng)監(jiān)控程序。不過,如果你熟練掌握了這些程序,就為成為頂尖的 Linux系統(tǒng)管理員打下了基礎(chǔ)。

分享到

zhaohang

相關(guān)推薦