很多朋友對于服務(wù)器 監(jiān)控和服務(wù)器用什么監(jiān)控軟件好不太懂,今天就由小編來為大家分享,希望可以幫助到大家,下面一起來看看吧!
本文目錄
Linux服務(wù)器監(jiān)控軟件有哪些
Cacti:是一套基于PHP,MySQL,SNMP及RRDTool開發(fā)的網(wǎng)絡(luò)流量監(jiān)測圖形分析工具,嚴(yán)格意思是說它只能是監(jiān)控網(wǎng)絡(luò)設(shè)備。
Zabbix:是一個(gè)基于WEB界面的提供分布式系統(tǒng)監(jiān)視以及網(wǎng)絡(luò)監(jiān)視功能的企業(yè)級的開源解決方案。
Nagios:是一款開源的免費(fèi)網(wǎng)絡(luò)監(jiān)視工具,能有效監(jiān)控Windows、Linux和Unix的主機(jī)狀態(tài),交換機(jī)路由器等網(wǎng)絡(luò)設(shè)備,打印機(jī)等.
4.Ganglia:是一款為HPC(高性能計(jì)算)集群而設(shè)計(jì)的可擴(kuò)展的分布式監(jiān)控系統(tǒng),簡單一點(diǎn)來說就是監(jiān)控大規(guī)模服務(wù)器才需要使用到。
優(yōu)點(diǎn)Cacti出圖比較好,比較適合作交換機(jī)和路由器監(jiān)控。
Zabbix適合中小企業(yè)日常部署,監(jiān)控Linux服務(wù)器、Windows服務(wù)器、路由器、交換機(jī),報(bào)警機(jī)制也很友好,可以郵件,微信,短信報(bào)警。
Nagios適合中小企業(yè)部署使用,監(jiān)控Linux服務(wù)器、路由器、交換機(jī),報(bào)警機(jī)制有郵件、短信。
Ganglia適合大型企業(yè)部署使用,分布式存儲(chǔ),以集群方式來監(jiān)控,每個(gè)區(qū)域的Node來監(jiān)控?cái)?shù)據(jù)。缺點(diǎn)Catic對服務(wù)器監(jiān)控不好用。Zabbix對超大型、數(shù)據(jù)量并發(fā)很高的應(yīng)用監(jiān)控不好,監(jiān)控會(huì)有延時(shí),精度不夠,有些監(jiān)控參數(shù)需要會(huì)寫監(jiān)控腳本完成。
Nagios部署比較復(fù)雜,沒有經(jīng)驗(yàn)的用戶會(huì)被折磨。出圖效果不佳需要借助于RRDTool工具出圖。
Ganglia部署成本較高,需要多臺主機(jī),部署相對復(fù)雜。
部署Zabbix最為便捷使用Centos7系統(tǒng)安裝LAMP環(huán)境搭建一個(gè)環(huán)境,安裝zabbix軟件,具體操作如下:
1,安裝zabbix源
2,安裝Zabbixserver,Web前端
3,安裝MySQL源
4,查看可用的Mysql安裝源:yumrepolistenabled|grep"mysql.*-community.*"
5,安裝MySQL服務(wù):yum-yinstallmysql-community-server
5,啟動(dòng)MySQL服務(wù),并且開機(jī)自啟動(dòng)。
6,查看MySQL服務(wù)啟動(dòng)正常:
7,查看登陸MySQL密碼:yG&t<kt*.3Qt
9,登陸MySQL
8,更改MySQL密碼:
9,創(chuàng)建數(shù)據(jù)庫和zabbix用戶并授權(quán):
10,導(dǎo)入初始架構(gòu)和數(shù)據(jù)
11,檢查數(shù)據(jù)庫導(dǎo)入情況
12,先備份配置文檔
13,修改配置文件
[root@localhost~]#vim/etc/zabbix/zabbix_server.conf
14,給主目錄文檔授權(quán)
15,啟動(dòng)ZabbixServer服務(wù)
16,修改Zabbix默認(rèn)時(shí)區(qū)為shanghai
[root@localhost~]#vim/etc/httpd/conf.d/zabbix.conf+20
17,啟動(dòng)Apache服務(wù)
18,登陸瀏覽器操作
最后一步下載php
19,把下載下來的文件上傳到/etc/zabbix/,你可以使用rz工具上傳這個(gè)文件。
20,最后打開登陸頁面
總結(jié)以上是我工作中用到感覺最為方便的一款監(jiān)控軟件,希望能夠?qū)δ阌兴鶐椭蚕M芎途W(wǎng)絡(luò)上朋友一起多交流。
當(dāng)然是服務(wù)器好。
第一,數(shù)據(jù)安全,一般服務(wù)器都做了raid,即使磁盤壞了,也不會(huì)丟失數(shù)據(jù)。
第二,調(diào)取錄像方便,通過一個(gè)平臺,一套鍵盤鼠標(biāo)就可以調(diào)取監(jiān)控錄像。
第三,成本低,如果上千個(gè)攝像頭,用錄像機(jī)64路的話要100多個(gè),而服務(wù)器只用1個(gè)就行,既節(jié)省空間,又節(jié)省成本。
首先這個(gè)問題非常專業(yè),還好我有多年這方面的經(jīng)驗(yàn),我就來回答下這個(gè)問題吧
服務(wù)器在公司的數(shù)字業(yè)務(wù)當(dāng)中,用來存放或者運(yùn)行公司的數(shù)據(jù)業(yè)務(wù),充當(dāng)著至關(guān)重要的角色,需要服務(wù)器的公司一般少則幾臺,多則成千上萬臺,甚至幾十萬臺都有可能!那么就如標(biāo)題所問的,如何來管理這么多的服務(wù)器就成了一個(gè)非常重要的問題。
如果企業(yè)里只有幾臺服務(wù)器,一臺一臺的來管理尚可實(shí)現(xiàn),但是一旦到了幾十臺以上就需要進(jìn)行專業(yè)的管理了!目前國內(nèi)已經(jīng)有一些非常優(yōu)秀的服務(wù)器管理軟件,我就以我用過的一個(gè)給大家做一下功能說明(為了防止打廣告嫌疑,我隱去了軟件名稱):
1、多服務(wù)器統(tǒng)一管理
快速查看各個(gè)機(jī)器實(shí)時(shí)數(shù)據(jù),高效的集中管理服務(wù)器,免去來回切換及記錄密碼的煩惱
2、跨越平臺,便捷登錄
3、權(quán)限分配,安全管理
4、運(yùn)行數(shù)據(jù),一目了然
5、命令群發(fā)
6、多服務(wù)器數(shù)據(jù)同步,快速自動(dòng)備份
這是一般服務(wù)器管理軟件需要具備的常用功能,當(dāng)然每個(gè)平臺還有一些其他的實(shí)用功能,我就不在這里贅述,希望我的回答能夠?qū)τ行枰娜似鸬綊伌u引玉的作用!
現(xiàn)在所有的企業(yè)都基本需要用到服務(wù)器,那么服務(wù)器的所有信息都應(yīng)該得到監(jiān)控,以便管理然而一臺服務(wù)器每天需要監(jiān)控的東西其實(shí)很多,比如常見的有以下內(nèi)容:
一、網(wǎng)站故障監(jiān)控,如果你所運(yùn)行的項(xiàng)目出現(xiàn)了故障服務(wù)器要自動(dòng)以短信或者郵件提醒的方式通知你,如果沒有這個(gè)監(jiān)控,或許等你發(fā)現(xiàn)時(shí)損失已經(jīng)很大。
二、服務(wù)器性能監(jiān)控,其實(shí)就對服務(wù)器(計(jì)算機(jī))CPU、內(nèi)存、硬盤、負(fù)載等硬件使用多少的一個(gè)監(jiān)控,如果出現(xiàn)了服務(wù)器硬件使用消耗過大那么就要考慮是否升級服務(wù)器配置了。
三、網(wǎng)站安全監(jiān)控,如果網(wǎng)站遭到黑客的攻擊這時(shí)服務(wù)器如果有這項(xiàng)監(jiān)控那么就會(huì)立刻通知你,這時(shí)采取相應(yīng)的措施反攻擊,以免自己的網(wǎng)站受到攻擊。網(wǎng)站安全可以說是非常重要的,一旦黑客攻擊進(jìn)來你的網(wǎng)站數(shù)據(jù)丟失,損失就很大了。
四、用戶訪問速度監(jiān)控,監(jiān)控所有訪問本服務(wù)器的用戶的訪問速度。
五、備份數(shù)據(jù)監(jiān)控,查看網(wǎng)站的備份是否成功,哪些網(wǎng)站備份過、哪些沒有。網(wǎng)站備份可以讓你的數(shù)據(jù)有個(gè)保存,出現(xiàn)了突發(fā)問題可以立馬恢復(fù)到上一個(gè)版本。所以說網(wǎng)站的備份大家也要注重。
六、端口監(jiān)控,服務(wù)器中端口檢測也尤為重要,監(jiān)控服務(wù)器開啟了哪些端口哪些端口被占用,如果某些端口被一些不知名的IP或者程序占用那么就要考慮是不是服務(wù)器中了病毒,被黑客所利用。
以上只是個(gè)人觀點(diǎn),不足之處還請大家補(bǔ)充。
概述
今天主要對mpstat、iostat、sar、vmstat命令做一下總結(jié),這幾個(gè)命令都是屬于運(yùn)維人員必須掌握的,所以,能不偷懶就不偷懶了。
1、mpstat
mpstat是MultiprocessorStatistics的縮寫,是實(shí)時(shí)監(jiān)控工具,報(bào)告與cpu的一些統(tǒng)計(jì)信息這些信息都存在/proc/stat文件中,在多CPU系統(tǒng)里,其不但能查看所有的CPU的平均狀況的信息,而且能夠有查看特定的cpu信息,mpstat最大的特點(diǎn)是:可以查看多核心的cpu中每個(gè)計(jì)算核心的統(tǒng)計(jì)數(shù)據(jù);而且類似工具vmstat只能查看系統(tǒng)的整體cpu情況。
實(shí)例:查看多核cpu當(dāng)前運(yùn)行的狀況,每兩秒更新一次,一共更新5次
#mpstat25
說明:
%user在internal時(shí)間段里,用戶態(tài)的CPU時(shí)間(%),不包含nice值為負(fù)進(jìn)程(usr/total)*100
%nice在internal時(shí)間段里,nice值為負(fù)進(jìn)程的CPU時(shí)間(%)(nice/total)*100
%sys在internal時(shí)間段里,內(nèi)核時(shí)間(%)(system/total)*100
%iowait在internal時(shí)間段里,硬盤IO等待時(shí)間(%)(iowait/total)*100
%irq在internal時(shí)間段里,硬中斷時(shí)間(%)(irq/total)*100
%soft在internal時(shí)間段里,軟中斷時(shí)間(%)(softirq/total)*100
%idle在internal時(shí)間段里,CPU除去等待磁盤IO操作外的因?yàn)槿魏卧蚨臻e的時(shí)間閑置時(shí)間(%)(idle/total)*100
2、iostat
iostat用于輸出CPU和磁盤I/O相關(guān)的統(tǒng)計(jì)信息.
語法:
iostat[-c][-d][-h][-N][-k|-m][-t][-V][-x][-z][device[...]|ALL][-p[device[,...]|ALL]][interval[count]]
實(shí)例1:
--參數(shù)-d表示顯示設(shè)備磁盤的使用狀態(tài);-k表示某些使用block為單位的列強(qiáng)制使用kilobytes為單位,2表示數(shù)據(jù)每隔2秒刷新一次6表示一共刷新6次
#iostat-d-k26
說明:
tps:該設(shè)備每秒的傳輸次數(shù)(Indicatethenumberoftransferspersecondthatwereissuedtothedevice.)。
"一次傳輸"意思是"一次I/O請求"。多個(gè)邏輯請求可能會(huì)被合并為"一次I/O請求"。"一次傳輸"請求的大小是未知的。
kB_read/s:每秒從設(shè)備(driveexpressed)讀取的數(shù)據(jù)量;
kB_wrtn/s:每秒向設(shè)備(driveexpressed)寫入的數(shù)據(jù)量;
kB_read:讀取的總數(shù)據(jù)量;
kB_wrtn:寫入的總數(shù)量數(shù)據(jù)量;這些單位都為Kilobytes。
實(shí)例2:
--可以把K單位換成M
#iostat-d-m26
實(shí)例3:
--使用iostat查看cpu統(tǒng)計(jì)信息使用-C參數(shù)
#iostat-c26
實(shí)例4:-X參數(shù)
--iostat還有一個(gè)比較常用的-X參數(shù),該選項(xiàng)將用于顯示和io相關(guān)的擴(kuò)展數(shù)據(jù)。
#iostat-d-x-k16
3、sar
sar(SystemActivityReporter系統(tǒng)活動(dòng)情況報(bào)告)是目前Linux上最為全面的系統(tǒng)性能分析工具之一,可以從多方面對系統(tǒng)的活動(dòng)進(jìn)行報(bào)告,包括:文件的讀寫情況、系統(tǒng)調(diào)用的使用情況、磁盤I/O、CPU效率、內(nèi)存使用狀況、進(jìn)程活動(dòng)及IPC有關(guān)的活動(dòng)等,sar命令有sysstat安裝包安裝。
語法:
sar[options][<interval>[<count>]]
--Optionsare:
-A:所有報(bào)告的總和
-b:顯示I/O和傳遞速率的統(tǒng)計(jì)信息
-B:顯示換頁狀態(tài)
-d:輸出每一塊磁盤的使用信息
-e:設(shè)置顯示報(bào)告的結(jié)束時(shí)間
-f:從制定的文件讀取報(bào)告
-i:設(shè)置狀態(tài)信息刷新的間隔時(shí)間
-P:報(bào)告每個(gè)CPU的狀態(tài)
-R:顯示內(nèi)存狀態(tài)
–u:輸出cpu使用情況和統(tǒng)計(jì)信息
–v:顯示索引節(jié)點(diǎn)、文件和其他內(nèi)核表的狀態(tài)
-w:顯示交換分區(qū)的狀態(tài)
-x:顯示給定進(jìn)程的裝
-r:報(bào)告內(nèi)存利用率的統(tǒng)計(jì)信息
實(shí)例1:
--每2秒采樣一次,連續(xù)4次,觀察cpu的使用情況,并將采樣的結(jié)果以二進(jìn)制形式存入當(dāng)前目錄下的文件sar中,如下:
#sar-u-osar24
實(shí)例2:
--從二進(jìn)制中調(diào)取
#sar-u-f/root/sar
實(shí)例3:
--報(bào)告每個(gè)cpu的狀態(tài),1秒一次,一共4次
#sar-p14
實(shí)例4:
--查看平均負(fù)載
#sar-q
實(shí)例5:
--查看內(nèi)存使用情況
#sar-r
實(shí)例6:
--查看系統(tǒng)swap分區(qū)的統(tǒng)計(jì)信息
#sar-w
實(shí)例7:
--磁盤使用統(tǒng)計(jì)信息
#sar-d
默認(rèn)監(jiān)控:
sar55//CPU和IOWAIT統(tǒng)計(jì)狀態(tài)
(1)sar-b55//IO傳送速率
(2)sar-B55//頁交換速率
(3)sar-c55//進(jìn)程創(chuàng)建的速率
(4)sar-d55//塊設(shè)備的活躍信息
(5)sar-nDEV55//網(wǎng)路設(shè)備的狀態(tài)信息
(6)sar-nSOCK55//SOCK的使用情況
(7)sar-nALL55//所有的網(wǎng)絡(luò)狀態(tài)信息
(8)sar-PALL55//每顆CPU的使用狀態(tài)信息和IOWAIT統(tǒng)計(jì)狀態(tài)
(9)sar-q55//隊(duì)列的長度(等待運(yùn)行的進(jìn)程數(shù))和負(fù)載的狀態(tài)
(10)sar-r55//內(nèi)存和swap空間使用情況
(11)sar-R55//內(nèi)存的統(tǒng)計(jì)信息(內(nèi)存頁的分配和釋放、系統(tǒng)每秒作為BUFFER使用內(nèi)存頁、每秒被cache到的內(nèi)存頁)
(12)sar-u55//CPU的使用情況和IOWAIT信息(同默認(rèn)監(jiān)控)
(13)sar-v55//inode,fileandotherkerneltablesd的狀態(tài)信息
(14)sar-w55//每秒上下文交換的數(shù)目
(15)sar-W55//SWAP交換的統(tǒng)計(jì)信息(監(jiān)控狀態(tài)同iostat的siso)
(16)sar-x290655//顯示指定進(jìn)程(2906)的統(tǒng)計(jì)信息,信息包括:進(jìn)程造成的錯(cuò)誤、用戶級和系統(tǒng)級用戶CPU的占用情況、運(yùn)行在哪顆CPU上
(17)sar-y55//TTY設(shè)備的活動(dòng)狀態(tài)
(18)將輸出到文件(-o)和讀取記錄信息(-f)
4、vmstat
vmstat命令是最常見的Linux/Unix監(jiān)控工具,可以展現(xiàn)給定時(shí)間間隔的服務(wù)器的狀態(tài)值,包括服務(wù)器的CPU使用率,內(nèi)存使用,虛擬內(nèi)存交換情況,IO讀寫情況。這個(gè)命令是我查看Linux/Unix最喜愛的命令,一個(gè)是Linux/Unix都支持,二是相比top,我可以看到整個(gè)機(jī)器的CPU,內(nèi)存,IO的使用情況,而不是單單看到各個(gè)進(jìn)程的CPU使用率和內(nèi)存使用率(使用場景不一樣)。
實(shí)例1:
--第一個(gè)參數(shù)是采樣的時(shí)間間隔數(shù),單位是秒,第二個(gè)參數(shù)是采樣的次數(shù)
--如果想在一段時(shí)間內(nèi)一直監(jiān)控可執(zhí)行#vmstat2
#vmstat26
說明:
r表示運(yùn)行隊(duì)列(就是說多少個(gè)進(jìn)程真的分配到CPU),當(dāng)這個(gè)值超過了CPU數(shù)目,就會(huì)出現(xiàn)CPU瓶頸了。這個(gè)也和top的負(fù)載有關(guān)系,一般負(fù)載超過了3就比較高,超過了5就高
,超過了10就不正常了,服務(wù)器的狀態(tài)很危險(xiǎn)。top的負(fù)載類似每秒的運(yùn)行隊(duì)列。如果運(yùn)行隊(duì)列過大,表示你的CPU很繁忙,一般會(huì)造成CPU使用率很高。
b表示阻塞的進(jìn)程
swpd虛擬內(nèi)存已使用的大小,如果大于0,表示你的機(jī)器物理內(nèi)存不足了,如果不是程序內(nèi)存泄露的原因,那么你該升級內(nèi)存了或者把耗內(nèi)存的任務(wù)遷移到其他機(jī)器。
free空閑的物理內(nèi)存的大小
buffLinux/Unix系統(tǒng)是用來存儲(chǔ),目錄里面有什么內(nèi)容,權(quán)限等的緩存
cachecache直接用來記憶我們打開的文件,給文件做緩沖
si每秒從磁盤讀入虛擬內(nèi)存的大小,如果這個(gè)值大于0,表示物理內(nèi)存不夠用或者內(nèi)存泄露了,要查找耗內(nèi)存進(jìn)程解決掉。
so每秒虛擬內(nèi)存寫入磁盤的大小,如果這個(gè)值大于0,同上
bi塊設(shè)備每秒接收的塊數(shù)量,這里的塊設(shè)備是指系統(tǒng)上所有的磁盤和其他塊設(shè)備,默認(rèn)塊大小是1024byte
bo塊設(shè)備每秒發(fā)送的塊數(shù)量,例如我們讀取文件,bo就要大于0。bi和bo一般都要接近0,不然就是IO過于頻繁,需要調(diào)整。
in每秒CPU的中斷次數(shù),包括時(shí)間中斷
cs每秒上下文切換次數(shù)
us用戶CPU時(shí)間
sy系統(tǒng)CPU時(shí)間,如果太高,表示系統(tǒng)調(diào)用時(shí)間長,例如是IO操作頻繁。
id空閑CPU時(shí)間
wt等待IOCPU時(shí)間。
這種基礎(chǔ)命令一定要會(huì),建議大家熟記,后面會(huì)分享更多devops和DBA方面的內(nèi)容,感興趣的朋友可以關(guān)注下~
曾經(jīng)做過幾次大規(guī)模服務(wù)器監(jiān)控,下面推薦幾款監(jiān)控軟件和輔助軟件。
1.zabbix一款老牌經(jīng)典的監(jiān)控軟件。是一個(gè)企業(yè)級的分布式開源監(jiān)控方案。能夠?qū)崟r(shí)監(jiān)控從成千上萬臺服務(wù)器、虛擬機(jī)和網(wǎng)絡(luò)設(shè)備中收集到的數(shù)以百萬計(jì)的指標(biāo)。??
提供圖形操作界面,可以方便的添加監(jiān)控指標(biāo)、告警指標(biāo)。支持郵件、微信等的告警通知。
2.Prometheus,近些年監(jiān)控方面的當(dāng)紅炸子雞??,Prometheus是由SoundCloud開發(fā)的開源監(jiān)控報(bào)警系統(tǒng)和時(shí)序列數(shù)據(jù)庫(TSDB)。Prometheus使用Go語言開發(fā),是GoogleBorgMon監(jiān)控系統(tǒng)的開源版本。
其優(yōu)點(diǎn)是輕量級,配置簡易,上手簡單,豐富的告警模板。
以上是兩款監(jiān)控軟件,下面推薦幾款監(jiān)控輔助軟件。
1.grafana監(jiān)控展示界面,在我們獲取到監(jiān)控?cái)?shù)據(jù)后,可能需要把數(shù)據(jù)展示出來,給領(lǐng)導(dǎo)們邀功。grafana就是這樣一款軟件,開源免費(fèi),模板豐富。可直接對接zabbixprometheus和mysql數(shù)據(jù)庫等。
2.釘釘機(jī)器人。服務(wù)器出現(xiàn)告警怎么辦,當(dāng)然是發(fā)消息通知運(yùn)維人員啊。釘釘機(jī)器人就提供這么一個(gè)功能。在釘釘群里面直接創(chuàng)建機(jī)器人,會(huì)給我們一個(gè)restfull的接口,我們就可以直接發(fā)送post請求。原生linux就直接用curl發(fā)送,Prometheus提供插件可以直接對接。
方法1:Agent服務(wù)器監(jiān)控
1在智能監(jiān)控平臺—cloudeye上新增服務(wù)器監(jiān)控
2選擇采集方式:agent監(jiān)控
采集方式選擇agent監(jiān)控
備注:支持應(yīng)用程序監(jiān)控,服務(wù)器信息自動(dòng)添加
3Agent安裝與配置
下載linux、windows系統(tǒng)的agent并完成安裝、配置。
配置說明:
1)您的有效序列號為w2xr3tlmjryw,請用命令/usr/local/cagent/sbin/startagent-klicense-Hlocalip修改
2)主機(jī)性能監(jiān)控默認(rèn)開啟,應(yīng)用程序監(jiān)控需要在/usr/local/cagent/etc/app_task.xml文件中修改配置。
3)配置成功后,服務(wù)器自動(dòng)添加,請耐心等待2分鐘
END
方法2:snmp服務(wù)器監(jiān)控
?
選擇采集方式:snmp監(jiān)控
備注:采用snmp監(jiān)控需保證服務(wù)器已開啟SNMP服務(wù)
服務(wù)器配置:
輸入所屬組、服務(wù)器名稱、服務(wù)器IP、SNMP端口、SNMP協(xié)議、SNMPCommunity
好了,關(guān)于服務(wù)器 監(jiān)控和服務(wù)器用什么監(jiān)控軟件好的問題到這里結(jié)束啦,希望可以解決您的問題哈!
搜浪信息科技發(fā)展(上海)有限公司 備案號:滬ICP備17005676號