一、自維修
1. 現(xiàn)場(chǎng)設(shè)備頻繁重啟如何排查?排查步驟:
1. 硬件檢查:查看電源、散熱是否正常,內(nèi)存/硬盤是否松動(dòng)。
2. 日志分析:檢查系統(tǒng)日志(/var/log/messages)、BMC/IPMI日志、內(nèi)核崩潰日志(dmesg)。
3. 電源測(cè)試:確認(rèn)PDU/UPS供電穩(wěn)定,排除電壓波動(dòng)問題。
4. 軟件問題:排查系統(tǒng)服務(wù)異常、驅(qū)動(dòng)沖突或內(nèi)核BUG。
工具:journalctl、ipmitool。
2. 如何查看設(shè)備序列號(hào)(SN)?方法:
1. 物理標(biāo)簽:設(shè)備外殼或標(biāo)簽上的SN號(hào)。
2. 命令查詢:
- 服務(wù)器:dmidecode -t system | grep "Serial Number"。
- 硬盤:smartctl -i /dev/sdX。
- GPU:nvidia-smi -a | grep "Serial"。
3. GPU卡降速如何處理?步驟:
1. 溫度檢查:nvidia-smi -q | grep "GPU Current Temp",確認(rèn)是否因過熱降頻。
2. 驅(qū)動(dòng)/固件:更新驅(qū)動(dòng)和GPU固件。
3. 電源檢查:確認(rèn)PCIe插槽供電充足,電源功率達(dá)標(biāo)。
4. 程序優(yōu)化:檢查CUDA程序是否異常占用資源。
4. RAID陣列組查看不到的原因?可能原因:
- RAID卡故障或驅(qū)動(dòng)未加載。
- 硬盤物理損壞或連接異常。
- RAID配置信息丟失(如電池失效導(dǎo)致緩存數(shù)據(jù)丟失)。
排查:
1. 使用RAID管理工具(如MegaCli)檢查RAID狀態(tài)。
2. 重新掃描硬盤:echo "- - -" > /sys/class/scsi_host/hostX/scan。
5. 如何檢查硬盤是否正常?方法:
1. SMART信息:smartctl -a /dev/sdX,關(guān)注Reallocated_Sector_Ct、UDMA_CRC_Error_Count。
2. 讀寫測(cè)試:dd或badblocks。
3. 系統(tǒng)日志:dmesg | grep -i error?查看硬盤報(bào)錯(cuò)。
6. 設(shè)備PING不通的原因?排查步驟:
1. 網(wǎng)絡(luò)層:檢查IP配置、防火墻規(guī)則、路由表。
2. 物理層:網(wǎng)線、網(wǎng)卡、交換機(jī)端口是否正常。
3. 系統(tǒng)服務(wù):確認(rèn)網(wǎng)絡(luò)服務(wù)(如NetworkManager)運(yùn)行正常。
4. ARP表:arp -a?確認(rèn)MAC地址解析正確。
7. OS下內(nèi)存故障日志位置?路徑:
-?dmesg?或?/var/log/messages?中的EDAC(錯(cuò)誤檢測(cè)與糾正)日志。
-?journalctl -k | grep -i "memory"。
- 部分服務(wù)器需通過BMC/IPMI查看硬件日志。
8. 如何查看管理口?方法:
1. 物理接口:服務(wù)器后面板的專用管理網(wǎng)口(通常標(biāo)有BMC/iLO/iDRAC)。
2. IP配置:通過BMC Web界面或ipmitool lan print查看管理口IP。
9. GPU服務(wù)器判斷GPU本體或程序問題?步驟:
1. 基礎(chǔ)測(cè)試:運(yùn)行nvidia-smi查看GPU狀態(tài),使用nvidia-smi stress測(cè)試穩(wěn)定性。
2. 交叉驗(yàn)證:更換GPU插槽或運(yùn)行標(biāo)準(zhǔn)測(cè)試程序(如cuda-test)。
3. 日志分析:檢查CUDA錯(cuò)誤(/var/log/cuda.log)和系統(tǒng)日志。
10. 維修GPU需關(guān)注點(diǎn)?關(guān)鍵點(diǎn):
- 靜電防護(hù):佩戴防靜電手環(huán)。
- 散熱組件:檢查風(fēng)扇/散熱片是否完好。
- 金手指:清潔氧化或污漬。
- 兼容性:確認(rèn)PCIe插槽供電和版本支持。
11. BMC日志查看內(nèi)存故障?步驟:
1. 登錄BMC Web界面,進(jìn)入“日志”或“事件”頁面。
2. 篩選“Memory”相關(guān)告警(如Correctable ECC Error)。
3. 根據(jù)日志中的DIMM槽位編號(hào)定位故障內(nèi)存。
12. 查看硬盤報(bào)錯(cuò)信息?方法:
-?smartctl -a /dev/sdX(查看SMART錯(cuò)誤)。
-?dmesg | grep -i "error|sdX"。
- RAID卡日志(如MegaCli -AdpAllInfo -aAll)。
13. 硬盤頻繁掉線原因?可能原因:
- 數(shù)據(jù)線/背板接觸不良。
- 電源供電不穩(wěn)定。
- 硬盤物理損壞或RAID卡故障。
- 過熱導(dǎo)致保護(hù)性斷開。
14. 內(nèi)存更換規(guī)則?規(guī)則:
- 同型號(hào):容量、頻率、品牌一致。
- 通道對(duì)稱:同一通道內(nèi)插滿相同容量內(nèi)存。
- 優(yōu)先插槽:按主板手冊(cè)順序填充(如A1>B1>A2>B2)。
15. 更換主板注意事項(xiàng)?注意事項(xiàng):
- 提前備份BIOS配置和RAID信息。
- 斷電并釋放靜電。
- 檢查CPU針腳和螺絲孔位是否對(duì)齊。
- 更新固件至兼容版本。
16. GPU降帶寬處理?處理步驟:
1. 檢查PCIe插槽是否運(yùn)行在預(yù)期模式(如x16→x8):lspci -vv | grep -i "LnkSta"。
2. 清潔PCIe金手指,重新插拔。
3. 更新BIOS和GPU驅(qū)動(dòng)。
4. 檢查主板PCIe通道分配是否沖突。
17. BMC功能主要功能:
- 遠(yuǎn)程開關(guān)機(jī)/重啟。
- 硬件監(jiān)控(溫度、電壓、風(fēng)扇)。
- 日志記錄與告警。
- 虛擬KVM和虛擬介質(zhì)掛載。
- 固件更新。
18. BIOS常見配置?典型配置:
- 啟動(dòng)順序調(diào)整。
- 啟用/禁用硬件虛擬化(VT-x/AMD-V)。
- CPU功率和溫控策略。
- RAID模式設(shè)置。
- 內(nèi)存ECC啟用。
19. BMC日志查看內(nèi)存故障?(同問題11)
20. 維修GPU需關(guān)注點(diǎn)?(同問題10)
21. RAID分類與RAID10操作?RAID級(jí)別:
- RAID0:條帶化(高性能,無冗余)。
- RAID1:鏡像(冗余,容量減半)。
- RAID5:分布式校驗(yàn)(平衡性能與冗余)。
- RAID10:RAID1+0(先鏡像后條帶)。
創(chuàng)建RAID10:
1. 至少4塊硬盤。
2. 使用RAID卡配置兩組RAID1,再合并為RAID0。
22. GPU問題與程序問題區(qū)分?(同問題9)
23. 定位硬盤/內(nèi)存故障槽位?方法:
- 內(nèi)存:通過BMC日志或dmidecode查看故障DIMM編號(hào)。
- 硬盤:RAID管理工具顯示物理槽位(如MegaCli -PDList -aAll),或根據(jù)背板指示燈定位。
24. 查看硬盤UUID?命令:
-?blkid(顯示所有塊設(shè)備UUID)。
-?lsblk -o NAME,UUID。
25. 板卡替換注意事項(xiàng)?注意事項(xiàng):
- 確認(rèn)兼容性(PCIe版本、供電需求)。
- 更新驅(qū)動(dòng)和固件。
- 記錄原板卡配置(如IP、RAID信息)。
- 防靜電操作。
26. 檢查硬盤是否正常?(同問題5)
27. 查看GPU的命令?命令:
- NVIDIA:nvidia-smi、nvidia-smi -q。
- AMD:rocm-smi。
- 通用:lspci | grep -i "VGA"。
28. BMC帶外不通處理?排查步驟:
1. 檢查網(wǎng)線、交換機(jī)端口。
2. 確認(rèn)BMC IP配置正確(DHCP/靜態(tài))。
3. 重啟BMC服務(wù)或重置BMC。
4. 更新BMC固件。
29. BIOS下確認(rèn)內(nèi)存/硬盤槽位?內(nèi)存:BIOS的“System Information”可查看已識(shí)別內(nèi)存容量及槽位。
硬盤:BIOS的“Storage”頁面顯示連接的硬盤,但無法直接定位物理槽位,需結(jié)合RAID卡工具。
30. BIOS功能核心功能:
- 硬件初始化與自檢(POST)。
- 啟動(dòng)設(shè)備管理。
- CPU/內(nèi)存超頻與電源管理。
- 硬件監(jiān)控與安全配置(如TPM)。
31. BIOS下查看內(nèi)存/硬盤?內(nèi)存:可查看總?cè)萘考笆欠褡R(shí)別。
硬盤:顯示連接的硬盤型號(hào),但需進(jìn)入RAID配置界面查看詳細(xì)信息。
32. 最小化測(cè)試作用與方法?作用:隔離硬件/軟件故障。
方法:
1. 僅保留CPU、單內(nèi)存、主板、電源啟動(dòng)。
2. 逐步添加硬件,觀察是否異常。
33. 更換硬盤后丟盤處理?處理流程:
1. 檢查RAID狀態(tài)是否自動(dòng)重建。
2. 手動(dòng)觸發(fā)重建:MegaCli -CfgLdAdd -rX [Encl:Slot] WB RA -aX。
3. 若Ctrl+D需注釋舊硬盤,使用MegaCli -PDMarkMissing -PhysDrv[Encl:Slot] -aX標(biāo)記。
34. 如何查看管理口?(同問題8)
35. 查看硬盤報(bào)錯(cuò)信息?(同問題12)
36. RAID級(jí)別與特點(diǎn)?(部分同問題21)
RAID6:雙校驗(yàn),允許兩塊硬盤失效。
RAID50:RAID5+0,性能與冗余兼顧。
37. 硬盤頻繁掉線原因?(同問題13)
38. BMC的兩種模式?兩種模式:
1. 共享模式:管理口與業(yè)務(wù)網(wǎng)口共享物理端口。
2. 專用模式:管理口獨(dú)立,需單獨(dú)連接網(wǎng)絡(luò)。
說明:
RAID配置需根據(jù)業(yè)務(wù)需求選擇級(jí)別,RAID10適合高IOPS場(chǎng)景,但成本較高。
BMC帶外管理是運(yùn)維核心能力,需熟練掌握IPMI命令和Web界面操作。
硬件故障定位依賴日志工具(如dmesg、BMC日志)和廠商管理工具(如MegaCli、iDRAC)。
二、日常操作流程
. 新服務(wù)器到貨流程和注意事項(xiàng)流程:
1. 驗(yàn)收:核對(duì)送貨單與采購訂單是否一致,檢查外包裝是否破損。
2. 開箱檢查:確認(rèn)設(shè)備型號(hào)、數(shù)量、配件齊全,檢查設(shè)備外觀有無損壞。
3. 登記入庫:記錄設(shè)備信息(SN號(hào)、配置等),貼資產(chǎn)標(biāo)簽。
4. 初步測(cè)試:通電測(cè)試是否正常啟動(dòng),驗(yàn)證基礎(chǔ)功能。
注意事項(xiàng):
- 全程錄像或拍照留證;
- 避免暴力搬運(yùn);
- 核對(duì)配置單與實(shí)際硬件是否一致。
2. 日常運(yùn)維的主要工作內(nèi)容1. 監(jiān)控:實(shí)時(shí)監(jiān)測(cè)服務(wù)器、網(wǎng)絡(luò)、存儲(chǔ)等設(shè)備狀態(tài)及性能指標(biāo)(CPU、內(nèi)存、磁盤等)。
2. 維護(hù):定期更新系統(tǒng)補(bǔ)丁、備份數(shù)據(jù)、清理日志。
3. 故障處理:響應(yīng)告警并定位問題,如硬件更換、服務(wù)重啟等。
4. 優(yōu)化:調(diào)整資源配置,優(yōu)化性能。
5. 文檔管理:記錄運(yùn)維操作日志及變更記錄。
3. 數(shù)據(jù)中心的運(yùn)維紅線絕對(duì)禁止行為:
- 未經(jīng)審批擅自更改網(wǎng)絡(luò)配置或設(shè)備參數(shù);
- 私自關(guān)閉監(jiān)控告警系統(tǒng);
- 未授權(quán)進(jìn)入機(jī)房或操作設(shè)備;
- 超負(fù)載運(yùn)行導(dǎo)致設(shè)備過熱;
- 未備份直接刪除數(shù)據(jù)或執(zhí)行高風(fēng)險(xiǎn)操作。
4. 日常巡檢流程步驟:
1. 物理巡檢:檢查設(shè)備指示燈狀態(tài)、電源線/網(wǎng)線連接、機(jī)柜溫度。
2. 系統(tǒng)檢查:登錄管理系統(tǒng)查看CPU、內(nèi)存、磁盤使用率,確認(rèn)服務(wù)運(yùn)行狀態(tài)。
3. 日志審查:分析系統(tǒng)日志及告警記錄。
4. 記錄與反饋:填寫巡檢報(bào)告,異常情況及時(shí)上報(bào)。
5. 高溫緊急通報(bào)流程流程:
1. 觸發(fā)條件:機(jī)房溫度超過設(shè)定閾值(如28°C)。
2. 緊急處理:啟動(dòng)備用空調(diào)、打開機(jī)柜門輔助散熱、關(guān)閉非核心設(shè)備。
3. 通報(bào):通知運(yùn)維主管、數(shù)據(jù)中心負(fù)責(zé)人及設(shè)備廠商。
4. 后續(xù):分析原因(如空調(diào)故障、氣流阻塞),提交故障報(bào)告。
6. 機(jī)房溫濕度要求標(biāo)準(zhǔn)范圍:
- 溫度:22°C ± 2°C(ASHRAE推薦);
- 濕度:40%~60% RH。
控制措施:
- 使用精密空調(diào)+環(huán)境監(jiān)控系統(tǒng);
- 高溫時(shí)啟動(dòng)液冷或風(fēng)墻輔助散熱;
- 濕度過低易靜電,過高易凝露。
7. 新服務(wù)器到貨上架流程流程:
1. 規(guī)劃位置:根據(jù)機(jī)柜空間和電力負(fù)載選擇合適位置。
2. 安裝上架:固定服務(wù)器到機(jī)柜托架,連接電源線、網(wǎng)線、KVM線。
3. 通電配置:配置IP地址、安裝操作系統(tǒng)、加入監(jiān)控系統(tǒng)。
4. 驗(yàn)收:測(cè)試網(wǎng)絡(luò)連通性及服務(wù)可用性。
8. 機(jī)柜單路掉電處理流程步驟:
1. 確認(rèn)故障:檢查PDU/UPS是否告警,確認(rèn)單路電源失效。
2. 切換電源:將設(shè)備切換到備用電源線路。
3. 排查原因:檢查斷路器、PDU模塊或UPS狀態(tài)。
4. 修復(fù)與記錄:聯(lián)系電工維修,記錄故障時(shí)間及處理過程。
說明:
運(yùn)維紅線是保障數(shù)據(jù)中心安全的底線,違反可能導(dǎo)致重大事故。
高溫處理需優(yōu)先保護(hù)核心設(shè)備,避免數(shù)據(jù)丟失或硬件損壞。
單路掉電需依賴冗余設(shè)計(jì)(如雙路供電)快速切換,確保業(yè)務(wù)不中斷。
三、Linux系統(tǒng)操作
?單用戶模式的作用及場(chǎng)景作用:
- 提供最小化系統(tǒng)環(huán)境,僅加載必要服務(wù),用于系統(tǒng)修復(fù)。
- 允許直接以root權(quán)限操作,無需密碼(部分系統(tǒng))。
應(yīng)用場(chǎng)景:
1. 忘記root密碼需重置。
2. 文件系統(tǒng)損壞需手動(dòng)修復(fù)(如fsck)。
3. 啟動(dòng)故障排除(如錯(cuò)誤配置導(dǎo)致系統(tǒng)無法啟動(dòng))。
2. 系統(tǒng)日志的路徑常見路徑:
-?/var/log/messages:通用系統(tǒng)日志(RedHat/CentOS)。
-?/var/log/syslog:通用系統(tǒng)日志(Debian/Ubuntu)。
-?/var/log/dmesg:內(nèi)核啟動(dòng)及硬件事件日志。
-?/var/log/auth.log:用戶認(rèn)證日志。
-?/var/log/secure:安全相關(guān)日志(RedHat系)。
3. 重啟網(wǎng)卡的命令命令:
1. 傳統(tǒng)方式:
-?service network restart(RedHat 6)。
-?systemctl restart NetworkManager(systemd系統(tǒng))。
2. 直接操作網(wǎng)卡:
-?ifdown eth0 && ifup eth0。
3. nmcli工具:
-?nmcli connection reload && nmcli connection down eth0 && nmcli connection up eth0。
4. 注釋硬盤的操作操作場(chǎng)景:
- 臨時(shí)禁用掛載:在/etc/fstab中注釋對(duì)應(yīng)硬盤的行(如# /dev/sdb1 /mnt/data ext4 defaults 0 0)。
- RAID/HBA管理:使用RAID卡工具標(biāo)記硬盤為“Missing”或“Removed”(如MegaCli -PDMarkMissing -PhysDrv[Encl:Slot] -aX)。
5. 網(wǎng)卡配置文件的路徑路徑:
- RedHat/CentOS 7+:/etc/sysconfig/network-scripts/ifcfg-ethX。
- Debian/Ubuntu:/etc/network/interfaces。
- Netplan(Ubuntu 18.04+):/etc/netplan/*.yaml。
- NetworkManager:/etc/NetworkManager/system-connections/。
說明:
單用戶模式需在啟動(dòng)時(shí)通過GRUB編輯內(nèi)核參數(shù)(追加single或init=/bin/bash)。
網(wǎng)卡重啟需注意:使用ifdown/ifup可能不適用于NetworkManager管理的接口,建議優(yōu)先使用nmcli。
注釋硬盤在RAID場(chǎng)景中需謹(jǐn)慎,避免誤刪數(shù)據(jù),操作前需確認(rèn)陣列狀態(tài)。
四、網(wǎng)絡(luò)和布線
1. 網(wǎng)卡不亮如何排查?排查步驟:
1. 物理檢查:確認(rèn)網(wǎng)線連接牢固,更換網(wǎng)線或交換機(jī)端口測(cè)試。
2. 網(wǎng)卡狀態(tài):ethtool ethX?查看網(wǎng)卡狀態(tài)(Link detected是否yes)。
3. 驅(qū)動(dòng)/硬件:lspci | grep -i ethernet?確認(rèn)網(wǎng)卡識(shí)別,檢查驅(qū)動(dòng)是否加載(lsmod)。
4. 交換機(jī)側(cè):檢查對(duì)應(yīng)端口是否啟用、VLAN配置正確。
2. 如何連接交換機(jī)?方法:
- Console線連接:使用RS-232轉(zhuǎn)USB線連接交換機(jī)Console口,通過終端工具(如PuTTY)登錄,波特率通常為9600。
- 遠(yuǎn)程連接:通過SSH/Telnet(需預(yù)先配置管理IP)。
3. 交換機(jī)如何搭建遠(yuǎn)程環(huán)境?步驟:
1. 配置管理IP:
<br> interface vlan 1<br> ip address 192.168.1.1 255.255.255.0<br>
2. 啟用SSH/Telnet:
<br> line vty 0 15<br> transport input ssh/telnet<br>
3. 設(shè)置用戶名密碼:
<br> username admin privilege 15 secret password<br>
4. 鏈路故障如何處理?排障思路:
1. 物理層:檢查光纖/網(wǎng)線、光模塊、端口指示燈。
2. 數(shù)據(jù)鏈路層:確認(rèn)端口UP、VLAN一致、STP未阻塞。
3. 協(xié)議層:檢查ARP表、MAC地址表、路由表。
工具:ping、traceroute、tcpdump。
5. 交換機(jī)硬件更換/板卡替換?流程:
1. 斷電并佩戴防靜電手環(huán)。
2. 記錄原板卡配置(如端口綁定、VLAN)。
3. 更換后通電,驗(yàn)證端口狀態(tài)及配置。
注意:確保兼容性(型號(hào)、固件版本)。
6. 網(wǎng)卡無法識(shí)別故障處理?處理步驟:
1. 檢查PCIe插槽是否松動(dòng)。
2. 更新網(wǎng)卡驅(qū)動(dòng):modprobe <驅(qū)動(dòng)模塊>。
3. BIOS中啟用網(wǎng)卡(如禁用節(jié)能模式)。
4. 更換網(wǎng)卡或插槽測(cè)試。
7. 傳輸不良故障處理?處理步驟:
1. 檢查網(wǎng)線質(zhì)量(使用測(cè)線儀)。
2. 確認(rèn)雙工模式匹配(ethtool -s ethX duplex full)。
3. 檢查信號(hào)干擾(遠(yuǎn)離電源線、大功率設(shè)備)。
4. 更換光模塊或光纖(檢查光衰)。
8. BMC連接方式及功能?連接方式:
- 通過專用管理口(BMC/iLO/iDRAC)使用IPMI協(xié)議,Web訪問(https://BMC_IP)或ipmitool命令。
功能:遠(yuǎn)程開關(guān)機(jī)、監(jiān)控硬件狀態(tài)(溫度/電壓)、查看日志、掛載虛擬介質(zhì)。
9. PXE作用是什么?作用:通過網(wǎng)絡(luò)引導(dǎo)安裝操作系統(tǒng),依賴DHCP、TFTP、HTTP/FTP服務(wù)。
流程:客戶端廣播PXE請(qǐng)求→DHCP分配IP并指定引導(dǎo)文件→TFTP下載啟動(dòng)鏡像→執(zhí)行自動(dòng)化安裝。
10. PXE裝機(jī)失敗處理?排查步驟:
1. 檢查DHCP配置(Option 66/67)。
2. 確認(rèn)TFTP根目錄存在引導(dǎo)文件(如pxelinux.0)。
3. 防火墻是否放行TFTP/UDP 69端口。
4. 客戶端網(wǎng)卡是否支持PXE。
11. PXE循環(huán)裝機(jī)原因?常見原因:
- 客戶端啟動(dòng)順序設(shè)置為網(wǎng)絡(luò)優(yōu)先,安裝后未修改為硬盤啟動(dòng)。
- 未正確生成Kickstart自動(dòng)應(yīng)答文件,導(dǎo)致重復(fù)進(jìn)入安裝流程。
- TFTP服務(wù)器鏡像損壞或路徑錯(cuò)誤。
12. 鏈路故障排障思路?(同問題4)
13. 光纖清潔工具?工具:光纖清潔筆(單向清潔)、無塵棉簽、酒精(純度>99%)、光纖端面檢測(cè)儀(放大鏡)。
14. 光功率計(jì)使用及用途?用途:測(cè)量光纖鏈路的光衰(dBm)。
使用步驟:
1. 校準(zhǔn)光功率計(jì)。
2. 將光纖接入光功率計(jì)輸入端。
3. 讀取數(shù)值(正常范圍:單模-8~-28dBm,多模-10~-20dBm)。
15. 數(shù)據(jù)中心線材類型?類型:
- 光纖(單模/多模)。
- 雙絞線(Cat5e/Cat6/Cat7)。
- DAC(直連銅纜,用于短距離機(jī)柜內(nèi)連接)。
- AOC(有源光纜)。
16. 交換機(jī)替換斷聯(lián)順序?最佳實(shí)踐:先斷下聯(lián)(接入設(shè)備),再斷上聯(lián)(核心/匯聚層),避免業(yè)務(wù)中斷。
17. 遠(yuǎn)程環(huán)境場(chǎng)景及工具?場(chǎng)景:遠(yuǎn)程維護(hù)、監(jiān)控、故障診斷。
工具:VPN、SSH(如OpenSSH)、堡壘機(jī)(Jump Server)、遠(yuǎn)程桌面(RDP/VNC)、網(wǎng)絡(luò)監(jiān)控平臺(tái)(Zabbix/Nagios)。
18. 查看設(shè)備序列號(hào)(SN)?(同歷史問題)
命令:
- 服務(wù)器:dmidecode -t system | grep "Serial Number"。
- 交換機(jī):show version | include Serial。
19. 內(nèi)存故障日志位置?(同歷史問題)
路徑:
-?/var/log/messages?或?dmesg?中的EDAC日志。
- BMC/IPMI日志。
20. 單模/多模光模塊區(qū)分?區(qū)分方法:
- 標(biāo)識(shí):單模模塊標(biāo)“SM”或波長1310/1550nm;多模塊標(biāo)“MM”或波長850/1300nm。
- 外觀:單模光纖接口多為藍(lán)色,多模為橙色。
- 傳輸距離:單模(10km以上),多模(≤2km)。
21. 交換機(jī)工作層級(jí)?OSI模型:傳統(tǒng)交換機(jī)工作在數(shù)據(jù)鏈路層(L2),支持MAC地址轉(zhuǎn)發(fā);三層交換機(jī)可處理網(wǎng)絡(luò)層(L3)(IP路由)。
22. 交換機(jī)遠(yuǎn)程環(huán)境搭建?(同問題3)
23. 單模/多模光纖區(qū)分?區(qū)分方法:
- 顏色:單模光纖黃色護(hù)套,多模橙色/水藍(lán)色護(hù)套。
- 纖芯直徑:單模9μm,多模50/62.5μm。
- 標(biāo)識(shí):光纖外皮印有“OS1/OS2”(單模)或“OM1/OM2/OM3”(多模)。
24. 光衰判斷標(biāo)準(zhǔn)?標(biāo)準(zhǔn):
- 單模:接收端光功率≥-28dBm(1310nm)/ -30dBm(1550nm)。
- 多模:接收端光功率≥-10dBm(850nm)/ -12dBm(1300nm)。
異常處理:清潔光纖、更換模塊或調(diào)整光纖彎曲半徑。
25. 光模塊封裝模式?封裝類型:
- SFP:1G速率。
- SFP+:10G速率。
- QSFP+:40G/100G速率。
- XFP:10G(已逐步淘汰)。
26. 紅光筆作用?作用:檢測(cè)光纖通斷、定位光纖路徑(通過紅光透射)。
注意:切勿直視光纖端面,避免激光損傷眼睛。
27. 鏈路清潔方法?步驟:
1. 使用光纖清潔筆單向擦拭端面(避免來回摩擦)。
2. 或用無塵棉簽蘸取酒精,輕輕旋轉(zhuǎn)清潔。
3. 使用端面檢測(cè)儀確認(rèn)清潔度(無劃痕、灰塵)。
說明:
物理層問題(如光衰、網(wǎng)線故障)是鏈路故障的常見原因,需優(yōu)先排查。
BMC/IPMI 是帶外管理的核心工具,需熟練掌握其日志分析和遠(yuǎn)程控制功能。
光纖操作需嚴(yán)格遵循清潔規(guī)范,避免因灰塵或劃痕導(dǎo)致信號(hào)衰減。