Tình huống: Máy chủ File Server với IP 172.17.0.102 đặt trong vùng DMZ. Các máy trạm trong vlan 10.2.16.0/24 kết nối lúc được, lúc không. Để khắc phục những lúc mất kết nối, kỹ thuật viên phải khởi động lại máy chủ. Nhưng tình trạng kết nối chập chờn vẫn thường xuyên xảy ra.
Bước 1 (chuẩn bị): Thay đổi IP từ 172.17.0.102 sang 172.17.0.99, kiểm tra firewall cho phép sử dụng giao thức ICMP và không chặn từ bên ngoài (outbound).
Bước 2 (điều tra):
- PING và TRACERT:
- 1. Giới thiệu Ping và Tracert:
- Ping (Packet Internet Grouper) là một công cụ cho mạng máy tính sử dụng trên các mạng TCP/IP (chẳng hạn như Internet) để kiểm tra xem có thể kết nối tới một máy chủ cụ thể nào đó hay không, và ước lượng khoảng thời gian trễ trọn vòng để gửi gói dữ liệu cũng như tỉ lệ các gói dữ liệu có thể bị mất giữa hai máy. Công cụ này thực hiện nhiệm vụ trên bằng cách gửi một số gói tin ICMP đến máy kia và lắng nghe trả lời. Tác giả của công cụ này là ông Mike Muuss.
Từ sau 2003, sự hữu dụng của dịch vụ này suy kém dần, vì các nhà cung cấp dịch vụ Internet đã loại bỏ các thông điệp ICMP Type 8 tại các biên mạng của họ. Các sâu máy tính trên Internet như Welchia đã lợi dụng công cụ Ping để làm ngập khả năng xử lý của các máy tính nạn nhân, làm tắc nghẽn các thiết bị định tuyến.
- Tracert là công cụ bổ sung để kiểm tra đường đi của các gói tin của lệnh Ping. (đọc thêm Tracert là gì?)
2. Cách thực hiện thao tác:
a. Cách ping và tracert trên Windows
i. Vào Start --> run hoặc gõ tổ hợp phím biểu tượng Window + R, gõ cmd
ii. Ping đến website cần kiểm tra. Ví dụ cần kiểm tra trang training.vinahost.vn
iii. Tracert đến website cần kiểm tra. Ví dụ cần kiểm tra trang training.vinahost.vn
b. Cách ping và tracert trên Mac/Linux
i. Mở terminal và gõ lệnh ping đến máy chủ cần kiểm tra
Lệnh ping sẽ chạy liên tục để ngắt quá trình ping ta nhấn tổ hợp phím Ctr + C
ii. Đối với hệ điều hành Mac/Linux, lệnh tracert được thay bằng lệnh traceroute
3. Đánh giá kết quả:
a. Đánh giá sơ bộ kết quả ping:
1. Thông báo: Reply from 210.211.110.180: bytes=32 time=2ms TTL=55
Khi nhận được thông báo có dạng như trên thì có nghĩa là lệnh ping đã thực hiện thành công và hệ thống không có lỗi:
Địa chỉ IP sau từ “Reply from” cho biết máy nào đang gửi thông điệp trả lời.
bytes=32 là kích thước của gói tin ICMP được gửi đi.
time=2ms thời gian của quá trình hồi đáp
TTL=55 là giá trị “time to live” (thời gian sống) của gói tin ICMP. Hết thời gian này thì gói tin sẽ bị hủy.
2. Thông báo: Request timed out
Nếu không kết nối được với máy đích thì kết quả ping sẽ hiển thị thông báo là “Request timed out”. Có nghĩa là không có hồi đáp trả về, nguyên nhân gây ra lỗi như sau:
- Thiết bị định tuyến Router bị tắt.
- Địa chỉ máy đích không có thật hoặc máy đích đang bị tắt, hoặc cấm ping.
- Nếu máy đích khác đường mạng với máy nguồn thì nguyên nhân có thể do không có định tuyến ngược trở lại máy nguồn.
Lúc này, nếu máy đích đang chạy, có thể kiểm tra đường đi về của gói tin bằng cách xem lại thông số Default Gateway trên máy đích, máy nguồn và router kết nối các đường mạng
3. Thông báo "Destination host unreachable"
Thông báo cho biết không thể kết nối đến máy đích. Nguyên nhân gây ra lỗi này có thể là do kết nối vật lý của máy tính như cáp mạng bị đứt, không gắn cáp vào card mạng, card mạng bị tắt, driver card mạng bị hư, chưa bật wifi, …
b. Đánh giá sơ bộ kết quả tracert:
Dòng 1: là dòng kết nối giữa modem và máy tính, độ trễ tốt nhất là 1ms 1ms 1ms ! Nếu cao hơn hoặc xuất hiện dấu * hay Request timed out thì kết nối modem và máy có vấn đề !
Dòng 2: nếu vẫn là ip private thì là kết nối giữa modem và modem đánh giá tương tự dòng 1. Nếu là ip public thì là kết nối giữa modem và mạng của ISP (nhà cung cấp mạng), độ trễ tốt nhất nên trong khoảng 10-40 ms ! Cao hơn khoảng này hoặc xuất hiện dấu * hay Request timed out thì kết nối modem và mạng ISP có vấn đề !
Dòng 3 trở đi tới trace complete: là kết nối trong mạng giữa các ISP với nhau, nếu xuất hiện dấu * hay Request timed out thì kết nối trong mạng ISP có vấn đề !
a) Test PING
* Từ máy trạm (khác với máy chủ bị mất kết nối)
- Ping 172.17.0.99 trước.
Pinging 172.17.0.99 with 32 bytes of data:
Reply from 172.17.0.99: bytes=32 time=1ms TTL=128
Reply from 172.17.0.99: bytes=32 time<1ms TTL=128
Reply from 172.17.0.99: bytes=32 time=1ms TTL=128
Reply from 172.17.0.99: bytes=32 time=1ms TTL=128
Ping statistics for 172.17.0.99:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 0ms, Maximum = 1ms, Average = 0ms
Ok. time=<1ms, tốt. TTL=128, rõ ràng đây là TTL mặc định máy chủ Windows.
- Tiếp tục PING 172.17.0.102.
Pinging 172.17.0.102 with 32 bytes of data:
Reply from 172.17.0.102: bytes=32 time=1ms TTL=64
Reply from 172.17.0.102: bytes=32 time=1ms TTL=64
Reply from 172.17.0.102: bytes=32 time=1ms TTL=64
Reply from 172.17.0.102: bytes=32 time=1ms TTL=64
Ping statistics for 172.17.0.102:
Packets: Sent = 4, Received = 4, Lost = 0 (0% loss),
Approximate round trip times in milli-seconds:
Minimum = 1ms, Maximum = 1ms, Average = 1ms
Oh, cũng OK. Nhưng TTL=64, đây là TTL của 01 máy chủ khác, nếu là giá trị mặc định có thể là Linux
* Từ máy chủ File Server: ping tới 172.17.0.102
Pinging 172.17.0.102 with 32 bytes of data:
Reply from 172.17.0.102: Destination host unreachable.
Reply from 172.17.0.102: Destination host unreachable.
Reply from 172.17.0.102: Destination host unreachable.
Reply from 172.17.0.102: Destination host unreachable.
Ping statistics for 172.17.0.102:
Packets: Sent = 4, Received = 4, Lost = 4 (100% loss)
Khác với "Request time out" cho biết không có hồi đáp trả về. Thông điệp "Destination host unreachable" cho biết mặc dù máy đích tồn tại nhưng không thể kết nối đến máy đích.
- Nói thêm về TTL:
- TTL trong lệnh PING dịch đại khái là thời gian mà 1 gói tin được phép "sống trong mạng", khi hết cái time này thì nó sẽ "chết", tức là bị hủy, không truyền đi nữa.
TTL không tính bằng giây mà bằng hop count, giả sử TTL xuất phát là n, khi gói tin đi qua 1 thiết bị như router hay switch layer 3 thì thiết bị này sẽ giảm TTL -1 rồi mới gửi đi tiếp (tức là còn n-1). Khi đến 1 thiết bị nào đó mà TTL bị giảm xuống 0 thì nó sẽ hủy cái gói tin chứ không cho đi tiếp. Cái TTL dùng để tránh loop trong mạng có router (mạng switch thì đã có spanning tree).
Giá trị TTL mà bạn thấy khi ping là giá trị TTL của gói ICMP reply mà máy bạn nhận được từ máy kia, nó được tính bằng số TTL xuất phát trừ đi số hop. Như vậy giá trị nó cao hay thấy là phụ thuộc số hop và số TTL khởi điểm. Nếu qua 10 hop chẳng hạn, mà bên kia phát gói ICMP reply với TTL=256 thì bạn sẽ thấy Ping reply TTL=246; còn nếu xuất phát là 128 thì bạn sẽ thấy Ping reply TTL=118.
TTL khởi điểm là mấy tùy thuộc vào OS của thiết bị bên kia. Ví dụ hệ điều hành Windows có TTL start = 128, Linux = 64, Solaris = 256 và tất cả đều có thể chỉnh được.
- Trong Linux muốn thay đổi TTL thì sửa file /proc/sys/net/ipv4/ip_default_ttl.
- Trong Windows: HKEY_LOCAL_MACHINE\System\CurrentControlSet\Servic es\Tcpip\Parameters, tạo cái key tên là DefaultTTL, kiểu DWORD.
* Lưu ý: Giá trị TTL từ lệnh PING có thể khác với giá trị của TRACERT
- Trường TTL trong gói tin Reply bị giảm bao nhiêu đơn vị - đồng nghĩa với việc gói tin đi từ "Xa" về chúng ta qua bấy nhiêu thiết bị lớp 3. --> Chiều gói tin đi từ "Xa" về ta
- Câu lệnh Tracert "ip thiết bị Xa" là kiểm tra gói tin từ ta tới thiết bị "Xa" kia phải đi qua những thiết bị lớp 3 nào. --> Chiều gói tin đi từ ta đến "Xa"
Số lượng thiết bị lớp 3 mà các gói tin đi qua trong 2 trường hợp trên sẽ không phải lúc nào cũng là bằng nhau. Sẽ là khác nhau nếu trong mô hình mạng có sự thay đổi đột ngột.
Ví dụ: Gói tin đi từ ta đi đến thiết bị "Xa" phải đi qua 5 Router R1 -> R2 -> R3 -> R4 -> R5 --> thiết bị "Xa". Khi thiết bị "Xa" nhận được yêu cầu phản hồi của gói tin Ping, mặc định nó sẽ đi theo thứ tự: R5 -> R4 -> R3 -> R2 -> R1 --> ta. Nhưng trong trường hợp gói tin đi về ta qua R4 rồi đến R3. Trong trường hợp R3 bị down, khi này R4 sẽ phải tìm con đường khác để tới ta, giả sử nó phải đi qua 2 con R3' và R2' rồi mới tới R2 --> R1 và về ta. Dẫn đến số lượng thiết bị lớp 3 gói tin đi qua là nhiều hơn "so với dự kiến" --> dẫn đến có sự khác nhau giữa giá trị -TTL và Tracert.
Cũng cần phân biệt TTL trong DNS Domain. TTL ở đây là thời gian mà name server khác được cache lại.
VD: Tên miền tayngang dùng DNS của Eeverydns và cấu hình 1 record
tayngang.net A 31.220.20.190 với TTL là 3600s
Nếu bạn dùng DNS của google bạn vào trình duyệt gõ tayngang.net
Máy bạn sẽ gửi yêu cầu phân giải tên miền tayngang.net tới name server 8.8.8.8
Vì server này không giữ thông tin về tên miền nên nó phải hỏi thằng Everydns xem tayngang.net có IP là bao nhiêu
Everydns trả lời là 31.220.20.190 và TTL là 3600
Và google sẽ cache lại kết quả này 3600s. Như vậy trong vòng 3600s đó, nếu ta có thay đổi trên Everydns sinhvienit.net thành 123.123.123.123 thì ai đang dùng DNS của google vẫn nhận được kết quả là 31.220.20.190
b. Dùng Advanced IP Scanner
- Ngay tại máy chủ, Advanced IP Scanner cũng không thấy IP 172.17.0.102
Lạ quá. Quay lại máy trạm, cũng dùng Advanced IP Scanner quét:
Oh. Có kết quả rồi. Đây chính là iDRAC, IP của chính phần mềm điều khiển máy chủ File Server chạy riêng biệt với hệ điều hành. Kết quả trên Advanced IP Scanner cũng cho biết IP này có dịch vụ web với HTTPS.
Thông tin trên desktop của máy chủ Dell PowerVault NX400 vẫn còn giữ IP 172.17.0.17 với MAC 44:A8:42:34:7E:F8
- iDRAC là gì?:
- GIT – Đối với hầu hết các model của Power Edge Server của Dell thì đều có tích hợp iDRAC (Integrated Dell Remote Access Controller), tính năng này dùng để điều khiển máy tính tắt mở từ xa thông qua LAN hoặc VPN, ngoài ra còn có khả năng kiểm tra theo dõi hoạt động của các thành phần trên Server, troubleshoot trong trường hợp Server bị lỗi trong quá trình POST. Đây là tính năng rất hữu ích đối với IT nhưng không phải ai cũng biết đến.
Ở bài viết này mình sẽ hướng dẫn mọi người các bước thiết lập ban đầu để Remote và các tính năng của iDRAC, sau khi đã làm quen thì mọi người có thể tìm hiểu kỹ hơn.
1. Cấu hình iDRAC
Khởi động Server, ở màn hình khởi động khi hiện lên dòng Ctrl+E thì mọi ngưởi nhấn tổ hợp phím “Ctrl +E” để vào cấu hình IP cho iDRAC.
Trong Menu chính:
– NIC selection: chọn Shared.
– Lan Parameter : Vào Ethernet IP Address để cấu hình địa chỉ IP cho iDRAC (IP, Subnet, Gateway), lưu ý IP này trùng với Subnet LAN trong mạng đang sử dụng và IP này chưa sử dụng cho máy nào. Ở mục Lan User Configuration mọi người có thể rename của user và đặt password khác nếu muốn, mặc định của User là “root”, password là “calvin”.
Xong các bước trên mọi người nhơ save lại trước khi thoát ra. Vậy là đã hoàn tất bước cấu hình.[
Trong trường hợp bạn thay đổi password root của iDRAC nhưng không nhớ thì có thể chọn Reset to Default để reset lại password, khi này các thông tin cấu hình (IP Addr, username, password) sẽ trở về tình trạng ban đầu khi chưa setup.
2. Sử dụng iDRAC
– Mở web browser và nhập vào IP của iDRAC. Ở đây IP của mình là 198.168.1.111.
– Màn hình đăng nhập:
– Ở màn hình chính mọi người có thể xem được thông tin về Server(Model, BIOS version…), thông tin của các phần cứng (FAN, CPU, PSU…).
- Để Shutdown, Restart hoặc Power On thì mọi người vào Tab Power và chọn các option tương ứng rồi nhấn Apply.
- Ở Tab log: có thể xem các even log của Server, khi các Log này bị đầy thì đôi lúc Server sẽ báo lỗi, do đó có thể chon Save Log và sau đó Clear Log để có thể theo dõi các file log trong quá trình troubleshoot nếu sau này Server có xảy ra lỗi.
– Trong phần Log có một phần rất hay đó là Boot Capture: phần này có chức năng ghi lại màn hình quá trình từ lúc khởi động đến lúc vào OS, điều này giúp cho IT có thể nhận biết được các thông báo lỗi ở màn hình DOS nếu Server không thể vào OS và yêu cầu nhấn F1 tiếp tục hoặc F2 để vào Setup để có thể hướng dẫn từ xa. Ở đây ta chọn Boot Capture muốn xem và nhấn Play.
– Ở mục Last Crash Screen: sẽ lưu lại màn hình bị dump của Server nếu có lỗi, cái này phục vụ cho việc troubleshoot nếu OS hay phần cứng bị lỗi mà không có mặt IT lúc xảy ra lỗi.
Bước 3 (khắc phục): Remote iDRAC, từ trình duyệt máy trạm đăng nhập địa chỉ https://172.17.0.102 với tài khoản và password mặc định: root / calvin
Mở Overview >> iDRAC Settings >> Network, bỏ DHCP Enable
Ở hình trên, bạn có thấy IP 192.168.5.200/22. Đây là lớp mạng cũ khi máy chủ Dell kết nối Internet bằng DHCP?
Hoặc cũng có thể vào máy chủ, click icon phím tắt Server Administrator của Dell tạo sẵn trên Desktop, hoặc run "C:\Program Files\Dell\SysMgt\omastart.exe" omsa để mở trình duyệt với link https://nx400:1311/OMSALogin?msgStatus=null&authType=ntlm&application=omsa&locallogin=true, user & password này là của hệ thống. mặc định của Dell là administrator / Stor@ge!
Vào System >> Main System Chassis >> Remote Access, chọn Configuration để thay đổi IP
Kết luận: Do máy chủ File Server khi còn sử dụng Internet, card mạng dùng cho iDRAC thiết lập nhận IP động (còn lưu giá trị mạng cũ). Khi chuyển sang mạng riêng trong vùng DMZ, card NIC1 khi thiết lập IP tĩnh với IP 172.17.0.102 và iDRAC còn để DHCP nên tự gán IP này.
Server này có 3 card mạng:
- 44:A8:42:34:7E:FA (iDRC)
- 44:A8:42:34:7E:F8 (NIC1)
- 44:A8:42:34:7E:F9 (NIC2)