Automatyczny monitoring Cisco IP SLA
IP SLA to podstawowy mechanizm testowania sieci na routerach Cisco. Najczęściej używanymi testami są:
- ICMP echo – sprawdza osiągalność danego adresu IP
- UDP jitter – sprawdza jakość łącza – delay, loss, jitter, a nawet MOS score
Oprócz nich możemy korzystać z takich próbek jak TCP Connect (test połączenia TCP), odpowiedź z DNS, parametry ethernetowe i wiele innych. Każdy pomiar możemy zaplanować i np uruchamiać co 1 minutę lub raz na godzinę.
Dodatkowo możemy reagować na pewne problemy wykryte przez IP SLA – wysyłaniem trapów lub emaili przy wykorzystaniu funkcjonalności EEM. Przykładowa konfiguracja:
ip sla 1
icmp-echo 10.1.1.1 source-interface FastEthernet0/0
frequency 30
ip sla schedule 1 life forever start-time now
W statystykach zobaczymy jak pomiar wystartował i jakie są wyniki:
Router6#sh ip sla stati
IPSLAs Latest Operation Statistics
IPSLA operation id: 1
Latest RTT: 1 milliseconds
Latest operation start time: 09:47:06 UTC Tue Sep 25 2012
Latest operation return code: OK
Number of successes: 9
Number of failures: 0
Operation time to live: Forever
Pomiary długoterminowe
Co jednak w sytuacji gdy chcemy sprawdzić czy dane łącze działa stabilnie przez okres kilku godzin lub dni? Zwykły pomiar z pingiem co 30 sekund nam nie za wiele pokaże, a co najważniejsze nie będziemy wiedzieć co się działo kilka godzin wcześniej. Aby mieć wgląd w ostatnie 24 godziny pomiaru musimy włączyć tzw. “enhanced history”. Dodatkowo musimy włączyć logowanie zmian stanu IP SLA. Przedstawiamy przykład poniżej.
Założenia: pakiet ICMP wysyłany co sekundę, pomiar chodzi co sekundę, przetrzymujemy więcej statystyk (24h), przy stracie 2 pakietów pod rząd wysyłamy trap oraz wpisujemy do sysloga.
Konfiguracja:
ip sla 1
icmp-echo 172.16.1.42
threshold 950
timeout 990
frequency 1
history hours-of-statistics-kept 24
history buckets-kept 60
history enhanced interval 1800 buckets 100
ip sla schedule 1 life forever start-time now
ip sla reaction-configuration 1 react timeout threshold-type consecutive 2 action-type trapOnly
ip sla logging traps
Potem w logach będziemy widzieć następujące zdarzenia:
017220: Mar 11 2013 16:21:48.747 CET: %RTT-3-IPSLATHRESHOLD: IP SLAs(1): Threshold Occurred for timeout
017223: Mar 11 2013 16:23:00.775 CET: %RTT-3-IPSLATHRESHOLD: IP SLAs(1): Threshold Cleared for timeout
Natomiast historię pomiaru możemy zobaczyć w następujący sposób:
router#sh ip sla enhanced-history collection-statistics
Entry number: 1
Aggregation Interval: 1800
Bucket Index: 1
Aggregation start time 07:16:20.953 CET Wed Mar 13 2013
Target Address: 172.16.1.42
Number of failed operations due to a Disconnect: 0
Number of failed operations due to a Timeout: 0
Number of failed operations due to a Busy: 0
Number of failed operations due to a No Connection: 0
Number of failed operations due to an Internal Error: 0
Number of failed operations due to a Sequence Error: 0
Number of failed operations due to a Verify Error: 0router#sh ip sla enhanced-history distribution-statistics
Point by point Enhanced History
Entry = Entry Number
Int = Aggregation Interval
BucI = Bucket Index
StartT = Aggregation Start Time
Pth = Path index
Hop = Hop in path index
Comps = Operations completed
OvrTh = Operations completed over thresholds
SumCmp = Sum of RTT (milliseconds)
SumCmp2L = Sum of RTT squared low 32 bits (milliseconds)
SumCmp2H = Sum of RTT squared high 32 bits (milliseconds)
TMax = RTT maximum (milliseconds)
TMin = RTT minimum (milliseconds)Entry Int BucI StartT Pth Hop Comps OvrTh SumCmp SumCmp2L SumCmp2H TMax TMin
1 1800 1 12510779108 1 1 1800 0 35881 716157 0 36 15
1 1800 2 12512579108 1 1 1800 0 36191 732051 0 36 15
1 1800 3 12514379108 1 1 1800 0 35875 717911 0 63 15
1 1800 4 12516179108 1 1 1800 0 36023 725773 0 72 15
1 1800 5 12517979108 1 1 1800 0 35983 721671 0 52 15
1 1800 6 12519779108 1 1 1800 0 36374 741984 0 56 16
1 1800 7 12521579108 1 1 1800 0 36450 763256 0 80 15
1 1800 8 12523379108 1 1 1800 0 36125 731115 0 68 16
Hub and spoke
Co w sytuacji gdy mamy 100 routerów oddziałowych i jednego huba. Konfigurowanie 100 pomiarów IP SLA jest mało przejrzyste – konfig robi się bardzo długi, można pomylić adresy itp.
W takich sytuacjach przychodzi z pomocą bardzo ciekawa funkcja IP Auto SLA dostępna od wersji 15.1. Pozwala ona na automatyczną rejestrację routerów typu Spoke do Huba swoim adresem ip. Konfigurujemy jedynie template dla pomiarów a routery same rejestrują się do Huba – podają swój IP i powstaje pomiar.
Konfiguracja HUBA:
ip sla auto template type ip udp-jitter ipsla-template
parameters
num-packets 100
ip sla auto schedule ipsla-schedule
frequency 60
start-time now
ip sla auto endpoint-list type ip ipsla-endpoints
discoverip sla auto group type ip ipsla-group
schedule ipsla-schedule
template udp-jitter ipsla-template
destination ipsla-endpoints
Konfiguracja SPOKE:
ip sla responder auto-register 10.1.1.2 endpoint-list ipsla-endpoints
I to wszystko! Będziemy mieli automatyczne pomiary każdego Spoke’a, który się zarejestruje. W porównanie z konfiguracją IP SLA dla 100 oddziałów ten konfig wygląda wręcz idealnie!