Monitorowanie Wydajności SDH
Liczniki błędów (B1/B2/B3), progi i sygnały utrzymaniowe.
Wprowadzenie: Deska Rozdzielcza Sieci
Kluczowym czynnikiem, który odróżniał SDH od starszych technologii, był kompleksowy, wbudowany system do monitorowania stanu sieci w czasie rzeczywistym. Można to porównać do deski rozdzielczej samochodu: kierowca nie czeka, aż silnik się zatrze, by zorientować się, że jest problem; monitoruje wskaźniki, takie jak kontrolka temperatury czy ciśnienia oleju. Podobnie, operator sieci nie może sobie pozwolić na czekanie na katastrofalną awarię, która dotknie tysiące klientów.
Monitorowanie wydajności w SDH dostarcza właśnie takiej „deski rozdzielczej” poprzez osadzenie bogatego zestawu narzędzi bezpośrednio w bajtach Nagłówka (OH) każdej ramki. Narzędzia te pozwalają sieci na ciągłe sprawdzanie pod kątem , wykrywanie awarii sprzętu i automatyczne raportowanie problemów. Umożliwia to proaktywne utrzymanie i zapewnia wysoki poziom niezawodności wymagany od globalnego szkieletu komunikacyjnego.
Podstawowy Mechanizm: Kontrola Błędów za Pomocą Parzystości z Przeplotem Bitowym (BIP)
Podstawowym narzędziem do wykrywania błędów transmisji w SDH jest mechanizm Parzystości z Przeplotem Bitowym (BIP). Jest to prosty, ale potężny rodzaj sumy kontrolnej, który działa na wielu warstwach w sieci, pozwalając operatorom precyzyjnie zlokalizować, gdzie występują błędy.
Jak Działa BIP?
Obliczenie BIP-N polega na koncepcyjnym uporządkowaniu wszystkich bitów sprawdzanego bloku danych w wyimaginowaną matrycę o N kolumnach. Następnie dla każdej kolumny obliczany jest pojedynczy bit parzystości (zazwyczaj parzystość parzysta, co oznacza, że suma wszystkich bitów '1' w kolumnie wraz z bitem parzystości musi być liczbą parzystą). Te N bitów parzystości jest następnie przesyłanych w dedykowanym bajcie nagłówka. Urządzenie odbiorcze wykonuje dokładnie te same obliczenia BIP-N na odebranych danych i porównuje swój wynik z wartością BIP-N wysłaną przez nadajnika. Jakakolwiek niezgodność wskazuje, że wystąpił jeden lub więcej błędów bitowych.
Na żywo: wskaźniki wydajności SDH
Przełącz warstwy i okna czasowe, aby zobaczyć, jak liczniki parzystości tworzą KPI usługi.
Monitoring hop-by-hop wykrywa brudne odcinki światłowodu, zanim zdestabilizują multiplekser.
Świeża próbka parzystości pokazująca sporadyczne zakłócenia po spawie.
Niezgodności BIP
12
Liczba niezgodności parzystości w tym oknie.
ES
4
Liczba sekund z błędami w oknie.
SES
1
Liczba sekund poważnie zaburzonych w oknie.
BBE
6
Bloki błędne w tle poza okresami SES.
UAS
0
Sekundy niedostępności zgromadzone w oknie.
Dostępność
99,995%
Wynikowy współczynnik dostępności po odjęciu sekund UAS.
Czysto40 s
Brak niezgodności parzystości w tym fragmencie.
Czysty ładunek
- Dryf lasera na odcinku B⇄C został zawężony; kolejne multipleksery wciąż widzą czystą parzystość.
- Na podstawie tych liczników można wysłać ekipę terenową zanim wyższe warstwy utracą ramkowanie.
Świeża próbka parzystości pokazująca sporadyczne zakłócenia po spawie.
Czysto
Brak niezgodności parzystości w tym fragmencie.
Sekunda z błędami (ES)
W fragmencie zliczono co najmniej jedną niezgodność BIP.
Poważnie zaburzona (SES)
Wybuch błędów przekroczył próg SES dla tego fragmentu.
Niedostępna (UAS)
Usługa uznana za niedostępną z powodu utrzymującej się serii SES.
SDH inteligentnie stosuje kontrole BIP na swoich trzech głównych warstwach operacyjnych:
- B1 (BIP-8) – Poziom Sekcji Regeneratorowej: Ta kontrola monitoruje stan fizycznego łącza światłowodowego między dwoma sąsiednimi urządzeniami (np. między dwoma regeneratorami). Znajduje się w Nagłówku Sekcji Regeneratorowej (RSOH) i zapewnia kontrolę „hop-by-hop”, pozwalając na szybką izolację uszkodzonego kabla lub wadliwego lasera.
- B2 (BIP-N×24) – Poziom Sekcji Multiplekserowej: Jest to znacznie bardziej solidna kontrola błędów, umieszczona w Nagłówku Sekcji Multiplekserowej (MSOH). Dla STM-1 jest to BIP-24; dla STM-4 jest to BIP-96 (). Monitoruje ona integralność całego sygnału między dwoma multiplekserami, obejmując wiele odcinków regeneracyjnych. Liczba błędów B2 jest głównym wskaźnikiem jakości linii dla operatorów sieci.
- B3 (BIP-8) – Poziom Ścieżki: Ta kontrola jest częścią i jest obliczana tylko dla ładunku konkretnego Kontenera Wirtualnego. Pozwala to operatorowi na monitorowanie jakości pojedynczej usługi klienta (np. łącza E1) w całej sieci, niezależnie od stanu innych usług współdzielących ten sam światłowód.
Od Surowych Błędów do Znormalizowanych Miar
Sama liczba błędów BIP jest użyteczna, ale do efektywnego zarządzania dużą siecią błędy te kategoryzuje się w znormalizowane parametry monitorowania wydajności, zazwyczaj mierzone w interwałach 15-minutowych i 24-godzinnych. Parametry te pomagają odróżnić drobne, przejściowe usterki od poważnych problemów wpływających na usługi.
- Sekunda z Błędami (ES): Interwał jednosekundowy, w którym wystąpił jeden lub więcej błędów BIP. Odpowiada po prostu na pytanie: „Czy w tej sekundzie był jakikolwiek błąd?”
- Sekunda Poważnie Zaburzona Błędami (SES): Interwał jednosekundowy, w którym liczba błędów BIP przekroczyła z góry określony wysoki próg, co wskazuje na znaczną serię błędów. SES sugeruje, że jakość usługi została w tej sekundzie poważnie zdegradowana.
- Blok Błędny w Tle (BBE): Błąd BIP, który nie jest częścią Sekundy Poważnie Zaburzonej Błędami. BBE reprezentują izolowane błędy o niskim poziomie, które mogą nie wpływać na usługę, ale mogą wskazywać na pogarszający się stan łącza, które wymaga przyszłej konserwacji.
- Sekunda Niedostępności (UAS): Sekunda, w której usługa jest uważana za całkowicie niedostępną. Okres niedostępności zazwyczaj rozpoczyna się po kolejnym ciągu 10 Sekund Poważnie Zaburzonych Błędami, a kończy po okresie 10 kolejnych sekund bez żadnych SES. Ta metryka jest kluczowa dla obliczeń Umowy o Poziomie Usług (SLA).
Sygnały Alarmowe i Utrzymaniowe: Wołanie Sieci o Pomoc
Oprócz metryk wydajności dla błędów „miękkich”, SDH posiada zaawansowany system alarmów do raportowania awarii „twardych”, takich jak uszkodzenie sprzętu lub przerwanie światłowodu. Sygnały te są kluczowe dla szybkiej lokalizacji uszkodzeń i uruchamiania przełączania protekcyjnego.
Krytyczne Alarmy Awaryjne
- Utrata Sygnału (LOS): Najpoważniejszy alarm. Wskazuje, że urządzenie odbiorcze nie wykrywa żadnego światła na swoim wejściu optycznym. Prawie zawsze oznacza to przerwanie światłowodu lub całkowitą awarię lasera nadawczego.
- Utrata Ramki (LOF): Odbiornik wykrywa światło na wejściu, ale nie może znaleźć prawidłowego wzorca ramkowania A1/A2 w strumieniu danych. Oznacza to, że odbiera dane, ale nie potrafi określić granic ramek STM, co czyni dane niezrozumiałymi.
Sygnały Komunikacji o Awarii
Gdy węzeł wykryje krytyczną awarię, musi poinformować inne węzły w sieci. Używa do tego dwóch kluczowych sygnałów utrzymaniowych:
- Sygnał Wskazania Alarmu (AIS): Nazywany również „niebieskim alarmem”, jest to sygnał „podtrzymania alarmu”. Gdy węzeł wykryje awarię taką jak LOS lub LOF, przestaje próbować wysyłać normalne dane i zamiast tego transmituje dalej specjalny sygnał AIS (zazwyczaj same &
- Zdalna Sygnalizacja Defektu (RDI): Jest to odpowiednik AIS dla kierunku „w górę rzeki”. Gdy węzeł wykryje awarię na swoim wejściu (np. odbierze AIS), musi poinformować węzły przed nim, że połączenie jest przerwane i zawodne. Robi to, przesyłając sygnał RDI w przeciwnym kierunku. RDI jest przenoszony w bajcie K2 (dla warstwy linii) lub G1 (dla warstwy ścieżki).