podivne kolisajici provoz a narustajici rx_fifo_errors
Napsal: 04 Jan 2014 16:01
Zdravim,
zacaly se nam objevovat podivne problemy. Zrejme je zpusobuje "neco" na hranicni gatewayi. Hranicni GW dela NAT, routing a shaping pomoci HTB.
Pokud je zapnuty shaping pomoci HTB, tak dochazi obcas, vetsinou pres den odpoledne k jevu, kdy na siti behem 2-3 sekund poklesne provoz, pak se uplne zastavi a po cca 10-20 sekundach se provoz obnovi s tim, ze dojde ke kratkodobe spicce v navyseni provozu zhruba 3-4 krat. Tohle zpusobuje vypadky na cca 10-60 sekund (ale nekdy i na 3 minuty). Nejaky problem s buffery?
Pokud je HTB shaping na gatewayi vypnuty, zadne takove dlouhe vypadky se nekonaji, ale zase dochazi k podivnemu kolisani v prutoku siti. Rozdily mezi "zuby" grafu prutoku jsou cca 200Mbit/s, coz mi prijde moc na to, aby to byl normalni provoz zakazniku. Prikladam printscreen z routerboardu RB1100AHx2, ktery je zapojeny hned za GW smerem dovnitr site a je nastaveny jen jako bridge, na kterem konci VLANy (celkem 3 VLAN interface).
Gateway obsluhuje cca 2000 zakazniku. Popis HW serveru je taky v priloze. V serveru je sitova karta “SUPERMICRO Dual 1Gbe NIC, UIO, Low Profile Card“ podporujici rozdelovani IRQ sitoveho provozu na ruzna jadra CPU, vyuzivame vsech 16 queues. Verze IGB ovladace 5.0.6.
Na sitove karte eth1 (vnirtni) i eth0 (smerem do netu) jsem pokusne vypinal:
TCP Segmentation Offloading (TSO)
Generic Receive Offloading (GRO)
„generic-segmentation-offload
--> bez zadneho efektu na kolisavy provoz...
Zajimave treba je, ze porad narustaji errory „rx_fifo_errors“ , ktere sleduju prikazem „watch "ethtool -S eth1 | grep -i error"“. Errory narustaji rychlosti cca jednotek az desitek za zhruba 10 sekund. Toto jsem zatim sledoval jen pri vypnutem HTB.
Nesetkal jste se nekdo s necim podobnym?
Pep.
zacaly se nam objevovat podivne problemy. Zrejme je zpusobuje "neco" na hranicni gatewayi. Hranicni GW dela NAT, routing a shaping pomoci HTB.
Pokud je zapnuty shaping pomoci HTB, tak dochazi obcas, vetsinou pres den odpoledne k jevu, kdy na siti behem 2-3 sekund poklesne provoz, pak se uplne zastavi a po cca 10-20 sekundach se provoz obnovi s tim, ze dojde ke kratkodobe spicce v navyseni provozu zhruba 3-4 krat. Tohle zpusobuje vypadky na cca 10-60 sekund (ale nekdy i na 3 minuty). Nejaky problem s buffery?
Pokud je HTB shaping na gatewayi vypnuty, zadne takove dlouhe vypadky se nekonaji, ale zase dochazi k podivnemu kolisani v prutoku siti. Rozdily mezi "zuby" grafu prutoku jsou cca 200Mbit/s, coz mi prijde moc na to, aby to byl normalni provoz zakazniku. Prikladam printscreen z routerboardu RB1100AHx2, ktery je zapojeny hned za GW smerem dovnitr site a je nastaveny jen jako bridge, na kterem konci VLANy (celkem 3 VLAN interface).
Gateway obsluhuje cca 2000 zakazniku. Popis HW serveru je taky v priloze. V serveru je sitova karta “SUPERMICRO Dual 1Gbe NIC, UIO, Low Profile Card“ podporujici rozdelovani IRQ sitoveho provozu na ruzna jadra CPU, vyuzivame vsech 16 queues. Verze IGB ovladace 5.0.6.
Na sitove karte eth1 (vnirtni) i eth0 (smerem do netu) jsem pokusne vypinal:
TCP Segmentation Offloading (TSO)
Generic Receive Offloading (GRO)
„generic-segmentation-offload
--> bez zadneho efektu na kolisavy provoz...
Zajimave treba je, ze porad narustaji errory „rx_fifo_errors“ , ktere sleduju prikazem „watch "ethtool -S eth1 | grep -i error"“. Errory narustaji rychlosti cca jednotek az desitek za zhruba 10 sekund. Toto jsem zatim sledoval jen pri vypnutem HTB.
Nesetkal jste se nekdo s necim podobnym?
Pep.