x86 s ROS a náhodné restarty
Napsal: 09 Apr 2013 11:10
Zdravím,
moc prosím o pomoc. Už si nevím rady.
Na hlavním routeru (i5, 2GB RAM, 1000 Queues, 1x VPN přes PPTP, NAT veřejných adres) dochází posledních pár dní k samovolným restartům PC. Chci mýt jistotu pokud se jedná o vadu HW. Stáří cca 1,5 roku.
Nejzájímavější na tom je, že se to děje vždy mezi cca 0:40 a 9:00. Někdy 1x za noc/ráno a někdy až 20x. Frekvence může být i po několika hodinách ... i po cca 5 minutách. Časy začátků restartů nejsou stejné. Někdy to začne až v půl 3 ráno.
Zajímavé je, že pak už se to celý den neprojeví. Až zase po půlnoci.
PC je spolu s dvěmi dalšími PC, switchem a optickým převodníkem na stejné UPSce. Zbylé dva PC se nerestartují.
V době restartů je traffic celé sítě opravdu malý cca 10/2M. Maximální konektivita v době špičky je 150M.
Před cca 2 měsíci byl s tímto PC problém.
Odešel zdroj a poškodili se data na flešce, která je připojená přes IDE redukci (systém ROS nenajel). Vyměnil se zdroj a fleška se přeinstalovala s dotažením zálohy.
Další poznatky:
- Veškeré logy z tohohle shaperu se posílají do syslogu na dude server. O nějaké chybové hlášce nebo něčem co by ukazovalo na to, že dojde k restartu tam nic není.
- Zkoušeno několikrát změnit verzi ROS. Původní 5.14, pak zkoušeno 5.24, 5.7, nyní tam je 5.21. Bez jakéhokoliv vlivu. Kupodivu si myslím, že s verzí 5.14 se pc restartlo nejméně krát za noc. Ale to může být náhoda.
- V době restartů nedojde k nárustu využití CPU. Průměr cca 10%. CPU0 do 30%.
- firewall (input) je nastaven, tak, že je vše zakázáno a co je povoleno bývá povoleno jen pro zdrojové IP adresy. Zahozených inputů cca 60p/s. Nárust pingu není. Nevypadá to jako útok zvenčí, ale můžu se mýlit. Pokládal jsem ho za primární příčinu.
- abych vyloučil vnitřní potíže přestal se dude dotazovat na SNMP a to taky nezabránilo restartům.
- bežné úkony, které s tím nejspíš nesouvisí je záloha ze všech MK v síti v 1:00 na email a v 19:00 záloha backup a rsc přes ftp.
Čím by to mohlo být? Je vada v nějaké HW komponentě? Krom PC jsou tam 2x Realtek GLAN a deska tuším od Gigabytu.
Dnes bych to poskládal asi jinak.
Mohla by to být nějaká chyba nastavení? Či nějaký druh útoku? Ten čas problémů mi příjde dost podivný.
díky za odpověď
moc prosím o pomoc. Už si nevím rady.

Na hlavním routeru (i5, 2GB RAM, 1000 Queues, 1x VPN přes PPTP, NAT veřejných adres) dochází posledních pár dní k samovolným restartům PC. Chci mýt jistotu pokud se jedná o vadu HW. Stáří cca 1,5 roku.
Nejzájímavější na tom je, že se to děje vždy mezi cca 0:40 a 9:00. Někdy 1x za noc/ráno a někdy až 20x. Frekvence může být i po několika hodinách ... i po cca 5 minutách. Časy začátků restartů nejsou stejné. Někdy to začne až v půl 3 ráno.
Zajímavé je, že pak už se to celý den neprojeví. Až zase po půlnoci.
PC je spolu s dvěmi dalšími PC, switchem a optickým převodníkem na stejné UPSce. Zbylé dva PC se nerestartují.
V době restartů je traffic celé sítě opravdu malý cca 10/2M. Maximální konektivita v době špičky je 150M.
Před cca 2 měsíci byl s tímto PC problém.
Odešel zdroj a poškodili se data na flešce, která je připojená přes IDE redukci (systém ROS nenajel). Vyměnil se zdroj a fleška se přeinstalovala s dotažením zálohy.
Další poznatky:
- Veškeré logy z tohohle shaperu se posílají do syslogu na dude server. O nějaké chybové hlášce nebo něčem co by ukazovalo na to, že dojde k restartu tam nic není.
- Zkoušeno několikrát změnit verzi ROS. Původní 5.14, pak zkoušeno 5.24, 5.7, nyní tam je 5.21. Bez jakéhokoliv vlivu. Kupodivu si myslím, že s verzí 5.14 se pc restartlo nejméně krát za noc. Ale to může být náhoda.
- V době restartů nedojde k nárustu využití CPU. Průměr cca 10%. CPU0 do 30%.
- firewall (input) je nastaven, tak, že je vše zakázáno a co je povoleno bývá povoleno jen pro zdrojové IP adresy. Zahozených inputů cca 60p/s. Nárust pingu není. Nevypadá to jako útok zvenčí, ale můžu se mýlit. Pokládal jsem ho za primární příčinu.
- abych vyloučil vnitřní potíže přestal se dude dotazovat na SNMP a to taky nezabránilo restartům.
- bežné úkony, které s tím nejspíš nesouvisí je záloha ze všech MK v síti v 1:00 na email a v 19:00 záloha backup a rsc přes ftp.
Čím by to mohlo být? Je vada v nějaké HW komponentě? Krom PC jsou tam 2x Realtek GLAN a deska tuším od Gigabytu.

Mohla by to být nějaká chyba nastavení? Či nějaký druh útoku? Ten čas problémů mi příjde dost podivný.
díky za odpověď