Stránka 1 z 2

x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 11:10
od Magic
Zdravím,
moc prosím o pomoc. Už si nevím rady. :?
Na hlavním routeru (i5, 2GB RAM, 1000 Queues, 1x VPN přes PPTP, NAT veřejných adres) dochází posledních pár dní k samovolným restartům PC. Chci mýt jistotu pokud se jedná o vadu HW. Stáří cca 1,5 roku.
Nejzájímavější na tom je, že se to děje vždy mezi cca 0:40 a 9:00. Někdy 1x za noc/ráno a někdy až 20x. Frekvence může být i po několika hodinách ... i po cca 5 minutách. Časy začátků restartů nejsou stejné. Někdy to začne až v půl 3 ráno.
Zajímavé je, že pak už se to celý den neprojeví. Až zase po půlnoci.
PC je spolu s dvěmi dalšími PC, switchem a optickým převodníkem na stejné UPSce. Zbylé dva PC se nerestartují.
V době restartů je traffic celé sítě opravdu malý cca 10/2M. Maximální konektivita v době špičky je 150M.

Před cca 2 měsíci byl s tímto PC problém.
Odešel zdroj a poškodili se data na flešce, která je připojená přes IDE redukci (systém ROS nenajel). Vyměnil se zdroj a fleška se přeinstalovala s dotažením zálohy.

Další poznatky:
- Veškeré logy z tohohle shaperu se posílají do syslogu na dude server. O nějaké chybové hlášce nebo něčem co by ukazovalo na to, že dojde k restartu tam nic není.
- Zkoušeno několikrát změnit verzi ROS. Původní 5.14, pak zkoušeno 5.24, 5.7, nyní tam je 5.21. Bez jakéhokoliv vlivu. Kupodivu si myslím, že s verzí 5.14 se pc restartlo nejméně krát za noc. Ale to může být náhoda.
- V době restartů nedojde k nárustu využití CPU. Průměr cca 10%. CPU0 do 30%.
- firewall (input) je nastaven, tak, že je vše zakázáno a co je povoleno bývá povoleno jen pro zdrojové IP adresy. Zahozených inputů cca 60p/s. Nárust pingu není. Nevypadá to jako útok zvenčí, ale můžu se mýlit. Pokládal jsem ho za primární příčinu.
- abych vyloučil vnitřní potíže přestal se dude dotazovat na SNMP a to taky nezabránilo restartům.
- bežné úkony, které s tím nejspíš nesouvisí je záloha ze všech MK v síti v 1:00 na email a v 19:00 záloha backup a rsc přes ftp.

Čím by to mohlo být? Je vada v nějaké HW komponentě? Krom PC jsou tam 2x Realtek GLAN a deska tuším od Gigabytu. :( Dnes bych to poskládal asi jinak.
Mohla by to být nějaká chyba nastavení? Či nějaký druh útoku? Ten čas problémů mi příjde dost podivný.

díky za odpověď

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 11:17
od sub_zero
já bych to osobně tipoval na problém s deskou (nepíšeš jakej tam máš typ). Mohlo to vzniknout při tom prvním spálením zdroje, že něco proletělo do deksy a něco se tam poškodilo.
Dělal si nějakej MemTest? Jak to běží při 100% CPU?

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 11:36
od Magic
Memtest jsem dělal před těmi dvěmi měsíci když zhavaroval ten zdroj a v pořádku.
Když je konektivita ve špiččce, tak nejde cpu v průměru přes 30%. Když se připojím hned po najetí, tak je procesor bez vytížení. Párkrát jsem byl na připojen winboxem a zkoumal. Při tom jsem byl svědkem výpadku a nezaznamenal jsme nárust CPU před tím výpadkem. V době kdy dochází k výpadků ale graf vypadá poněkud divně.
příloha

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 11:40
od Magic
Ten graf je z dneška. Párkrát jsem ho restartl sám když jsem nahrával novou verzi, nebo vypínal a zapínal balíčky. Dnes to bylo extrémní.

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 17:15
od dantasik
Neco podobneho se nam delo pokud byl RoS na SSD disku, nahral jsem ho na normalni sata disk a byl klid. SSD byl taky sata..verze sem laboroval vselijak, deska a vsecko bylo nove..

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 17:21
od pcwifi
hergot nelekej me, ted chystam novy RoS server a uz sem objednal SSD disk :mrgreen:

PW

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 19:24
od Magic
Díky za reakci. Že by to bylo diskem mě tak nějak nenapadlo.
Jen nechápu proč by to mělo dělat jen mezi půlnocí a 9 hodinou ranní. Mimo tuhle dobu se to neprojevilo a to to sleduju už týden s žádným posunem kupředu. Nic zásadního jsme v síti nezměnili.
Vlivy prostředí můžu takřka vyloučit. Je to v místě se stejným klimatem 24hodin denně.
Pokud by to bylo vadnou fleškou myslíte si někdo, že by mohla způsobovat tyto restarty a tak pravidelně?
Nevíte někdo jestli dělá mikrotik zápis na disk pravidelně průběžně nebo s nějakými přesnými intervaly?
Když odešel ten zdroj překvapilo mě, že to poškodilo systém na flešce. Stalo se Vám to někomu?

Tehdy jsem měl připravený náhradní SSD disk, ale nenasadil jsem ho poněvač jsem neměl aktivní licenci a nestihl bych to do 24 hodin zaktivovat.
Při nejhorším zkusím vyměnit a uvidím. Teď už mám aktivní licenci :-D.
Že by to sebou vzalo ten IDE modul?

Díky za každý podnět, který mě posune dál.

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 19:36
od pcwifi
me exla pred nedavnem flashka v USB s RoS a je mozne ze ju vzal s sebou zdroj, ten se totiz odporoucel jako prvni. deska ale prezila zcela ok, po osazeni novym zdrojem vse jelo... po dodani nove flash s RoS :?

PW

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 19:51
od hapi
ten kdo provozuje mikrotika na x86 a na flash mobulu v usb by potřeboval do zubů. :-) nic proti ale to je ten nejhorší způsob co se dá použít. Flash disky obecně jsou poruchoví jak sviňa a obzvlášť když jsou furt pod napájením. A to vůbec už nemluvim o tom že naprostá většina z nich nemá ani wear leveling.

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 20:11
od pcwifi
na cem bezi RoS tobe ? :P

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 20:32
od net.work
pouzivam odjakziva takovehle moduly: http://www.fccps.cz/polovodicove-disky- ... c1165.html a s zadnym sem nemel problem
Myslim ze vetsina je znacky transcend

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 20:36
od Ajfel
net.work píše:pouzivam odjakziva takovehle moduly: http://www.fccps.cz/polovodicove-disky- ... c1165.html a s zadnym sem nemel problem
Myslim ze vetsina je znacky transcend

Hmmm, na nekterych mistech to proste ale pouzit nejde, ze :)

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 20:38
od pcwifi
net.work - z takoveho se mi nedavno snad po 2 - 3 letech zahulilo a to doslova dopismene :lol: mam nejaky pech no...

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 20:42
od net.work
Ajfel píše:
net.work píše:pouzivam odjakziva takovehle moduly: http://www.fccps.cz/polovodicove-disky- ... c1165.html a s zadnym sem nemel problem
Myslim ze vetsina je znacky transcend

Hmmm, na nekterych mistech to proste ale pouzit nejde, ze :)

existuji i do sata
pcwifi píše:net.work - z takoveho se mi nedavno snad po 2 - 3 letech zahulilo a to doslova dopismene :lol: mam nejaky pech no...

ja nevim co vy s tim delate... :)

Re: x86 s ROS a náhodné restarty

Napsal: 09 Apr 2013 21:24
od hapi
pcwifi píše:na cem bezi RoS tobe ? :P


hdd, ssd... CF