tak sem to nemyslel ale je to tak. Tady to rozhazuje v první řadě sítová karta až na 4 IRQ v případě přidaný karty do slotu (v případě integrovaných až 8 IRQ). Takže datovej provoz karta cyklicky rozesílá po IRQčkách a každý IRQčko zpracuje jiný jádro. Tim se výrazně sníží overhead I/O. Jenom sem netušil že to je na základně nějakých datových toků takže čim víc jich je, tim více se rozkládají mezi IRQ. Jde o hardwarovou činnost. Jasně, je tu RPS což je softwarový ale nezabrání to overheadu O/I na jedno jádro ale pouze to umožní přesun paketu mezi jádry pro zpracování jiným jádrem než tím který paket přijmulo což ostatně krásně ukáže když si na mikrotiku RPS vypnete a máte víc jader než jedno. Firewall začne okamžitě využívat pouze jedno jádro a v případě velký zátěže končíte

ale na druhou stranu pokud máte sítovou kartu s hodně queue frontami které to rozhazují více jádrům hardwarově tak je RPS spíše na škodu a sníží to výkon. To sem si nejenom dneska otestoval.
Nicméně i na jedno spojení to dokáže odroutovat 700Mbit. Je to ale dost overkill protože jedno jádro jede v turbu a ostatní se flákaji. Ale kdo by taky routoval jedno spojení že. Při takovejch 10-16 spojeních už se začínaji používat všechny jádra a pak je to teprve zajímavý.
Snad nemusim vysvětlovat proč CCRko nemám rád. Protože z tohoto poznatku CCRko nemůže na jedno spojení vytahnout takovou rychlost jakou by jsme si všichni přáli protože se usadí na jednom jádře a CCRko zase tak výkoný jádra nemá. Pokud počítám že taky s tim paketem je třeba něco udělat a ne jenom forwardnout. To atom taky zvládne na 0-1 procenta jednoho jádra routnout 1Gbit provoz když jenom forwarduje.