Nu, také mě to překvapilo, že to v těch virtuálech se na nich drží evidentně v desítkách us. Ale vysvětlení asi je, že to je rok starý HW a přestože je tam aktivně živých 20 virtuálů, tak počet fyzických jader cca odpovídá alokovanému počtu virtuálních CPU, takže se virtuál drží svého fyzického jádra a jede to takhle krásně ve virtuálu a taktéž na fyzickém HW pod tím (24 fyzických jader, virtálních 31, CentOS7 podklad i virtuál, KVM).
Pokud se podívám do racku vedle na historický HW, co má tak 7 let odslouženo, kde je 16 fyzickéch jader a o které soupěří aktivně běžících cca 30 virtuállů (podklad CentOS5, KVM, virtuály Slackware 10), tak už to je o řád horší (oba stejné NTP+externí GPSky v rámci LAN, 2NTP je jen o dva switche dál):
# ntpq -p
remote refid st t when poll reach delay offset jitter
==============================================================================
* 2NTP .PPS. 1 u 12 1024 377 0.244 0.817 0.664
+ 1NTP .PPS. 1 - 8 64 377 0.224 0.062 0.460
A jak ta zátěž začne stoupat, tak to jde do kytek, lokalita na opačné straně ČR, 12 fyzických jader o které soutěží živých 50 virtuálů s CentOS6 podklad, KVM, virtuály Slackware 10, Zdrojem času jsou 3 NTP v LAN, dva sdílí jednu GPSku (NTP30 a NTP31), třetí ji má integrovánu:
# ntpq -p
remote refid st t when poll reach delay offset jitter
==============================================================================
+ NTP30 .PPS. 1 u 68 128 377 0.608 52.751 113.245
x NTP31 .GPS. 1 u 78 128 377 0.460 -122.04 126.707
* NTP32 .PPS. 1 u 78 128 377 1.869 56.161 114.396
To už odpovídá tomu, jak to ukazoval tazatel s těma dvměa NTP/GPS na dvou koncích Prahy. I zde je to rozlétáno a občas to některý NTP server vyhodí. Občas jsou čísla i horší, často i lepší. Přitom odjinud jsou ty 3 zdroje vidět v jedné lajně, pokud je to nazatížený stroj.
K tomu rozdílu půl ms u NTP ze tří lokalit, tak také souhlasím, že to je spíše dopad asymetričnosti linek a vlivu delay linky. Mnohem menší dopad má, že GPS není integrována v NTP a je tak od ní delší rozvod PPS s převodníky. Protože není nad jednoduchý pokus, že si v té jedné lokalitě připojím i něco s integrovanou GPS (NTP30-NTP32 odpovídá tomu výpisu výše i ze stejného času):
# ntpq -p
remote refid st t when poll reach delay offset jitter
==============================================================================
- NTP1 .MRS. 1 u 170 256 377 0.168 -0.505 0.467
* NTP2 .PPS. 1 u 101 256 377 12.818 -1.821 0.467
+ NTP30 .PPS. 1 u 104 256 377 15.083 -2.009 0.585
+ NTP31 .PPS. 1 u 160 256 377 15.771 -2.695 1.034
+ NTP32 .GPS. 1 u 161 256 377 15.029 -1.812 0.526
Takže je vidět i stádovitost vyhodnocení shluku, kdy už NTP dává přednost vzdálenému zdroji, jehož jitter, delay a ofset je nejlepší z toho shluku a odmítne lokální zdroj o rack vedle (NTP1 je M500/GPS). NTP2 je těch 120 km západ (M300/RDT a ext GPS167), NTP30 až NTP31 je 30 km východ, komunikačně o něco dále, než ten západ, přitom NTP30 (M300/GPS s použitým ext PPS, protože interní GPS kaput) a NTP31 (M300/RDT) mají společnou GPS167, jen do NTP30 je to 30 metrů PPS rozvodu a do druhého 3/4 km rozvodů a asi šesti převodů metalika/sklo cestou. NTP32 je s integrovanou GPS (M300/GPS), tyhle tři leží u sebe v kruhu cca 1 km. Všude je cca 20~40 metrů koaxu mezi anténou a GPS.
Takže ten offset dle toho opravdu padá spíše na nedokonalost IP trasy, než těch lokálních rozvodů. Biasem by to šlo asi poštelovat, pokud by se mi neměnil moc charakter vytížení IP tras, ale není k tomu asi reálný důvod, jen jsem si to zkusil, jak se to cca chová. :-)