DB je v cluster - tím myslím opravdický cluster ne jako ORACLE... takže nepadá.
Namátkou určitě Cassandra, ScyllaDB, MySQL NDB Cluster (snad i Fabric - nezkoušel jsem), Galera a podobné...
Stejně tak by měl vypadat i zbytek systému. Rozsekanej na malý služby, který dokážou pochopit, že nějaká jiná služba nefunguje (pokud není kritická) a pokud je - běží X krát najednou, takže je oslovuje naráz a nebo si prostě vybere.
Někdy spojuje několik odpovědí najednou aby odstínil chybu (porovná jejich výsledek).
Microservices s orchestrací, krásné je pokud se služby automaticky umí registrovat do systému za chodu.
Klíčové části běží 3+ krát a výpadek jednoho je odstíněný redundancí. Prostě normálka? Vy to tak neděláte?
Mas tam uzke hrdlo. Co kdyz spadne DB ? Budou umet ty jednoduche skripty ci mikrosluzby v pripade potreby zapisovat jinde az DB je dolu ?