banner
Casa / Blog / Gremlin ora può trovare automaticamente problemi di affidabilità comuni
Blog

Gremlin ora può trovare automaticamente problemi di affidabilità comuni

Apr 25, 2024Apr 25, 2024

Gremlin, la startup di test di affidabilità nota soprattutto per i suoi strumenti di ingegneria del caos, ha annunciato oggi il lancio della sua funzionalità Rischi rilevati. In questo modo, Gremlin può ora identificare automaticamente problemi di affidabilità ad alta priorità come errori di configurazione o valori predefiniti errati nei servizi basati su Kubernetes e quindi classificarli in base alla gravità del rischio che presentano. Il servizio suggerirà anche potenziali soluzioni.

"L'affidabilità continua ad acquisire un'importanza crescente", ha affermato Kolton Andrus, CTO e fondatore di Gremlin. “La nostra infrastruttura digitale è importante quanto la nostra infrastruttura fisica. Il governo, la sanità, i trasporti, la comunicazione e la finanza fanno tutti affidamento su questa base digitale, che presenta dei rischi. Fortunatamente, molti di questi rischi sono semplici da mitigare, se conosciuti. Ecco perché siamo entusiasti di annunciare i nostri nuovi rischi rilevati. Abbiamo lavorato duramente per esporre rapidamente problemi gravi all’interno dei sistemi dei nostri clienti, rischi che possono poi mitigare per migliorare qualitativamente la postura dei loro sistemi”.

Crediti immagine:Gremlino

Mentre gli strumenti di ingegneria del caos di Gremlin cercano situazioni insolite che possono spingere l'infrastruttura di un'azienda ai limiti, Detected Risks utilizza una serie di test preconfigurati, con altri 20 in arrivo entro la fine dell'anno. Questi test verificano la presenza di problemi comuni che possono influire sulla reale affidabilità e resilienza dell'infrastruttura di un'azienda. Rischi rilevati funziona senza dover eseguire esperimenti di ingegneria del caos o test di affidabilità.

In larga misura, questi test sono piuttosto semplici e incapsulano le migliori pratiche, come garantire che una distribuzione sia configurata per essere eseguita in più zone di disponibilità per garantire la ridondanza. Potrebbe sembrare buon senso, ma esaminando le migliaia di implementazioni eseguite dai suoi clienti, Gremlin ha scoperto che il 26% non presentava ridondanza e l'80% delle implementazioni non presentava due ridondanze. L'azienda rileva che il sistema cerca anche le configurazioni errate comuni di Kubernetes che potrebbero influenzare, ad esempio, la scalabilità automatica.

"Nel nostro settore sono presenti molti SRE brillanti che lavorano duramente per mitigare personalmente questi problemi, ma questo approccio non è scalabile", ha affermato Andrus. “Stiamo risolvendo questo problema costruendo qualcosa di facile da usare che fornisca informazioni preziose su migliaia di applicazioni del mondo reale. Fornire alla leadership tecnica visibilità sui rischi esistenti li aiuta a stabilire le priorità e a portare a termine questo importante lavoro in modo che possano continuare a proteggere l’esperienza del cliente e a creare software di alta qualità”.

Crediti immagine: