最近どうっすか?

コンピュータをメインに技術系の話題について書いていけたらいいなぁ。

サービスレベルのこと

本当はプログラム(プログラミング)の話を書きたいと思っていたのだけど。。。

書くネタがなく、ネタがたまるのを待っていたらいつまでも書けないので、インフラの運用の話題で書いてみようと思います。

 

SLA(サービスレベルアグリーメント)というものがあります。

サービスの品質を数値化してサービス事業者とサービス利用者が合意したレベル(値)をサービス事業者は達成する(しなければならない)という決まりです。

サービスが稼働していた時間(停止していなかった時間)が1か月のうちで何%以上であることを保証します。ダメだったら返金等の対応をする、という契約が多いかと思います。

あと、事前に告知したメインテナンス等の停止時間は除くのも一般的でしょうか。

 

では、ではどのくらい停止していたら稼働率「(総時間数ー停止時間)/総時間数」はどのくらいなのか?という点について計算してみたいと思います。

 

一か月を30日とした場合、次のような計算になります。 

停止(日数)停止(時間数)停止稼働率
30日 720時間 100% 0%
3日 72時間 10% 90%
1日 24時間 3.333..% 96.666..%
0.3日 7.2時間 1% 99%
0.03日 43.2分 0.1% 99.9%

 

30日間(720時間)停止していたら稼働率は0%です。

分かりやすいですね。

3日間(72時間)停止していたら稼働率は90%です。

3日間も停止していても90%を達成できるのは計算上は当然ですが90%というイメージではないかもしれません。

24時間(1日)停止していたときの稼働率は96.666...%となります。

7.2時間停止していたときの稼働率は99%です。

0.72時間(43.2分)停止していたときの稼働率は99.9%です。

 

システムの運用停止を引き起こすハードウェア障害やソフトウェア(システム)トラブルが「どのくらい(頻度と時間数)」起こるか?を考えてみるといいかもです。

 

反対に「どのくらい(頻度と時間数)」に収めるために必要なリソースは「どのくらい(システム・人員)」か?を考える方法もあります。

 

サービス開始時から順調にビジネスが拡大したら再見積りが必要になりますが、SLAの条項は変更しにくいのでリソース拡充の見直しが発生するということを意識しておかないとシステムの運用は破たんしてしまいます。

利用者から見るときも、そういう所をちゃんと見てくれる事業者が良いと思いますよ。

 

ではでは。