Pingdomで外形監視
3号です。3番目に書くので3号になってしまいました。外形監視についてゆるく書きます。
私の会社では外形監視にPingdom - Website Monitoringを利用しています。Pingdomは世界中の拠点から対象のエンドポイント(http(s), smtp, DNSなど)の死活監視をしてくれるサービスで、比較的簡単な設定でエンドポイントの監視が実現できます。SaaS/PaaS/IaaSをうまく活用するのが最近のトレンドであることもあり、Slackなど他サービスとのインテグレーションにも優れています。
主に以下のようなものを監視しています。
- HTTP(S):自社サービスのエンドポイント
- HTTP(S):他社の連携先のAPIエンドポイント
- HTTP(S):社内システムのエンドポイント
- SMTP:AWS SES
- Name Resolve:AWS Route 53
自社のサービスはもちろん、連携先のシステムの死活監視もPingdomで行っていて、重要度に応じてPingdomからSlack/メール/PagerDuty(※)と通知する仕組みにしています。 なお、現時点ではPingdomはDNSの監視としてCNAMEの正当性の確認はできないようです。AレコードのIPが正しいこと、のみ。
※ PagerDutyはアラート時に電話をかけてくれるサービスです。インシデント発生時にサンフランシスコから国際電話がかかってきますw 平日日中帯はslack、夜、休日はPagerDutyで電話、という工夫をしています。