こんにちは!在宅カエルです!
今回もAWS SysOps Administrator Associate(SOA)受験に向けて学習を進めます。
主に自分の勉強用ですが、SOAを受験する方も
是非参考にしてみてください!
・AWS SysOps Administrator Associate を勉強中の方
・CloudWatchによるメトリクスとログの監視方法について知りたい方
前の記事ではCloudWatchの概要とメトリクスの収集についてまとめました。
今回は収集したメトリクスをどうやって監視し、運用に利用するかについて書きます!
また、メトリクスと合わせてCloudWatchではログの監視もすることができるので
そちらについても触れておきます。
CloudWatch Alarms(メトリクスの監視)
CloudWatchではAWSサービスやオンプレミスのサーバからメトリクス
(CPUの使用率、メモリの使用率、エラー発生数などデータポイントを
一定期間集計したデータのこと。)を収集することができます。
しかし、メトリクスを収集するだけではメトリクスの値からサービスの異常を検知し、管理者へ通知するといったことはできません。
そんな時に利用したいのがCloudWatch Alarmsです。
CloudWatch AlarmsではCloudWatchで収集しているメトリクスを監視して、
メトリクスの値が一定の条件に達した場合にアラームを出すことや
対応するためのアクションを実行することが可能です。
例えばですが、
*CPU利用率が70%を超えた場合にアラートを出しAWS SNSと連携し管理者にメールを通知
*内部エラーを検知して、Lamdaと連携してEC2インスタンスの自動再起動を実行
といった使い方ができるということです!
メトリクスによる状態監視
CloudWatchではOK、ALARM、INSUFFICIENT_DATAの三つの状態を監視します。
状 態 | 概 要 |
---|---|
OK(正常値) | 定義された閾値を下回る。 |
ALARM(異常値) | 定義された閾値を上回る。 |
INSUFFICIENT_DATA(不足) | データ不足のため判定不能。 |
またCoudWatchではダッシュボードが提供されているので、
アラームやメトリクスを可視化することができます。
これによってサービス毎のアラートのサマリーを表示可能なので
パフォーマンス改善や障害発生時のデータ分析に役に立ちます。
CloudWatch Logs(ログの監視)
CloudWatch Alarmsではメトリクスを収集して、
各種サービスを監視することができました。
これによりシステムの稼働状況を監視し、
異常があれば通知するといったことが可能になります。
それに加えてCloudWatchではログの監視機能も提供しています。
CloudWatch LogsはAWSサービス及びシステムの
様々なログファイルを収集・監視します。
収集したログに対してフィルタリング、通知、他AWSサービスとの連携が可能です。
以下のようなログが取得できます。
*OS上のログをCloudWatchエージェントにより収集
*CloudTrailのログ
*VPC Flow Logsのログ など
ログの可視化
日々システムを運用していくと、出力されるログの量も膨大になってきます。
CloudWatch LogsのログデータはCloudWatch Logs Insightによって、
可視化して分析することができます。
Logs Insightとは収集したログに対してクエリを利用して集計や分析を行うことができるサービスです。CloudTrailやVPCフローログといった主要のログではサンプルクエリが提供されており手軽に利用できます。
まとめ
・CloudWatch Logsでは各種AWSサービスやシステムのログを収集管理する
・ダッシュボードやInsightなどによって可視化することができ、データ分析を実施できる
次回以降も引き続きSOAの勉強記事を作成していきます。
コメント