SB C&Sの最新技術情報 発信サイト

C&S ENGINEER VOICE

【ワイヤレスブログ 第13回】トラブルシューティング

ネットワーク
    2020.02.24

    こんにちは!
    ワイヤレスブログ取り敢えずの最終回は無線環境のトラブルシューティングです。
    無線環境って目に見えない部分があり、一旦問題が発生するとどこに問題があるのか
    探索するのが非常に大変なものがありますよね。
    その際に確認すべき内容についてわかりやすく解説していきます。

    (1)把握

    状況把握

    まずはともあれ何が発生しているのか状況を把握しましょう。
    申告内容は問題の発生を把握するという意味では大切な情報ですが、申告者がITに詳しいとは限りません。
    不足している、勘違いをしているなどの問題も含まれていることに注意が必要です。
    障害の受付を行った場合には慌てずに事態の内容について正確な情報を自身で把握するようにしましょう。

    影響範囲

    申告してきた人が一人であっても実は周囲の人も影響があるかもしれません。
    影響を受けている人、機器がどのようになっているのか確認しましょう。
    個別の問題なのか、ある程度の範囲で発生しているのかを確認できれば問題特定までの時間を短縮することが可能です。

    影響時間

    問題が発生したのはいつなのか、その問題はいまも発生しているのか。
    問題の発生時間を正確に把握することは問題解決を行ううえで大切な要素です。
    ポイントですが、無線機器の時間もNTPを利用し正確な時間あわせを行いましょう。
    無線機器がせっかくログとして情報を提示してくれているのに、その時間が信用できないと問題解決までに時間がかかってしまいます。

    (2)要因

    今までの情報をもとに問題解決にいたるまでの基礎情報を集めることができました。
    それでは具体的な問題解決を行っていきましょう。
    まずは影響範囲が大きいと想定される場合の考慮すべき内容です。

    1.無線環境
    2.ネットワーク機器

    これ以外の問題発生としては無線とは離れた形での問題が考えられます。
    例えばゲートウェイの機器が落ちている、名前解決が出来ていないなどなど
    ここは一般的なネットワークに対する問題解決となりますの本ブログでは割愛させていただきます。 それではそれぞれの考慮事項に対して、もう少し深堀りしていきます。

    1.無線環境

    RSSIやSNRといった言葉で表現される環境ですが、こちらは定量的に無線環境を表現するために重要な指標となります。
    RSSIは電波の受信強度と表現されますが、この値は無線機間の距離と電波出力が重要な要素となります。
    受信強度が大きくなると通信速度を早くすることができますし、通信の安定にも寄与することが可能です。
    ただし受信強度が大きくても途中に電波を撹乱する要素(壁、キャビネット、水槽など)があると電波が減衰し通信に影響を及ぼします。
    もう一つの指標としてはSNRがあります。これは電波の信号強度と無線環境のノイズの比率を表したものであり信号品質を表すのにはこちらの値のほうが適切といえます。
    要するに電波の受信強度(RSSI)がいくら高いものであってもノイズが多いと無線環境としては好ましいものではなく通信速度の低下、通信の途切れなどが発生してしまうということです。
    ノイズの要因としては自身が管理していないアクセスポイントの電波や、Wi-Fi以外の製品による同じ帯域の電波(電子レンジ)などがあげられます。
    他にも無線環境といっていいのか設計ミスなのか微妙ですが1台のアクセスポイントに多数のクライアントが接続しようとしている場合にも無線としては接続が確立しているものの通信ができないといった状態があります。
    またよく聞く無線の問題として時々無線通信ができなくなる。もしくは通信ができなくなるけど2、3分で回復するという場合にはDFSの影響が考えられます。
    一般的には無線機器がDFSの対応動作を行うことにより1分間は5GHz帯の無線出力を停止し、レーダー波の検出を行ってから次のチャンネルで電波出力を行います。
    この動作は無線機器にとって正常ではあるものの、ユーザーにとっては問題として申告してくるでしょう。
    ローミングの問題も忘れてはいけません。あるアクセスポイントから別のアクセスポイントに接続が切り替わる、いわゆるローミングのタイミングで接続が瞬断することがありますが(ローミングの詳細についてはワイヤレスブログ第9回を参照ください)ちょうど切り替わりの狭間にいるクライアンはブツブツと通信が途切れてしまい不満を抱えているかもしれません。

    2.ネットワーク機器

    こちらはアクセスポイントが電波を出していないことによる影響です。
    電波が出していないのはアクセスポイントの異常なのですが、その要因として考えられるのは以下のものがあります。
    ・アクセスポイントに対して電源供給されていない
    ・アクセスポイントの故障
    ・アクセスポイントと有線ネットワークが接続されていない
    ・アクセスポイントのソフトウェア障害
    ・アクセスポイントの設定ミス
    ここでアクセスポイントと記載しましたが、これは集中管理型の無線機器であるなら無線コントローラーについても考慮する必要があります。

    個別の端末で問題が発生している場合の考慮事項は以下の通りです。
    1.認証
    2.DHCP
    3.クライアント

    今度は個別の項目についてもう少し深堀りしていきましょう。

    1.認証

    認証が間違っていると接続することが出来ませんが、無線機器のシスログを適切に管理できているのであれば認証エラーとして表示されているので解決しやすい障害かもしれません。
    認証にはPSKや802.1xなどの手法がありますが、まず考えられるのがID/Passの入力間違いです。
    数字の"1"とエルの小文字"l"など、文字が似ているものは間違いが生じやすいものではないでしょうか。
    このような組み合わせをなるべく排除することにより問題の発生を削減することが可能です。
    また個別の問題発生ではなく、大規模な発生要因として認証サーバとの通信ができなくなっていることもありますので注意が必要です。

    2.DHCP

    DHCPが適切に設定されることによりクライアントは自動的にIPアドレスが付与されます。
    ここでの問題ですが、無線機器の問題というよりはDHCPサーバ側の問題であることが考えられます。
    例えばDHCPサーバのIPアドレスリース期間をむやみやたらと長いものとした結果、払い出し可能なIPアドレスが無くなってしまいクライアンにIPDアドレスを付与することが出来なくなってしまうといった事例です。
    他にもIPアドレスが割り当てられているにも関わらずブラウザで外部サイトが閲覧できない!といった場合にはDNSの設定もしくはDNSが稼働していない、DNSまでの経路がないといったこともあります。

    3.クライアント

    クライアントで考慮すべき事項は以下の通りです。
    ・OS
    単純にOSの問題という事ではないのですが、OSについて何らかのアップデートを行った場合に周辺機器との接続がうまくいかないという事象があります。
    ・アプリケーション
    無線接続を簡単に行えるようなアプリケーションがありますが、何やら悪さをして繋がらなくなってしまうといった事象があります。
    ・無線NICドライバ
    ドライバの品質が悪く無線通信が途切れてしまう、速度が遅くなるといった事象があります。
    ・無線NICハードウェア
    無線NICが故障してしまったために無線通信ができなくなるといった事象があります。

    また当たり前の話かもしれませんが、自身の無線環境を認識しておくことも非常に重要です。
    問題解決に向けて様々な考慮事項をあげていきましたが、そもそも自身の無線環境ではあてはまらないものが存在します。
    余計な事に時間をかけることなく効率良く問題を解決していくためには自身の無線環境を理解しておきましょう。

    無線問題の解決には様々なものがあることを理解していただいたうえで全て一人で対応するとなるとウンザリしてきますよね?
    僕はやりたくありません。
    ではこのような問題の解決を手伝ってくれる製品はないのでしょうか。
    どのような機能があれば問題解決を迅速に行うことができるのでしょう。
    そんな悩みを解決するためにどうすれば良いのかを以下に列挙します。

    (3)無線問題の解決のために

    ・無線機器の時間を正確に

    いつ何が行ったのか複数の無線機器もしくはネットワークで状況を把握するときに、それぞれの時間が異なっていると問題解決までの時間が余計にかかってしまいます。
    ではどうするのか。
    NTPです。NTPで同期をとるのです!
    NTPで同期を取ることにより全ての機器が非常に高精度で信頼性のある時刻を保持することが可能です。
    ただNTPで同期を取るためにグローバルのNTPサーバに自ネットワークの全ての機器が同期にいくのはやめてくださいね。
    いくら公開されているから好き勝手にするとせっかく公開されているNTPサーバが無くなってしまうかもしれません。
    自ネットワークからは公開されているNTPサーバに1台だけ同期を行い、その他の機器は自身が立てたローカルNTPサーバと同期を行うようにしましょう。

    ・シスログを活用しよう

    ほとんど全てのエンタープライズ用無線機器はシスログの機能を持っています。
    問題の申告があってから対応を開始するのがほとんどでしょうから、過去に何があったのか確認するためにはシスログが大変重要なものとなります。
    シスログを活用することにより機器のシステムメッセージを後から見直し、そこで何があったのか無かったのかを確認することができます。
    機器の故障なども単体ではわからないかもしれませんが、関連機器の情報を一緒に確認することにより解決の糸口を得ることができます。

    ・自身のネットワークを把握しよう

    何がどこにつながっていて、どのような構成となっているのかを理解できるようにしましょう。
    せっかく様々な情報があっても何故そうなるのかを理解するためには物理及び論理構成図が必ず必要です。
    こちらのメンテナンスは非常に面倒であり、優先順位は低いと考えられがちですが問題が生じたときに解決のスピードをあげるためには必須です。
    ぜひともネットワークの構成図を作成しメンテナンスを実行してください。

    ・メーカーの管理ツールを活用しよう

    非常に高価なものですのですのですが、なにかあったときには非常に頼りになります。
    製品によっては様々なネットワークのシスログを収集し問題の特定を助けてくれるものもあったります。
    また最近はやりのクラウド管理を行っているSDうんちゃらの製品ですと最初から障害解析のツールが用意されていたりしますので、自分で何かを用意したり購入したりしないですむため目に見えないコストを考えるとお得かもしれません。

    またメーカーによっては無線環境をリアルタイム確認可能なソリューションが存在します。
    具体的にはクライアントを擬似したデバイスを用意し常に通信を行うことによって広範囲で問題が発生した場合のトラブルシュートを容易にするものです。
    これはクライアントを擬似したデバイスを用意しただけ無線環境を細かく確認することが可能となります。

    いかがでしたでしょうか。
    無線のトラブルシューティングは非常に複雑なので対応したくないと思われているかもしれませんが、とっかかりがあればなんとかなると思っていただければ幸いです。

    それでは今回はこのあたりで。
    またいつの日かワイヤレスブログでお会いしましょう。

    他のおすすめ記事はこちら

    著者紹介

    SB C&S株式会社
    技術統括部 第2技術部 1課
    柴山 弘