5 Replies Latest reply: Jan 29, 2013 5:16 PM by asahide RSS

    acfsについて教えて下さい。

    user13231473
      Oracle11gr2 で2ノード構成(OS は、Red Hat Enterprise Linux 5.4です。)で、運用しており、他システムとの連係用のファイルの格納先としてACFSを使用しています。
      ACFSをLinuxにマウントポイントからディレクリを作成していたのですが、一部のディレクトリが参照できなくなりました。
      具体的には、lsコマンドで応答が帰ってこなくなりました。
      データベースサーバを再起動した後に、アクセスできなかったディレクトリにアクセスできるようになりました。

      上記のような、現象について原因を教えて下さい。
        • 1. Re: acfsについて教えて下さい。
          asahide
          確認させて下さい。
          以下のような状況と理解してよろしいでしょうか。


          2ノードのRACをノードA、ノードBで構築しているとして、他システムのノードCからACFSをマウントしていた。
          ノードCから一部のディレクトリ*のみ*が参照できなくなった、一部のディレクトリ*のみ*lsがハングした。

          そのため、ノードCを再起動して再度ACFSをマウントしたら正常に読めるようになった。

          1. 一部のディレクトリと別の参照できたディレクトリに何か差分はありますか?
          2. ノードCからのマウントはどのようなオプションで実施されてますでしょうか?
          • 2. Re: acfsについて教えて下さい。
            user13231473
            2ノードのRACをノードA、ノードBで構築しています。
            ノードAからACFSの一部のディレクトリをls コマンドで参照しようとする、ハングしました。

            ノードA、ノードBを再起動し、回復しました。

            現状、回復はしておりますますが、顧客に原因の報告をしなくてはなりません。
            原因等心あたりがありましたら教えて下さい。
            • 3. Re: acfsについて教えて下さい。
              asahide
              ちょっと探してみましたけど、あんまり「Hang」したような事例は見当たらないですね。。

              /var/log/messages には何も出てませんでしょうか。
              後、参考までにmkfsした時のオプションや、ボリューム作成した時のコマンド、ハングした時のキャプチャとか。。


              また、特異な状況は何かありましたでしょうか。
              大きめのデータを書き込んでたとか、小さいデータをたくさん書いていたとか、そういった類の話です。
              多分通常のファイルシステムハングと同じような原因調査になるのではないかと思います。。
              • 4. Re: acfsについて教えて下さい。
                user13231473
                /var/log/messages には何もでていなせんでした。

                ただし、以下の業務処理が走っていました。

                A系では、20分間で6,304件のファイルをDBに取込み処理が走っており、取込み後にファイルをバックアップフォルダに格納しています。
                ただし、ファイルは3箇所のディレクトリに分散しています。

                B系では、44分間で6,706件のファイルをA系と同じ処理をしています。
                B系も、A系同様ファイルは3箇所のディレクトリに分散しています。

                A系、B系での業務処理が走っている時間はそれぞれ異なります。

                気になるのは、B系の1箇所のディレクリでファイル名は存在しますが、ファイルがオープンエラーになっているファイルが存在しました。
                多分、B系側のVSFのinode cache と Directory cache に食い違いが発生しています。
                B系のVSFの状態が、A系にも影響を与えるのでしょうか?
                B系で発生したエラーが原因で他のディレクトリにアクセスできなくなるようなことがあるのでしょうか?
                • 5. Re: acfsについて教えて下さい。
                  asahide
                  ACFSは共有ファイルシステムなので「片側での異常がもう片側にも発生する」という事はありうるのではないかとは思います。
                  ACFSはfsckとかできるのでしたっけ。。