Jump to content 日本-日本語
製品  >  ソフトウェア  >  Linux

kdumpを利用する際のシステム構成について
Red Hat EL5, EL6対応

Open Source & Linux

導入事例

product

ハードウェア
ソフトウェア
サービス & サポート

buy now?

HPE OPEN SERVICES
保守サービス
教育プログラム

support

OS対応表
ProLiant
Workstation
システム構成図
技術文書
FAQ
ディストリ対応表
サポート & ドライバ
リンク
SDR - 設定方法
FreeBSD
サイトマップ
HPE & Red Hat情報ポータル HPEとRed Hatが実現するオープンなイノベーション
BSD 動作確認レポート等を掲載
コンテンツに進む
20-FEB-2012, revised 30-AUG-2013
 本ページに記載してある内容は限られた評価環境に於ける検証結果に基づいたものです。本ページの情報を利用する前に予めサイト内リンク技術情報サイト外リンク保証について、ディストリビュータが提供する WEBサイト等をご覧ください。

利用する SmartArrayコントローラとドライバについて

 RHEL5で SmartArrayを利用する場合、ccissドライバを利用します。RHEL6では、利用する SmartArrayの世代によってドライバが異なります。
  • SmartArray P40x世代迄: ccissドライバ
  • SmartArray P41x世代以降: hpsaドライバ

SmartArray利用時の kdumpの問題について

 SmartArrayを利用してローカルディスク経由の kdumpを実行する場合、2nd kernel起動時 SmartArrayをハード的にリセットします。問題のあるドライバ及び firmwareは、リセット処理が正常に動作せず kdumpの実行に失敗する場合がありました。この現象は、ドライバ及び firmwareのリセット処理に問題があり、以下バージョンで解決しました。
=ccissドライバ=
RHEL5.7(kernel-2.6.18-274〜)
hp提供cciss-3.6.28-12以降(for RHEL5)
=hpsaドライバ=
RHEL6.1(kernel-2.6.32-131.12.1〜)
RHEL6.2(kernel-2.6.32-220〜)
hp提供cciss-cciss-4.6.28-12以降(for RHEL6)
hp提供hpsa-3.0.0-1以降
 上記ドライバと firmwareのリセット処理は連携して動作しますので、SmartArray P41x世代では v5.0以上、P42x世代では v1.28以上にアップデートしなければ kdumpの実行に失敗します。

 お使いのシステム環境がリセット問題対応前の kernelまたはドライバだった場合、リセット問題対応バージョンにアップデートするか、sshまたは nfs経由のダンプを検討してください。これらの問題の詳細については Customer Advisory サイト外リンク#35197354をご覧ください。

dump採取時間の目安と ASRの設定について

 ProLiant 300ファミリー以上には hpasmドライバと連携した ASR機能(ハードウェア強制リセット)が装備されてます(一部 100シリーズにも装備されています)。このため、システムがロックアップしメモリダンプの採取が開始された後、一定時間が経過すると ASRが発動し、メモリダンプの採取が完了しないうちにシステムにハードウェアリセットが掛かってしまう場合があります。これを避けるためにシステムのデータ転送環境に応じて ASRの設定時間(通常10分)を変更してください。

 メモリ容量、ストレージ速度等、システムパフォーマンス等、また kdump.confの設定の複数の要因によりメモリダンプデータの転送時間は変化します。'kernel panic発生〜ダンプ後のrebootまで'の時間のおおまかな目安を以下表*に示します。
*測定は、後述の'[検証環境について]'のDL380G6で実施しました。

圧縮 ダンプレベル 2nd kernel起動時間 ダンプ時間 vmcoreサイズ
無し 0 109sec 73sec 6041MiB
有り 0 109sec 81sec 314MiB
有り 31 109sec 22sec*1 54MiB*1
: 圧縮時の測定値は OS及びアプリケーションのメモリ利用状況によって変化します。
*1: 搭載メモリ 6GB、空きメモリ 4.3GBでの測定値です。

ディストリビューション毎の稼働状況一覧

○: 問題ありません(SmartArrayのリセット問題に対応したドライバです)。
△: 2nd kernel起動時 SmartArrayのリセットに失敗しますが coreイメージは生成されます。
×: kernel and/or ドライバに問題があるので、問題が修正されたバージョンにアップデートする以外回避策がありません。

RHEL5
    標準ドライバ PSP搭載ドライバ
version x86 x86_64 version(PSP) x86 x86_64
BASE cciss 3.6.14-RH1 ×*1,8 ×*1,8 *2 *2 *2
U1 cciss 3.6.16-RH1 ×*4,8 ×*4,8 *2 *2 *2
U2 cciss 3.6.20-RH1 ×*4,8 ×*4,8 3.6.24-4のみ(8.50) *3 *3
U3 cciss 3.6.20-RH2 ×*4,9 ×*4,9 3.6.28-12以降(8.73) *3,13 *3,13
U4 cciss 3.6.20-RH3 ×*4,9 ×*4,9 3.6.28-12以降(8.73) *3,13 *3,13
△(2.6.18-164.15.1〜)*9 △(2.6.18-164.15.1〜)*9
U5 cciss 3.6.20-RH4 *9 *9 3.6.28-12以降(8.73) *3,13 *3,13
U6 cciss 3.6.22-RH1 *9 *9 3.6.28-12以降(8.73) *3,13 *3,13
U7 cciss 3.6.28-RH1 *13 *13 3.6.28-12以降(8.73) *3,13 *3,13

RHEL6
    標準ドライバ PSP搭載ドライバ
version x86 x86_64 version(PSP) x86 x86_64
BASE hpsa 2.0.2-2 ×*5,10 ×*5,10 3.0.0-1以降(8.72)
cciss 3.6.26 *11 *11 4.6.28-12以降(8.72) *13 *13
U1 hpsa 2.0.2-3 △(ProLiant G6以下)*6,10 △(ProLiant G6以下)*6,10 3.0.0-1以降(8.72)
×(ProLiant G7)*7,10 △(ProLiant G7)*6,10
○(2.6.32-131.12.1〜)*12,13 ○(2.6.32-131.12.1〜)*12,13
cciss 3.6.28 ×*7,11,14 ×*7,11,14 4.6.28-12以降(8.72) *13 *13
○(2.6.32-131.12.1〜)*12 ○(2.6.32-131.12.1〜)*12
U2 hpsa 2.0.2-3 3.0.0-1以降(8.72)
cciss 3.6.28 *13 *13 4.6.28-12以降(8.72) *13 *13

*1 2nd kernel起動時の ccissドライバロード中に kernel panicが発生しますので kdumpの実行に失敗します。
*2 SmartArrayのリセット問題に対応したccissドライバは提供されていません。
*3 hp提供ccissドライバは全ての errata kernelに対応していません。ドライバが対応する errata kernelバージョンはリリースノートを参照してください。
*4 高I/O負荷時に kernel panicが発生した場合、2nd kernel起動時の ccissドライバロード中に kernel panicが発生しますので kdumpの実行に失敗します。
*5 エラーメッセージが('NMI: IOCK error (debug interrupt?)')が延々と表示され続け、 2nd kernelが起動しないので kdumpの実行に失敗します。
*6 NMI関連の warningメッセージが表示されますが coreファイルは生成されます。
*7 kernel panic直後に 1st kernelが freezeするので kdumpに失敗します。
*8 RHEL5.3以降にアップデートし、SmartArrayのリセット問題が修正された hp提供cciss-3.6.28-12以降のドライバを利用してください。
*9 SmartArrayのリセット問題が修正された hp提供cciss-3.6.28-12以降のドライバを利用してください。
*10 SmartArrayのリセット問題が修正された hp提供hpsa-3.0.0-1以降のドライバを利用してください。
*11 SmartArrayのリセット問題が修正された hp提供cciss-4.6.28-12以降のドライバを利用してください。
*12 kexec-tools-2.0.0-209以降を利用してください。
*13 firmwareが v5.0未満の場合ドライバは正常に動作しません。必ず firmwareを v5.0以上にアップデートしてください。

特記事項

  • /etc/kdump.confの設定でダンプデバイスを明示的に指定しない場合、kdumpの実行に失敗することがあります。この問題は、以下例の通りダンプデバイスを明示的に指定することで回避することができます。
    # cat /etc/kdump.conf
    ext4 /dev/sda1 <--- ダンプデバイスを明示的に指定する
    path /var/crash
    core_collector makedumpfile -c --message-level 1 -d 31
    default shell
    #
  • ext4ファイルシステムがサポートされる kernel-2.6.18-238(RHEL5.6)以上でダンプデバイスに ext4を指定する場合、ext4ファイルシステムに対応した kexec-tools-1.102pre-126.el5_6.4以上を利用する必要があります。
  • kexec-tools-2.0.0-188(RHEL6.1同梱)から raw partitionダンプに対応しました。2011年 02月現在、RHEL5の kexec-toolsは raw partitonダンプに対応していません。
  • kexec-toolsは errataリリース毎に多数の bugfix/Enhancementが行われている為、最新バージョンの利用をお勧めします。kexec-toolsは 2nd kernel用の initramfsを作成するツールなので通常の運用に影響はありません。
  • その他 kdumpについての Known issue/Enhancementは、利用する OSバージョンの Techinical Notesまたは、ドライバの Release Notesを参照してください。

検証環境について

DL380G7
 RBSU: P67(05/05/2011)
 CPU: Intel(R) Xeon(R) X5650 2.67GHz(2socket)
 MEM: 12GB
 HBA: SmartArray P410i(firmware: v5.06, cache 1024MB)
 NIC: onboard NC382i(Broadcom BCM5705C x 4port)
 VIDEO: ATI ES1000
 Disk: SAS 146GB

DL380G6
 RBSU: P62(05/05/2011)
 CPU: Intel(R) Xeon(R) E5540 2.53GHz(2socket)
 MEM: 6GB
 HBA: SmartArray P410i(firmware: v5.06, cache 256MB)
 NIC: onboard NC382i(Broadcom BCM5705C x 4port)
 VIDEO: ATI ES1000
 Disk: SAS 146GB

DL385G5p
 RBSU: A22(02/19/2006)
 CPU: Quad-Core AMD Opteron(tm) Processor2384 2.7GHz(2socket)
 MEM: 16GB
 HBA: SmartArray P400i(firmware: v7.22, cache 512MB)
 NIC: onboard NC382i(Broadcom BCM5705C x 4port)
 VIDEO: ATI ES1000
 Disk: SATA 250GB
このページのトップへ戻る
印刷用画面へ印刷用画面へ
プライバシー ご利用条件・免責事項