KAMONOHASHI 2.xから3.xへの移行

事前準備

  • KAMONOHASHI のバックアップが取れていることを確認します
  • KAMONOHASHI の Admin アカウントでログインできることを確認します

KAMONOHASHI 2.x のアンインストール

rootユーザーで次のコマンドを実行します

cd /var/lib/kamonohashi/deploy-tools/
./deploy-kamonohashi.sh clean all
  • アンインストールはsshを用いて実行されます。
    • 設定されているsshユーザーはdeepops/config/inventoryansible_userの項目で確認できます。
    • sshユーザーでの SSH にパスワードが必要な場合は、clean allに-kオプションを追加します。sudo にパスワードが必要な場合は-Kのオプションを指定します。
  • 既知のバグによりエラーが出ますが、後の手順で再度アンインストールコマンドを実行するので無視して構いません

KAMONOHASHI 3.x 構築

KAMONOHASHIバージョン3.0.0用の構築ツールを入手します

cd /var/lib/kamonohashi/deploy-tools/
git fetch --tags
git checkout 3.0.0.2
(cd deepops; git stash save "backup berfore verup KAMONOHASHI 3")
git submodule update --init --recursive
  • 構築ツールが正常に取得できているか次のコマンドで確認します
    echo KAMONOHASHI deploy tool: $(git tag --points-at HEAD)
    echo deepops: $(cd deepops; git tag --points-at HEAD)
    
    • KAMONOHASHI deploy tool: 3.0.0.2, deepops: 21.03 が表示されれば正常です。
    • 正常でない場合、git submodule update --init --recursiveでエラーが出ていないかを確認してください

構築ツール依存パッケージの更新

  • プロキシ環境下では次のファイルにプロキシ設定を記載してください
    • ./deepops/scripts/deepops/proxy.sh
    • no_proxy にはlocalhost,127.0.0.1,.cluster.local,使用する各マシンのIPアドレス・ホスト名の記載を含めてください
    • OSのno_proxy設定にも上記と同様のno_proxy設定が含まれるように設定してください。/etc/environmentで指定することを推奨します
  • 次のコマンドを実行し、構築に必要なパッケージを入手します
    ./deploy-kamonohashi.sh prepare
    

移行設定の生成

  • 次のコマンドを実行し、設定ファイルの生成を行います
    ./deploy-kamonohashi.sh configure verup
    

    補足事項

    • このコマンドではk8s構築に利用するツールであるdeepopsの設定ファイルについて、以前のバージョン20.02.1と現在のバージョン21.03で互換性がないことの対応を行っています。
    • deepopsの設定ファイルの変更を抽出してdeepops既定外の独自の設定ファイルdeepops/config/settings.ymlに書き移します
    • deepopsの設定ファイルは21.03のデフォルトに書き換えます
    • デプロイコマンド実行時には、deepops/config/settings.ymlの内容をデフォルト設定に上書きして適用されます
    • このコマンドは現在のdeepops設定ファイルと20.02.1のdeepops設定ファイルの差分を見るため、2回実行すると21.03のデフォルトに書き換え後に20.02.1のdeepops設定との比較が行われ、settings.ymlが意図しない内容となります。
    • 過去の設定ファイルはdeepops/old_config配下にコピーされます
  • 設定ファイルが正常に生成され、過去にdeepopsの設定ファイルを編集した内容が書き込まれているか確認します
    cat deepops/conf/settings.yml
    

アンインストールの再実行

  • 再度アンインストールコマンドを実行します
    ./deploy-kamonohashi.sh clean all
    
  • アンインストールはsshを用いて実行されます。冒頭のアンインストールと同様に-K,-kオプションを必要に応じ追加します
  • deepopsのデフォルトGPUドライバパッケージがcuda-driversからnvidia-headless-450-serverに変更になりました。これらに互換性がないため、古いgpuドライバと依存パッケージを含め、全てのnvidiaパッケージのアンインストールを実施します。これらは以前のKAMONOHASHIデプロイツールのアンインストールコマンドではアンインストールされませんでした。
  • このコマンド実行後、GPUサーバーは再起動します

  • コマンド実行後にk8s masterサーバーを手動で再起動します
    reboot
    

設定の変更

構築の実施

  • 再起動完了後にrootユーザーで次の構築コマンドを実行します
    cd /var/lib/kamonohashi/deploy-tools
    ./deploy-kamonohashi.sh deploy all
    
  • 構築はsshを用いて実行されます。冒頭のアンインストールと同様に-K,-kオプションを必要に応じ追加します
  • シングルノード構成の場合はドライバインストールの際にk8s masterサーバーが再起動されるため、 再起動後に再度./deploy-kamonohashi.sh deploy allを実行してください

構築完了のメッセージが出たらブラウザで次のURLにアクセスし、adminユーザーでログインして利用を開始してください

  • KAMONOHASHI: http://KAMONOHASHI用サーバー/kamonohashi
  • アクアリウム機能: http://KAMONOHASHI用サーバー/aquarium