アクアリウムAI開発者ガイド
本書はAI開発者を対象としてアクアリウムの機能や手順を説明する事を目的としています。
前提
読者がLinux、Git、Dockerの基本的な知識を持つこと、KAMONOHASIで学習を行った経験があること、を前提としています。
- Dockerが初めての方はリンク先を選択してください。以下のリソースは、Dockerについて学ぶのに役立ちます。
- Dockerとはなにかlaunch
- コンテナとはなにかlaunch
- Docker公式チュートリアルlaunch
概要
AI開発者は以下の操作を行えます。
- ログイン
- ユーザ情報設定
- ダッシュボード
- テンプレートを管理する
- データセットを管理する
- 実験を実行する
- 実験を管理する
本ドキュメント内に説明のない項目は、データ保持者向けガイドを参照してください。
アクアリウムダッシュボード
ダッシュボードからは、アクアリウムの各機能を実行することができます。
テンプレート管理
テンプレート管理画面では、アクアリウムの実験で使用するテンプレートの作成、表示、更新を行います。
テンプレート一覧
テンプレート一覧を表示するには、ダッシュボードまたはメニューから、テンプレートを選択します。 選択すると、作成済みテンプレートの一覧が表示されます。
テンプレート登録
テンプレートを登録するには、テンプレート一覧画面からモデルテンプレート登録を選択します。
- Step 1
テンプレートの基本設定を登録します。
種類 | 説明 |
---|---|
テンプレート名 | テンプレートの名前。 |
説明文 | テンプレートの説明など補足情報。 |
公開設定 | テンプレートを公開するテナント。現在のテナント:テンプレート登録者のカレントテナント。全テナントに公開:全てのテナント |
- Step 2
前処理を登録します。前処理のないテンプレートでは空にします。
種類 | 説明 |
---|---|
前処理コンテナイメージ | 前処理で利用するDockerレジストリ、コンテナ、タグ、アクセストークンを指定する。 |
スクリプト | 前処理で利用するソースコードを格納しているGitサーバ、リポジトリ、ブランチ、コミットID、アクセストークンを指定する。コミットIDを指定した場合はブランチの入力値は無視される。コミットIDが未指定の場合はブランチのHEADが選択される。ブランチもコミットIDも未指定の場合は、masterブランチのHEADが選択される。 |
実行コマンド | 前処理で実行するコマンドを指定する。コンテナイメージに設定されたcommand, entrypointは無効になり、このコマンドのみが実行される |
CPU・メモリ・GPU | 前処理で利用するコンテナに割り当てるリソース量を指定する。 |
- Step 3
学習を登録します。
種類 | 説明 |
---|---|
学習コンテナイメージ | 学習で利用するDockerレジストリ、コンテナ、タグ、アクセストークンを指定する。 |
スクリプト | 学習で利用するソースコードを格納しているGitサーバ、リポジトリ、ブランチ、コミットID、アクセストークンを指定する。コミットIDを指定した場合はブランチの入力値は無視される。コミットIDが未指定の場合はブランチのHEADが選択される。ブランチもコミットIDも未指定の場合は、masterブランチのHEADが選択される。 |
実行コマンド | 学習で実行するコマンドを指定する。コンテナイメージに設定されたcommand, entrypointは無効になり、このコマンドのみが実行される |
CPU・メモリ・GPU | 学習で利用するコンテナに割り当てるリソース量を指定する。 |
テンプレート更新
テンプレートを更新するには、テンプレート一覧画面から更新するテンプレート登録を選択します。
入力内容はテンプレート登録と同じです。
テンプレートの補足情報
アクセストークン
Dockerレジストリ、Gitリポジトリの公開設定によっては、アクセスにアクセストークンが必要な場合があります。
テンプレートにはアクセストークンの設定を含めることができます。 テンプレートにトークンがあれば、どのユーザが実験を行う場合でも、それが使われます。 テンプレートにトークンがなければ、ユーザ情報設定画面で入力したユーザごとのトークンが使われます。
前処理
テンプレートでは、学習処理の一部を「前処理」として分離することができます。 前処理は、(テンプレートとそのバージョン、データセットとそのバージョン)の組が同一であれば、その結果が再利用されます。
ある(テンプレートとそのバージョン、データセットとそのバージョン)組に対して初めて実験を行うと、前処理、学習ともに実行されます。 同じ組に対して実験を再実行すると、前処理は実行されず、前回の前処理の結果が再利用され、後続の学習の入力になります。
フォルダ構造
アクアリウム学習実行時のフォルダ構造は、KAMONOHAHIのそれを基にしています。
- 前処理なしテンプレートの学習・前処理ありテンプレートの前処理
/kqi/input
/kqi/output
/kqi/git
は、KAMONOHASHIのものと同じです。
アクアリウムのデータセットはKAMONOHASHIのFlatデータセットです。
- 前処理ありテンプレートの学習
/kqi/output
/kqi/git
は、KAMONOHASHIのものと同じです。
前処理の結果は/kqi/parentから参照できます。 前処理で/kqi/output/a/bとして出力したファイルは、学習からは/kqi/parent/a/bとして読むことができます。
/kqi/inputは空です。