- 3,714,730 Users
- 2,242,614 Discussions
- 7,845,030 Comments
Forum Stats
Discussions
Oracle Cloud Infrastructure Data Scienceを使ってみよう

Oracle Cloud Infrastructure Data Scienceとは
・2020/2/19に、「Oracle Cloud Data Science Platform」が発表されました。
これはいくつかのサービスを包含したソリューションであり、主に以下のサービスが含まれます。
Oracle Cloud Infrastructure Data Science
Oracle Autonomous Database」の新しい強力な機械学習機能
Oracle Cloud Infrastructure Data Catalog
Oracle Big Data Service
Oracle Cloud SQL
Oracle Cloud Infrastructure Data Flow
Oracle Cloud Infrastructure Virtual Machines for Data Science
・Oracle Cloud Infrastructure Data Scienceの紹介はこちらのブログにあります。
・Oracle Cloud Infrastructure Data Scienceは、東京DCから利用可能、またFree Trialでも利用可能です。
・本セッションではこの、Oracle Cloud Infrastructure Data Scienceを実際使い始めるところまでを、説明したいと思います。
参考文献
・Oracle Cloud Infrastructure Data Science ドキュメント
・【Oracle Cloud Infrastructure】OCIコンソールを触ってみる
・【Oracle Cloud Infrastructure】VCN(仮想ネットワーク)を作る
ノートブック環境の作成手順
ユーザー、コンパートメントとテナンシの確認
上記参考文献の「【Oracle Cloud Infrastructure】OCIコンソールを触ってみる」もしくは、ドキュメントを参考ください。
VCNの作成
上記参考文献の「【Oracle Cloud Infrastructure】VCN(仮想ネットワーク)を作る」を参考に作成します。
以下を入力します。
・VCN名
・VCN CIDRブロック
・パブリック・サブネットCIDRブロック
・プライベート・サブネットCIDRブロック
ポリシーの作成ポリシーを作成します
ポリシーを作成し、以下のポリシーステートメントを作成します
<group name>にはユーザーのグループ名、<compartment name>はコンパートメント名を入れます
allow group <group name> to manage data-science-family in compartment <compartment name>
allow group <group name> to use virtual-network-family in compartment <compartment name>
allow service datascience to use virtual-network-family in compartment <compartment name>
プロジェクトの作成
いよいよ、Oracle Cloud Infrastructure Data Scienceの操作になります。
データサイエンスからプロジェクトを開き、プロジェクトを作成します。
コンパートメントを選択し、プロジェクト名を入力し、プロジェクトを作成します。
ノートブックセッションの作成
ノートブックセッションの作成ボタンから、ノートブックセッションを作成します。
コンパートメントおよび、ノートブックセッションで使用するインスタンスシェイプを選択します。
またノートブックセッションで使用する、ブロックストレージを選択します。ブロックストレージは現時点で、50GBから1,024GB (1TB)の範囲で入力します。
VCN、サブネットを選択します。
現時点(2020/3)で選択できるシェイプは以下のとおりです。
ノートブックセッションの作成が完了するまで数分待ちます。
ノートブックセッションの起動
開くボタンから、ノートブックセッションを起動します。
ノートブックセッションである、Jupyter Labが起動します。
ノートブック環境(JupyerLab)の初期作業
ノートブック環境に含まれるもの
各フォルダにサンプルのノートブックが含まれます。
ads-examplesには、Oracle Cloud Infrastructure Data Scienceに含まれる、Pythonライブラリの、Oracle Accelerated Data Science SDK (ADS) の利用例を記載した、サンプルノートブックが含まれていて、実際にADSを活用する際のサンプルとして非常に役立ちます。
このADSには、AutoML、モデル説明のためのMachine learning explainability (MLX)などの最新ライブラリが含まれています。
ADSの詳細な説明に関しては、ADSのドキュメントを参照してください。
OCI configuration fileの設定(サンプルノートブックを利用して)
ノートブックから、Object StorageといったOCIへアクセスするには、 OCI configuration fileの設定が必要となります。
Oracle Cloud Infrastructure Data Scienceでは、このOCI configuration fileの設定を、サンプルノートブックから設定できます。
”getting-started.ipynb”の"Getting Started with OCI Data Science"の作業を、ノートブック上に記載のとおりに順番に実施していきます。
まず、下記のセルを選択し、▶ボタンか、「Ctrl + Enter」を選択し、実行します。
実行後には上記のような、メッセージが返ってきます。
これ以降は、ノートブック上の”Setup your OCI Configuration File”の作業を実施します。
TENANCY_OCID、OCI_REGION、USER_OCIDは、ノートブック記載の画面を参考に、変更してください。
上記実施後は下記のような結果が返ってきます。
最後に、 公開キー作成し、OCIのコンソールにコピーします。
ノートブック記載の画面にあるとおり、「ユーザーの詳細」画面の「APIキー」にコピーペーストします。
最後に設定ができたか、テストを実施します。
下記のような結果が返ってきたら完了です。
以上で、Oracle Cloud Infrastructure Data Scienceを使い始めるための、基本的な設定は終了です。
上記以降の、”getting-started.ipynb”には、
ADSの概要説明、ADSを利用したデータの読み込み、データの確認、モデルの作成、モデルをカタログへ登録し確認
の一連の流れを、サンプルデータを使って、ハンズオン形式で実施することができるようになっています。
ぜひここから、ADSがどういうものか概要を理解し、上述したサンプルノートブックと、ADSのドキュメントを参照してみてください
それでは、
Let's Enjoy Data Science on Oracle Cloud Infrastructure !