
説明

手順 1: Azure HDInsight クラスターを作成して Apache Spark Mlib ライブラリを含める 手順 2: Apache Spark 用の Microsot Machine Learning をインストールする Azure HDInsight クラスターに AzureML をインストールします。
Microsoft Machine Learning for Apache Spark (MMLSpark) は、Spark Machine Learning パイプラインと Microsoft Cognitive Toolkit (CNTK) および OpenCV とのシームレスな統合を含む、Apache Spark 用の多数のディープ ラーニングおよびデータ サイエンス ツールを提供します。大規模な画像およびテキスト データセット用のスケーラブルな予測および分析モデル。
ステップ 3: クラスターで Zeppelin ノートブックを作成して実行する
ステップ 4: クラスターの準備ができたら、Zeppelin ノートブックをローカル環境にエクスポートします。
ノートブックは、ローカルでバージョン管理されるようにエクスポート可能である必要があります。
参考文献:
https://docs.microsoft.com/en-us/azure/hdinsight/spark/apache-spark-zeppelin-notebook
https://azuremlbuild.blob.core.windows.net/pysparkapi/intro.html