説明/参照:
Explanation:
SQL Serverビッグデータクラスタでのスパークは、AIと機械学習を可能にします。
Apache Spark MLlibを使って、簡単な予測分析を行うための機械学習アプリケーションを作成することができます。
開いているデータセット
MLlibは、ユーティリティを含む、機械学習タスクに役立つ多くのユーティリティを提供するコアSparkライブラリです。
それはに適しています:
分類

回帰

クラスタリング

トピックモデリング

特異値分解(SVD)および主成分分析(PCA)

仮説検定と標本統計量の計算

参考文献:
https://docs.microsoft.com/en-us/azure/hdinsight/spark/apache-spark-machine-learning-mllib-ipython
テストレット1
ケーススタディ
これはケーススタディです。ケーススタディは別々には計時されません。あなたはあなたと同じくらい多くの試験時間を使うことができます
各ケースを完了したいと思います。しかし、これに関する追加のケーススタディやセクションがあるかもしれません
試験。あなたはあなたがこれに含まれるすべての質問を完了することができることを確実にするためにあなたの時間を管理しなければなりません
提供された時間内に試験を受けます。
ケーススタディに含まれている質問に答えるには、で提供されている情報を参照する必要があります。
ケーススタディケーススタディには、展示物や詳細情報を提供するその他のリソースが含まれている場合があります。
ケーススタディに記載されているシナリオについて。各質問は他の質問から独立しています
このケーススタディについて。
このケーススタディの最後に、レビュー画面が表示されます。この画面で回答を確認できます
また、試験の次のセクションに進む前に変更を加えることもできます。新しいセクションを始めたら、
このセクションに戻ることはできません。
ケーススタディを開始する
このケーススタディの最初の質問を表示するには、[次へ]ボタンをクリックしてください。左ペインのボタンを使用して
質問に答える前に、ケーススタディの内容を調べてください。これらのボタンをクリックすると表示されます
ビジネス要件、既存の環境、および問題の記述などの情報。その場合
スタディには[すべての情報]タブがあります。表示される情報は情報と同じです。
後続のタブに表示されます。質問に答える準備ができたら、[質問]ボタンをクリックして
質問に戻ります。
バックグラウンド
Trey Researchは技術革新者です。会社が地域の運輸部門と提携
交通の流れと安全性を向上させるソリューションを構築するためのオフィス。
同社は次のソリューションを開発しています。

地域の交通局が北部の主要幹線道路に交通センサーシステムを設置
アメリカ。センサーは、車両がセンサーの前を通過するたびに次の情報を記録します。
時間

緯度と経度での場所

毎秒キロメートル(kmps)の速さ

ナンバープレートの番号

メートル単位の車両の長さ

センサーは次の構造を使用してデータを提供します。

交通センサーは時折デバッグの目的で車両の画像をキャプチャします。
車両画像の保存/保存のパフォーマンスを最適化する必要があります。
交通センサーデータ
Sensorは、SensorDataコレクションに項目を追加するためだけの権限を持っている必要があります。

トラフィックデータの挿入率を最大化する必要があります。

3か月に一度、すべてのトラフィックセンサーデータを分析して、次のことを示すデータパターンを探す必要があります。

センサーが故障している。
センサーデータは、SensorDataという名前のコレクション内のtreydataという名前のCosmos DBに格納する必要があります。

センサーデータに対する車両の画像の影響は、最小限に抑える必要があります。

バックトラック
このソリューションは、特定の車両のナンバープレートに関連するすべてのデータを報告します。レポートは以下のデータを使用する必要があります。
SensorDataコレクション。ユーザーは以下の方法で車両データをフィルタリングできなければなりません。
特定の道路上の車両

制限速度を超えて運転している車両

計画支援
計画支援に使用されるデータは、分割されたAzure SQLデータベースに格納する必要があります。
Sensor Dataコレクションからのデータは自動的にPlanning Assistanceデータベースにロードされます。
Azure Data Factoryを使用して週に1回。データロードプロセスを手動で起動できる必要があります。
プライバシーとセキュリティの方針
Azure Active Directoryは、利用可能なすべてのサービスに使用する必要があります。

プライバシー上の理由から、ナンバープレート番号情報はPlanning Assistanceからアクセスできないようにする必要があります。

計画支援データの許可されていない使用は、できるだけ早く検出される必要があります。

不正使用は、珍しい使用パターンを探すことによって判断されます。
データは7年間だけ保存する必要があります。

パフォーマンスと可用性
バックトラックのレポートはできるだけ早く実行する必要があります。

計画支援のSLAは70%で、複数日の停止が許可されています。

データの損失を防ぐために、すべてのデータを複数の地域に複製する必要があります。

リアルタイムレスポンスシステムの性能を最大限に引き出す必要があります。

財務要件
Azureのリソースコストは可能な限り最小限に抑える必要があります。