
Explanation:
ボックス1:0.859122
ボックス2:正の線形関係
+1は、強い正の線形関係を示します
-1は強い負の線形相関を示します
0は、2つの変数間に線形関係がないことを示します。
参照:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/compute-linear-correlation
トピック1、ケーススタディ
概要
あなたは、プロのスポーツイベントにデータサイエンスを提供する会社のデータサイエンティストです。モデルは、次のビジネス目標を達成するためのグローバルおよびローカルの市場データになります。
*群衆の反応からの音声に基づいて、スポーツイベントでのモバイルデバイスユーザーの感情を理解します。
*広告に反応するユーザーの傾向にアクセスします。
*モバイルデバイスに配信される広告のスタイルをカスタマイズします。
*ペナルティイベントを検出するためにビデオを使用してください。
現在の環境
要件
*ペナルティイベントの検出に使用されるメディアは、消費者向けデバイスによって提供されます。メディアには、スポーツイベント中にキャプチャされ、ソーシャルメディアを使用してスネアされた画像やビデオが含まれる場合があります。画像と動画のサイズと形式はさまざまです。
*モデル構築に利用できるデータは、7年間のスポーツイベントメディアで構成されています。スポーツイベントのメディアには、録画されたビデオ、ラジオ解説のトランスクリプト、およびスポーツイベント中にキャプチャされた関連するソーシャルメディアフィードフィードからのログが含まれます。
*群衆の感情には、モノラル形式とステレオ形式の両方でイベント参加者から提出されたオーディオ録音が含まれます。
広告
*広告応答モデルは、各イベントの開始時にトレーニングし、スポーツイベント中に適用する必要があります。
*マーケットセグメンテーションnxxlelsは、同様の広告resporr.r履歴に合わせて最適化する必要があります。
*サンプリングは、同じ機能を共有する相互および集合的な排他性のローカルおよびグローバルセグメンテーションモデルを保証する必要があります。
*広告に応答するユーザーの傾向を判断する前に、ローカルマーケットセグメンテーションモデルが適用されます。
*データサイエンティストは、モデルの劣化と減衰を検出できる必要があります。
*広告応答モデルは、非線形境界機能をサポートする必要があります。
*広告傾向モデルはカットしきい値が0.45であり、加重カッパが0.1 +/- 5%から外れると再トレーニングが発生します。
*広告傾向モデルは、次の図に示すコスト係数を使用します。

広告傾向モデルは、次の図に示す提案されたコスト要因を使用します。

現在および提案されているコスト要因シナリオのパフォーマンス曲線を次の図に示します。

ペナルティの検出と感情
調査結果
*データサイエンティストは、ペナルティイベントの検出に複数の機械学習モデルを使用してインテリジェントなソリューションを構築する必要があります。
*データサイエンティストは、機械学習パイプラインでの自動特徴エンジニアリングとモデル構築を使用して、ローカル環境でノートブックを構築する必要があります。
*動的なワーカー割り当てでSparkインスタンスを使用して再トレーニングするには、ノートブックをデプロイする必要があります
*ノートブックは、データのソースのみを再コード化するために、新しいSparkインスタンスで同じコードで実行する必要があります。
*グローバルペナルティ検出モデルは、トレーニング中に動的ランタイムグラフ計算を使用してトレーニングする必要があります。
*ローカルペナルティ検出モデルは、BrainScriptを使用して作成する必要があります。
*地域の群衆感情モデルの実験では、地域のペナルティ検出データを組み合わせる必要があります。
*群衆の感情モデルは、歓声や既知のキャッチフレーズなどの既知の音を識別する必要があります。個々の群衆感情モデルは、同様の音を検出します。
*ローカルモデルのすべての共有機能は連続変数です。
*共有機能は倍精度を使用する必要があります。後続のレイヤーには、実行中の平均と標準偏差の合計メトリックが使用可能である必要があります。
セグメント
生産の最初の数週間で、次のことが観察されました。
*広告の回答率は低下しました。
*ドロップは広告スタイル間で一貫していませんでした。
*トレーニングデータと本番データ全体での機能の分散には一貫性がありません。
分析によると、ユーザーの位置と行動に関する100の数値特徴のうち、位置ソースからの47の特徴が生の特徴として使用されています。偏りと分散の問題を解決するために推奨される実験は、10個の線形に修正されていない特徴を設計することです。
ペナルティの検出と感情
*最初のデータ検出では、群集感情モデルに使用されるトレーニングデータに、ターゲット状態の密度が広範囲にわたって示されています。
*すべてのペナルティ検出モデルは、確率的勾配降下法(SGD)を使用した推論フェーズがあまりにも多く実行されていることを示しています。
*オーディオサンプルでは、キャッチフレーズの長さが地域によって25%〜47%の間で変化することが示されています。
*グローバルペナルティ検出モデルのパフォーマンスは、トレーニングセットと検証セットを比較すると、分散は低くなりますが、バイアスが高くなります。機能の変更を実装する前に、すべてのトレーニングと検証のケースを使用してバイアスと分散を確認する必要があります。