説明

ボックス1:はい
Azure Stream Analytics SQLの新しい拡張機能を使用して、データを再シャッフルするときにストリームのパーティション数を指定できるようになりました。
結果は、同じパーティションスキームを持つストリームです。例については、以下を参照してください。
step1 AS(SELECT * FROM [input1] PARTITION BY DeviceID INTO 10)を使用して、
step2 AS(SELECT * FROM [input2] PARTITION BY DeviceID INTO 10)
SELECT * INTO [output] FROM step1 PARTITION BY DeviceID UNION step2 PARTITION BY DeviceID注:Azure Stream Analytics SQLの新しい拡張機能には、PARTITIONBYステートメントを使用して再シャッフルを実行するときにストリームのパーティション数を指定できるキーワードINTOが含まれています。 。
ボックス2:はい
明示的に再パーティション化されたデータの2つのストリームを結合する場合、これらのストリームは同じパーティションキーとパーティション数を持っている必要があります。
ボックス3:はい
ストリーミングユニット(SU)は、StreamAnalyticsジョブを実行するために割り当てられるコンピューティングリソースを表します。SUの数が多いほど、ジョブに割り当てられるCPUおよびメモリリソースが多くなります。
一般に、ベストプラクティスは、PARTITIONBYを使用しないクエリの6つのSUから開始することです。
ここには10個のパーティションがあるため、6x10 = 60SUが適切です。
注:Azure Stream Analyticsのスケールの単位であるストリーミングユニット(SU)カウントは、ジョブで使用可能な物理リソースの数がパーティション化されたフローに適合するように調整する必要があることに注意してください。一般に、6つのSUは、各パーティションに割り当てるのに適した数です。ジョブに割り当てられたリソースが不十分な場合、システムは、ジョブにメリットがある場合にのみ再パーティションを適用します。
リファレンス:
https://azure.microsoft.com/en-in/blog/maximize-throughput-with-repartitioning-in-azure-stream-analytics/
https://docs.microsoft.com/en-us/azure/stream-analytics/stream-analytics-streaming-unit-consumption