Azure Synapse Analytics 専用の SQL プールで FactPurchase という名前のファクト テーブルを設計しています。テーブルには、小売店のサプライヤーからの購入が含まれています。 FactPurchase には次の列が含まれます。

FactPurchase には、毎日 100 万行のデータが追加され、3 年間のデータが含まれます。
次のクエリに似た Transact-SQL クエリが毎日実行されます。
選択する
SupplierKey、StockItemKey、COUNT(*)
FactPurchaseから
WHERE DateKey >= 20210101
AND DateKey <= 20210131
GROUP by SupplierKey、StockItemKey
クエリ時間を最小化するのはどのテーブル分散ですか?
正解:D
Hash-distributed tables improve query performance on large fact tables, and are the focus of this article.
Round-robin tables are useful for improving loading speed.
Reference:
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables- distribute