あなたは、さまざまなストレージ サービスでそれぞれのデータ所有者によってデータが整理および管理されている医療組織の一員です。この分散型エコシステムの結果、データの検出と管理が困難になっています。組織を支援するために、コストを最適化したソリューションを迅速に特定して実装する必要があります。
* データ管理と発見
* データ系統の追跡
* データ品質の検証
ソリューションをどのように構築すればよいでしょうか?
正解:D
Dataplex is a Google Cloud service that provides a unified data fabric for data lakes and data warehouses. It enables data governance, management, and discovery across multiple data domains, zones, and assets.
Dataplex also supports data lineage tracking, which shows the origin and transformation of data over time.
Dataplex also integrates with Dataprep, a data preparation and quality tool that allows users to clean, enrich, and transform data using a visual interface. Dataprep can also monitor data quality and detect anomalies using machine learning. Therefore, Dataplex is the most suitable solution for the given scenario, as it meets all the requirements of data management and discovery, data lineage tracking, and data quality validation. References:
* Dataplex overview
* Automate data governance, extend your data fabric with Dataplex-BigLake integration
* Dataprep documentation