あなたは、さまざまなストレージ サービスの各データ所有者によってデータが整理および管理されている医療組織の一員です。この分散型エコシステムの結果、データの検出と管理が困難になっています。次の点で組織を支援する、コストが最適化されたソリューションを迅速に特定して実装する必要があります。
* データの管理と検出
* データリネージの追跡
* データ品質の検証
ソリューションをどのように構築すればよいでしょうか?
正解:D
Dataplex is a Google Cloud service that provides a unified data fabric for data lakes and data warehouses. It enables data governance, management, and discovery across multiple data domains, zones, and assets.
Dataplex also supports data lineage tracking, which shows the origin and transformation of data over time.
Dataplex also integrates with Dataprep, a data preparation and quality tool that allows users to clean, enrich, and transform data using a visual interface. Dataprep can also monitor data quality and detect anomalies using machine learning. Therefore, Dataplex is the most suitable solution for the given scenario, as it meets all the requirements of data management and discovery, data lineage tracking, and data quality validation. References:
* Dataplex overview
* Automate data governance, extend your data fabric with Dataplex-BigLake integration
* Dataprep documentation