CSV ファイルを含む Azure Data Lake Storage Gen2 コンテナーを実装する予定です。ファイルのサイズは、1 時間あたりに発生するイベントの数によって異なります。 ファイル サイズの範囲は 4.KB から 5 GB です。 コンテナに保存されているファイルがバッチ処理用に最適化されていることを確認する必要があります。 あなたは何をするべきか?
正解:D
Avro supports batch and is very relevant for streaming. Note: Avro is framework developed within Apache's Hadoop project. It is a row-based storage format which is widely used as a serialization process. AVRO stores its schema in JSON format making it easy to read and interpret by any program. The data itself is stored in binary format by doing it compact and efficient. Reference: https://www.adaltas.com/en/2020/07/23/benchmark-study-of-different-file-format/