<テーマ:Apache Sparkの特徴>
正解はこちら
解答:イ
[基礎知識・用語のまとめ]
Apache Spark・・・ビッグデータなどの大規模データを対象としたオープンソースの分散処理フレームワークです。MapReduceの処理速度改善や、処理方式の柔軟化を目的に開発されました。RDD(Resilient Distributed Dataset)と呼ばれる読み取り専用の多重データ集合をメモリ上に展開し、処理結果をメモリ上でやり取りすることで、MapReduceと比べて処理速度を大幅に向上しています。
[解法]
Apache Sparkは、RDDと呼ばれるデータ集合を処理します。
したがって、正解は選択肢「イ」となります。
その他の選択肢については、以下の通りです。
ア→Apache Sparkは、MapReduceの問題点を改善するために開発された分散処理のフレームワークであり、バッチ処理だけでなくインタラクティブな処理やストリーミングにも対応しています。よってこの記述は不適切です。
ウ→Apache Kafkaに関する記述のため、この記述は不適切です。
エ→Apache Sparkは、キーバリューストアではなく、RDDと呼ばれるデータ集合によってデータを扱うため、この記述は不適切です。
[参考]
RDDには「ランダム・デジット・ダイヤリング(Random Digit Dialing)」という全く別の意味のIT用語がある、、、らしい。
利用させていただきました素材へのリンク
うさちゃこちゃんねる様 https://www.youtube.com/channel/UCQcDdg4W6r5OfcB1JTcpABw
ここまで読んでくれてありがとう!!
感謝!
コメント