令和３年度データベーススペシャリスト午前Ⅱ問１８

＜テーマ：Apache Sparkの特徴＞

正解はこちら

解答：イ

[基礎知識・用語のまとめ]
[解法]
[参考]
利用させていただきました素材へのリンク

[基礎知識・用語のまとめ]

Apache Spark・・・ビッグデータなどの大規模データを対象としたオープンソースの分散処理フレームワークです。MapReduceの処理速度改善や、処理方式の柔軟化を目的に開発されました。RDD(Resilient Distributed Dataset)と呼ばれる読み取り専用の多重データ集合をメモリ上に展開し、処理結果をメモリ上でやり取りすることで、MapReduceと比べて処理速度を大幅に向上しています。

[解法]

Apache Sparkは、RDDと呼ばれるデータ集合を処理します。

したがって、正解は選択肢「イ」となります。

その他の選択肢については、以下の通りです。

ア→Apache Sparkは、MapReduceの問題点を改善するために開発された分散処理のフレームワークであり、バッチ処理だけでなくインタラクティブな処理やストリーミングにも対応しています。よってこの記述は不適切です。

ウ→Apache Kafkaに関する記述のため、この記述は不適切です。

エ→Apache Sparkは、キーバリューストアではなく、RDDと呼ばれるデータ集合によってデータを扱うため、この記述は不適切です。

[参考]

RDDには「ランダム・デジット・ダイヤリング（Random Digit Dialing）」という全く別の意味のIT用語がある、、、らしい。

利用させていただきました素材へのリンク

うさちゃこちゃんねる様　https://www.youtube.com/channel/UCQcDdg4W6r5OfcB1JTcpABw

ここまで読んでくれてありがとう！！

感謝！

問題一覧へ