令和3年度データベーススペシャリスト 午前Ⅱ問18

<テーマ:Apache Sparkの特徴>  

正解はこちら

解答:イ

問題一覧へ

[基礎知識・用語のまとめ]

Apache Spark・・・ビッグデータなどの大規模データを対象としたオープンソースの分散処理フレームワークです。MapReduceの処理速度改善や、処理方式の柔軟化を目的に開発されました。RDD(Resilient Distributed Dataset)と呼ばれる読み取り専用の多重データ集合をメモリ上に展開し、処理結果をメモリ上でやり取りすることで、MapReduceと比べて処理速度を大幅に向上しています。

[解法]

Apache Sparkは、RDDと呼ばれるデータ集合を処理します。

したがって、正解は選択肢「イ」となります。

その他の選択肢については、以下の通りです。

ア→Apache Sparkは、MapReduceの問題点を改善するために開発された分散処理のフレームワークであり、バッチ処理だけでなくインタラクティブな処理やストリーミングにも対応しています。よってこの記述は不適切です。

ウ→Apache Kafkaに関する記述のため、この記述は不適切です。

エ→Apache Sparkは、キーバリューストアではなく、RDDと呼ばれるデータ集合によってデータを扱うため、この記述は不適切です。

[参考]

RDDには「ランダム・デジット・ダイヤリング(Random Digit Dialing)」という全く別の意味のIT用語がある、、、らしい。

利用させていただきました素材へのリンク

うさちゃこちゃんねる様 https://www.youtube.com/channel/UCQcDdg4W6r5OfcB1JTcpABw  

ここまで読んでくれてありがとう!!
感謝!
感謝!

問題一覧へ

コメント