0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?

Apache Hadoop

Last updated at Posted at 2025-07-21

Hadoopとは

Hadoopとは、大規模データの蓄積・分析を分散処理技術によって実現するオープンソースのミドルウェアです。

Hadoop の構成要素

コンポーネント 主な役割 バッチ or リアルタイム
HDFS 分散ファイルシステム 両方に対応。(主にバッチ)中間データ処理に最適。
MapReduce バッチ処理フレームワーク バッチ処理のみ
Hive SQLライクなバッチ分析 バッチ
Pig スクリプトベースのデータフロー言語。チェックポイントや分岐を持つETLを簡潔に記述 バッチ
HBase カラム型のNoSQLデータベース リアルタイム

注意点

  • Hadoop MapReduce の Python サポートは限定的(Hadoop Streaming を使う形)

YARN(Yet Another Resource Negotiator)

Hadoopクラスタのリソース管理、ジョブスケジューリングを担当します。

0
0
0

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
0
0

Delete article

Deleted articles cannot be recovered.

Draft of this article would be also deleted.

Are you sure you want to delete this article?