YAML

ビッグデータ技術 - YAML

ビッグデータ技術とは、従来のデータベース管理システムでは扱いきれない大量・多種・高速のデータを効率的に処理するための技術群です。Hadoop、Spark、Kafka、Flinkなどの分散処理フレームワークを中心に、データの収集、保存、処理、分析、可視化を行う包括的なエコシステムを構成しています。これらの技術は、リアルタイム分析、機械学習、IoTデータ処理、ビジネスインテリジェンスなど、現代のデータ駆動型社会の基盤となっています。

ビッグデータ 分散処理 Hadoop Spark Kafka Flink データエンジニアリング ストリーム処理 バッチ処理
- code: "1"
  slug: "apache-hadoop"
  name: "Apache Hadoop"
  description: "分散ストレージとバッチ処理のためのオープンソースフレームワークです。"
  category: "分散ストレージ・バッチ処理"
  processingType: "バッチ処理"
  latency: "分〜時間単位"
  initialRelease: "2006"
  license: "Apache License 2.0"
- code: "2"
  slug: "apache-spark"
  name: "Apache Spark"
  description: "インメモリ計算による高速データ処理エンジンです。"
  category: "汎用分散処理エンジン"
  processingType: "バッチ・ストリーム処理(マイクロバッチ)"
  latency: "秒単位"
  initialRelease: "2014"
  license: "Apache License 2.0"
- code: "3"
  slug: "apache-kafka"
  name: "Apache Kafka"
  description: "高スループットの分散ストリーミングプラットフォームです。"
  category: "メッセージング・ストリーミングプラットフォーム"
  processingType: "ストリーム処理(メッセージング)"
  latency: "ミリ秒単位"
  initialRelease: "2011"
  license: "Apache License 2.0"
- code: "4"
  slug: "apache-flink"
  name: "Apache Flink"
  description: "真のストリーム処理を実現する分散処理エンジンです。"
  category: "ストリーム処理エンジン"
  processingType: "真のストリーム処理"
  latency: "ミリ秒単位"
  initialRelease: "2015"
  license: "Apache License 2.0"
- code: "5"
  slug: "apache-hive"
  name: "Apache Hive"
  description: "Hadoop上でSQLライクなクエリを実行するデータウェアハウスソフトウェアです。"
  category: "データウェアハウス"
  processingType: "バッチ処理"
  latency: "分〜時間単位"
  initialRelease: "2010"
  license: "Apache License 2.0"
- code: "6"
  slug: "apache-storm"
  name: "Apache Storm"
  description: "分散リアルタイム計算システムです。"
  category: "ストリーム処理エンジン"
  processingType: "ストリーム処理"
  latency: "ミリ秒単位"
  initialRelease: "2011"
  license: "Apache License 2.0"
- code: "7"
  slug: "apache-hbase"
  name: "Apache HBase"
  description: "Hadoop上で動作する分散型NoSQLデータベースです。"
  category: "NoSQLデータベース"
  processingType: "リアルタイム読み書き"
  latency: "ミリ秒単位"
  initialRelease: "2010"
  license: "Apache License 2.0"
- code: "8"
  slug: "apache-presto-trino"
  name: "Apache Trino(旧PrestoSQL)"
  description: "大規模データの分散SQLクエリエンジンです。"
  category: "分散SQLクエリエンジン"
  processingType: "インタラクティブクエリ"
  latency: "秒〜分単位"
  initialRelease: "2012"
  license: "Apache License 2.0"