JSON
ビッグデータ技術 - JSON
ビッグデータ技術とは、従来のデータベース管理システムでは扱いきれない大量・多種・高速のデータを効率的に処理するための技術群です。Hadoop、Spark、Kafka、Flinkなどの分散処理フレームワークを中心に、データの収集、保存、処理、分析、可視化を行う包括的なエコシステムを構成しています。これらの技術は、リアルタイム分析、機械学習、IoTデータ処理、ビジネスインテリジェンスなど、現代のデータ駆動型社会の基盤となっています。
ビッグデータ
分散処理
Hadoop
Spark
Kafka
Flink
データエンジニアリング
ストリーム処理
バッチ処理
[
{
"code": "1",
"slug": "apache-hadoop",
"name": "Apache Hadoop",
"description": "分散ストレージとバッチ処理のためのオープンソースフレームワークです。",
"category": "分散ストレージ・バッチ処理",
"processingType": "バッチ処理",
"latency": "分〜時間単位",
"initialRelease": "2006",
"license": "Apache License 2.0"
},
{
"code": "2",
"slug": "apache-spark",
"name": "Apache Spark",
"description": "インメモリ計算による高速データ処理エンジンです。",
"category": "汎用分散処理エンジン",
"processingType": "バッチ・ストリーム処理(マイクロバッチ)",
"latency": "秒単位",
"initialRelease": "2014",
"license": "Apache License 2.0"
},
{
"code": "3",
"slug": "apache-kafka",
"name": "Apache Kafka",
"description": "高スループットの分散ストリーミングプラットフォームです。",
"category": "メッセージング・ストリーミングプラットフォーム",
"processingType": "ストリーム処理(メッセージング)",
"latency": "ミリ秒単位",
"initialRelease": "2011",
"license": "Apache License 2.0"
},
{
"code": "4",
"slug": "apache-flink",
"name": "Apache Flink",
"description": "真のストリーム処理を実現する分散処理エンジンです。",
"category": "ストリーム処理エンジン",
"processingType": "真のストリーム処理",
"latency": "ミリ秒単位",
"initialRelease": "2015",
"license": "Apache License 2.0"
},
{
"code": "5",
"slug": "apache-hive",
"name": "Apache Hive",
"description": "Hadoop上でSQLライクなクエリを実行するデータウェアハウスソフトウェアです。",
"category": "データウェアハウス",
"processingType": "バッチ処理",
"latency": "分〜時間単位",
"initialRelease": "2010",
"license": "Apache License 2.0"
},
{
"code": "6",
"slug": "apache-storm",
"name": "Apache Storm",
"description": "分散リアルタイム計算システムです。",
"category": "ストリーム処理エンジン",
"processingType": "ストリーム処理",
"latency": "ミリ秒単位",
"initialRelease": "2011",
"license": "Apache License 2.0"
},
{
"code": "7",
"slug": "apache-hbase",
"name": "Apache HBase",
"description": "Hadoop上で動作する分散型NoSQLデータベースです。",
"category": "NoSQLデータベース",
"processingType": "リアルタイム読み書き",
"latency": "ミリ秒単位",
"initialRelease": "2010",
"license": "Apache License 2.0"
},
{
"code": "8",
"slug": "apache-presto-trino",
"name": "Apache Trino(旧PrestoSQL)",
"description": "大規模データの分散SQLクエリエンジンです。",
"category": "分散SQLクエリエンジン",
"processingType": "インタラクティブクエリ",
"latency": "秒〜分単位",
"initialRelease": "2012",
"license": "Apache License 2.0"
}
]