YAML
データレイクプラットフォーム - YAML
データレイクプラットフォームは、構造化・非構造化データを大規模に保存・管理するためのクラウドストレージサービスです。AWSのAmazon S3、Microsoft AzureのAzure Data Lake Storage Gen2、Google CloudのCloud Storageなどが代表的です。各プラットフォームは、分析・機械学習・ビッグデータ処理との統合性、コスト最適化機能、セキュリティ・ガバナンス機能などで競争力を高めています。2025年現在、AWS S3が市場の82-88%を占める圧倒的な地位にありますが、AzureはMicrosoftエコシステムとの統合性、GCPは分析・AI/ML機能でそれぞれ優位性を持っています。
データレイク
クラウドストレージ
AWS
Azure
GCP
ビッグデータ
データ分析
クラウドコンピューティング
- code: "1"
slug: "amazon-s3"
name: "Amazon S3"
description: "AWSが提供するオブジェクトストレージサービス。データレイクとして最も広く採用されています。"
provider: "Amazon Web Services"
keyFeatures:
- "11ナインの耐久性"
- "複数ストレージクラス"
- "AWSサービスとの統合"
- "グローバル展開"
relatedServices:
- "AWS Lake Formation"
- "Amazon Athena"
- "AWS Glue"
- "Amazon EMR"
- "Redshift Spectrum"
- code: "2"
slug: "azure-data-lake-storage-gen2"
name: "Azure Data Lake Storage Gen2"
description: "Microsoft Azureが提供するビッグデータ分析に最適化されたエンタープライズ向けデータレイク。"
provider: "Microsoft Azure"
keyFeatures:
- "階層型名前空間"
- "POSIX互換"
- "Microsoft Entra ID統合"
- "エンタープライズセキュリティ"
relatedServices:
- "Azure Synapse Analytics"
- "Power BI"
- "Azure Data Factory"
- "Microsoft Fabric"
- code: "3"
slug: "google-cloud-storage"
name: "Google Cloud Storage"
description: "Google Cloudが提供する統一オブジェクトストレージ。分析・MLワークロードとの統合が強み。"
provider: "Google Cloud Platform"
keyFeatures:
- "BigQuery/Vertex AI統合"
- "柔軟なストレージクラス"
- "Dataplex統合"
- "強力な一貫性保証"
relatedServices:
- "BigQuery"
- "Cloud Dataproc"
- "Vertex AI"
- "Dataplex"
- "Cloud Dataflow"
- code: "4"
slug: "databricks-delta-lake"
name: "Databricks Delta Lake"
description: "Databricksが提供するオープンソースのレイクハウス基盤。マルチクラウド対応。"
provider: "Databricks"
keyFeatures:
- "オープンソース"
- "ACIDトランザクション"
- "マルチクラウド対応"
- "レイクハウスアーキテクチャ"
relatedServices:
- "Databricks Runtime"
- "Unity Catalog"
- "MLflow"
- code: "5"
slug: "snowflake"
name: "Snowflake"
description: "クラウドネイティブのデータウェアハウス/レイクハウスプラットフォーム。"
provider: "Snowflake Inc."
keyFeatures:
- "完全マネージド"
- "マルチクラウド"
- "自動スケーリング"
- "データ共有機能"
relatedServices:
- "Snowpark"
- "Streamlit"
- "Snowpipe"