TSV

データレイクプラットフォーム - TSV

データレイクプラットフォームは、構造化・非構造化データを大規模に保存・管理するためのクラウドストレージサービスです。AWSのAmazon S3、Microsoft AzureのAzure Data Lake Storage Gen2、Google CloudのCloud Storageなどが代表的です。各プラットフォームは、分析・機械学習・ビッグデータ処理との統合性、コスト最適化機能、セキュリティ・ガバナンス機能などで競争力を高めています。2025年現在、AWS S3が市場の82-88%を占める圧倒的な地位にありますが、AzureはMicrosoftエコシステムとの統合性、GCPは分析・AI/ML機能でそれぞれ優位性を持っています。

データレイク クラウドストレージ AWS Azure GCP ビッグデータ データ分析 クラウドコンピューティング
code	slug	name	description	keyFeatures	provider	relatedServices
1	amazon-s3	Amazon S3	AWSが提供するオブジェクトストレージサービス。データレイクとして最も広く採用されています。	["11ナインの耐久性","複数ストレージクラス","AWSサービスとの統合","グローバル展開"]	Amazon Web Services	["AWS Lake Formation","Amazon Athena","AWS Glue","Amazon EMR","Redshift Spectrum"]
2	azure-data-lake-storage-gen2	Azure Data Lake Storage Gen2	Microsoft Azureが提供するビッグデータ分析に最適化されたエンタープライズ向けデータレイク。	["階層型名前空間","POSIX互換","Microsoft Entra ID統合","エンタープライズセキュリティ"]	Microsoft Azure	["Azure Synapse Analytics","Power BI","Azure Data Factory","Microsoft Fabric"]
3	google-cloud-storage	Google Cloud Storage	Google Cloudが提供する統一オブジェクトストレージ。分析・MLワークロードとの統合が強み。	["BigQuery/Vertex AI統合","柔軟なストレージクラス","Dataplex統合","強力な一貫性保証"]	Google Cloud Platform	["BigQuery","Cloud Dataproc","Vertex AI","Dataplex","Cloud Dataflow"]
4	databricks-delta-lake	Databricks Delta Lake	Databricksが提供するオープンソースのレイクハウス基盤。マルチクラウド対応。	["オープンソース","ACIDトランザクション","マルチクラウド対応","レイクハウスアーキテクチャ"]	Databricks	["Databricks Runtime","Unity Catalog","MLflow"]
5	snowflake	Snowflake	クラウドネイティブのデータウェアハウス/レイクハウスプラットフォーム。	["完全マネージド","マルチクラウド","自動スケーリング","データ共有機能"]	Snowflake Inc.	["Snowpark","Streamlit","Snowpipe"]