Snowflake Architecture: Multi-Cluster Shared Data & Virtual Warehouses

Architecture Diagram 1: Complete Snowflake Architecture

Architecture Diagram 2: Micro-Partition & Pruning Strategy

Architecture Diagram 3: Virtual Warehouse Scaling & Multi-Cluster

Architecture Diagram 4: Query Execution Lifecycle

Architecture Diagram 5: Three-Layer Architecture Stack

Architecture Diagram 6: Query Execution Lifecycle

Architecture Diagram 7: Cost Model & Credit Consumption

Why Snowflake? The Industry Context

Snowflake was founded in 2012 by three data warehouse veterans who saw a fundamental flaw in existing architectures: compute and storage were tightly coupled, forcing organizations to over-provision one to scale the other. Traditional warehouses like Teradata, Netezza, and Oracle Exadata required buying bigger appliances to handle more queries — even if storage was fine.

The Problem Snowflake Solves

Legacy Pain Point	Traditional Approach	Snowflake's Solution
Scale compute independently	Buy bigger appliance (vertical only)	Separate compute layer, horizontal scaling
Multi-tenant isolation	Separate database instances per team	Virtual warehouses with shared storage
Zero-maintenance	DBA teams manage patches, backups	Fully managed across all layers
Pay for what you use	Fixed license costs regardless of usage	Per-second compute billing (60s minimum)
Cross-cloud portability	Rewrite for each cloud provider	Run on AWS, Azure, or GCS with same SQL
Data sharing	ETL to external tables or FTP	Secure data sharing without copying data

Who Uses Snowflake in Production?

Capital One: Migrated from Teradata to Snowflake for fraud detection analytics — reduced query times from minutes to seconds
Adobe: Processes 50+ billion customer experience events daily in Snowflake
Sony: Consolidated 30+ data warehouses into a single Snowflake deployment
Roche: Harmonized clinical trial data across 100+ countries with Snowflake's data sharing
Instacart: Powers real-time delivery optimization with Snowflake as the analytical backbone

Snowflake vs. The Competition

Feature	Snowflake	BigQuery	Redshift	Databricks SQL
Architecture	Separated compute/storage	Separated (serverless)	Loosely coupled	Lakehouse (Spark)
Auto-scaling	Multi-cluster (horizontal)	Serverless (auto)	Manual resize	Serverless SQL
Time Travel	90 days (Enterprise)	7 days	24 hours (limited)	Via Delta Lake
Data Sharing	Native, zero-copy	Limited (authorized views)	Cross-account	Delta Sharing
Semi-structured data	VARIANT column	Nested/repeated	Super	Structured streaming
Pricing model	Credit-based (per second)	Per TB scanned	Node-based	DBU-based

Key Insight: Snowflake's differentiator isn't just the technology — it's the ecosystem. Data sharing, data exchange (Snowflake Marketplace), and zero-copy cloning create network effects that make Snowflake more valuable as more organizations adopt it.

Real-World Case Study: Retail Analytics Platform

A major retailer processes 2TB of daily transaction data across 500 stores. Before Snowflake:

ETL took 6 hours — analysts waited until noon for morning data
Concurrent query limits — only 5 analysts could run reports simultaneously
Data freshness — decisions were based on yesterday's data

After migrating to Snowflake:

-- Before: Queries scanned full tables (10TB+), took 15+ minutes
SELECT store_id, SUM(revenue) 
FROM transactions 
WHERE date = CURRENT_DATE 
GROUP BY store_id;
-- Runtime: 14 minutes, scanned 10TB

-- After: Micro-partition pruning eliminates 95% of data
-- Partition pruning: only scans today's partitions (~200GB)
-- Runtime: 18 seconds

Architecture decisions made:

Decision	Rationale	Cost Impact
X-Small warehouse for ad-hoc queries	Low concurrency, low data volume	~16/hour for Medium
Auto-suspend at 60 seconds	Queries complete in <10 seconds	70% compute cost reduction
Multi-cluster (1-3) for dashboards	Peak hours: 20 concurrent users	Handles peaks without over-provisioning
Clustering key on `date, store_id`	Most queries filter by date and store	40% faster queries, fewer bytes scanned
Data sharing with suppliers	Zero-copy access to sales data	Eliminated 3 separate ETL pipelines

Results:

Query performance: 14 minutes → 18 seconds (47x improvement)
Data freshness: End-of-day → Near real-time (5-minute delay)
Analyst productivity: 5 concurrent → 50+ concurrent users
Annual cost: 95K (Snowflake) — 47% reduction

Detailed Explanation

What is Snowflake's Architecture?

Snowflake implements a multi-cluster shared data architecture that completely separates compute from persistent cloud storage. This enables independent scaling of each layer without the trade-offs of traditional data warehouses.

The Three-Layer Architecture

Cloud Services Layer

Handles metadata operations, query parsing, optimization, and security
Fully managed by Snowflake across all availability zones
Maintains centralized metadata store (objects, access control, transactions)

Query Processing Layer

Contains virtual warehouses for SQL/DML execution
Each warehouse is independent (CPU, RAM, local SSD cache)
Scalable up (node size) or out (cluster count) independently

Storage Layer

Micro-partitioning: 50–500MB compressed columnar chunks
Automatic management — no user-defined partitions required
Rich metadata: min/max values, distinct counts, null counts per column

Micro-Partitioning and Automatic Clustering

Feature	Description
Compression	Run-length, dictionary, delta, ZSTD → 4–6× ratio
Automatic Organization	Data organized transparently on ingestion
Clustering Keys	User-defined keys optimize data locality
Background Process	Runs asynchronously, adapts to data/query patterns

Virtual Warehouse Architecture

Elastic compute — dynamically scales based on workload demands
Each node: CPU cores + RAM + local SSD cache for hot data
Multi-cluster warehouses auto-start/suspend clusters based on queue depth
True multi-tenancy: different workloads use isolated warehouses

Data Flow and Query Execution

Cloud services layer parses SQL and generates optimized query plan
Optimizer uses micro-partition metadata for partition pruning (80–95% data eliminated)
Virtual warehouse fetches required micro-partitions from cloud storage
Processes in parallel across all available nodes
Results cached at node, warehouse, and global levels

Key Takeaway: Snowflake's separation of compute and storage enables true multi-tenancy, elastic scaling, and cost-efficient query execution through micro-partition pruning.

Key Concepts Table

Component	Description	Scaling Behavior	Cost Model
Cloud Services	Metadata, security, query optimization	Automatic, serverless	Included in compute cost
Virtual Warehouse	Query execution, DML processing	Manual or auto-scale	Per-second billing (60s minimum)
Micro-Partition	50-500MB compressed columnar chunks	Automatic creation	Storage cost only
Result Cache	Query result caching	Automatic invalidation	No additional cost
Storage	Persistent cloud blob storage	Automatic expansion	Per TB per month

Warehouse Size	vCPU	Memory	Max Concurrent Queries
X-Small	1	2 GB	1
Small	2	4 GB	2
Medium	4	8 GB	4
Large	8	16 GB	8
X-Large	16	32 GB	16
2X-Large	32	64 GB	32
3X-Large	64	128 GB	64
4X-Large	128	256 GB	128

Metric	Value	Description
Compression Ratio	4-6x	Average compression across all data types
Micro-Partition Size	50-500 MB	Target size after compression
Partition Pruning	80-95%	Average data skipped during queries
Result Cache Hit Rate	30-70%	Depends on query repetition patterns
Fail-Safe Retention	7 days	Additional protection beyond Time Travel

Code Examples

-- Example 1: Create a multi-cluster warehouse with specific configuration
CREATE WAREHOUSE analytics_wh
    WAREHOUSE_SIZE = 'xlarge'
    MIN_CLUSTER_COUNT = 1
    MAX_CLUSTER_COUNT = 5
    SCALING_POLICY = 'ECONOMY'
    AUTO_SUSPEND = 300
    AUTO_RESUME = TRUE
    INITIALLY_SUSPENDED = FALSE
    RESOURCE_MONITOR = 'analytics_monitor'
    COMMENT = 'Multi-cluster warehouse for analytics workloads';

-- Example 2: Configure warehouse with advanced settings
CREATE WAREHOUSE etl_wh
    WAREHOUSE_SIZE = '2xlarge'
    MIN_CLUSTER_COUNT = 2
    MAX_CLUSTER_COUNT = 4
    SCALING_POLICY = 'STANDARD'
    AUTO_SUSPEND = 60
    AUTO_RESUME = TRUE
    STATEMENT_QUEUED_TIMEOUT_IN_SECONDS = 3600
    STATEMENT_TIMEOUT_IN_SECONDS = 86400
    COMMENT = 'ETL warehouse with aggressive scaling';

-- Example 3: Query micro-partition metadata
SELECT 
    partition_id,
    row_count,
    uncompressed_bytes,
    compressed_bytes,
    (uncompressed_bytes / compressed_bytes) as compression_ratio,
    created_time,
    last_modified_time
FROM TABLE(INFORMATION_SCHEMA.PARTITION_HISTORY(
    TABLE_NAME => 'sales_data',
    START_TIME => DATEADD(day, -7, CURRENT_TIMESTAMP())
))
ORDER BY created_time DESC;

-- Example 4: Analyze warehouse performance metrics
SELECT 
    warehouse_name,
    warehouse_size,
    cluster_number,
    AVG(queries_completed) as avg_queries,
    AVG(queued_overload_queries) as avg_queued,
    AVG(execution_time_ms) / 1000 as avg_exec_seconds,
    SUM(credits_used) as total_credits,
    AVG(bytes_scanned) / 1024 / 1024 / 1024 as avg_gb_scanned
FROM SNOWFLAKE.ACCOUNT_USAGE.WAREHOUSE_METERING_HISTORY
WHERE start_time >= DATEADD(day, -30, CURRENT_TIMESTAMP())
GROUP BY 1, 2, 3
ORDER BY total_credits DESC;

-- Example 5: Monitor auto-scaling events
SELECT 
    warehouse_name,
    event_name,
    event_timestamp,
    event_reason,
    cluster_number
FROM TABLE(INFORMATION_SCHEMA.WAREHOUSE_LOAD_HISTORY(
    START_TIME => DATEADD(hour, -24, CURRENT_TIMESTAMP())
))
WHERE event_name IN ('RESUME', 'SUSPEND', 'ADD_CLUSTER', 'REMOVE_CLUSTER')
ORDER BY event_timestamp DESC;

-- Example 6: Analyze partition pruning effectiveness
SELECT 
    query_id,
    query_text,
    partitions_scanned,
    partitions_total,
    (partitions_scanned / partitions_total) * 100 as scan_percentage,
    bytes_scanned / 1024 / 1024 as mb_scanned,
    compilation_time_ms,
    execution_time_ms
FROM SNOWFLAKE.ACCOUNT_USAGE.QUERY_HISTORY
WHERE start_time >= DATEADD(day, -1, CURRENT_TIMESTAMP())
  AND partitions_total > 0
ORDER BY scan_percentage DESC
LIMIT 100;

Performance Metrics

Metric	Target	Warning	Critical	Description
Query Queue Depth	< 5	5-10	> 10	Number of queries waiting to execute
Cluster Scaling Time	< 30s	30-60s	> 60s	Time to start additional cluster
Warehouse Utilization	60-80%	80-95%	> 95%	CPU/Memory utilization
Partition Pruning	> 80%	60-80%	< 60%	Percentage of partitions eliminated
Cache Hit Rate	> 50%	30-50%	< 30%	Result cache effectiveness
Auto-Suspend Delay	60-300s	300-600s	> 600s	Time before warehouse suspends

Best Practices

Right-size warehouses: Start with Medium for ad-hoc queries, scale up for batch ETL. Monitor queue depth to identify under-provisioned warehouses.
Use multi-cluster warehouses: Set MIN_CLUSTER_COUNT=1 and MAX_CLUSTER_COUNT=3-5 for concurrent workloads. Use SCALING_POLICY=ECONOMY for cost optimization.
Implement warehouse isolation: Create separate warehouses for different workloads (ETL, reporting, ad-hoc) to prevent resource contention and enable independent scaling.
Configure appropriate timeouts: Set STATEMENT_QUEUED_TIMEOUT for queries that shouldn't run indefinitely and STATEMENT_TIMEOUT to kill long-running queries.
Leverage result cache: Ensure identical queries can hit the cache by avoiding non-deterministic functions. Use QUERY_TAG to group similar queries.
Monitor partition pruning: Use QUERY_HISTORY to identify queries with poor pruning (< 60% data elimination). Consider adding clustering keys for frequently filtered columns.
Implement resource monitors: Set up alerts for credit consumption to prevent unexpected costs. Use MAX_CREDIT_QUOTA per warehouse for budget control.
Use automatic clustering: Define clustering keys on large tables (100GB+) that are frequently filtered. Start with low cardinality columns used in WHERE/JOIN clauses.
Optimize data placement: Distribute data across micro-partitions based on query patterns. Regularly review CLUSTERING_INFORMATION() for clustering depth and overlap metrics.
Cache management: Understand result cache invalidation rules (data modifications, DDL changes). Use PERSISTENT_RESULT_CACHE_VARCHAR for long-lived result sets.

Snowflake Architecture: Multi-Cluster Shared Data & Virtual Warehouses

Snowflake Architecture: Multi-Cluster Shared Data & Virtual Warehouses

Architecture Diagram 1: Complete Snowflake Architecture

Architecture Diagram 2: Micro-Partition & Pruning Strategy

Architecture Diagram 3: Virtual Warehouse Scaling & Multi-Cluster

Architecture Diagram 4: Query Execution Lifecycle

Architecture Diagram 5: Three-Layer Architecture Stack

Architecture Diagram 6: Query Execution Lifecycle

Architecture Diagram 7: Cost Model & Credit Consumption

Why Snowflake? The Industry Context

The Problem Snowflake Solves

Who Uses Snowflake in Production?

Snowflake vs. The Competition

Real-World Case Study: Retail Analytics Platform

Detailed Explanation

What is Snowflake's Architecture?

The Three-Layer Architecture

Micro-Partitioning and Automatic Clustering

Virtual Warehouse Architecture

Data Flow and Query Execution

Key Concepts Table

Code Examples

Performance Metrics

Best Practices

See Also

Need Expert Snowflake Help?