Giới Thiệu
AWS cung cấp một hệ sinh thái Storage Services đa dạng, từ object storage, block storage, file storage, đến hybrid cloud storage và backup solutions. Việc chọn đúng dịch vụ storage phụ thuộc vào:
- Loại dữ liệu và access pattern
- Yêu cầu về performance và latency
- Quy mô và tính sẵn sàng (availability)
- Chi phí và lifecycle management
- Compliance và disaster recovery requirements
1. Nhóm Object Storage (Object Storage)
Object storage lưu trữ dữ liệu dưới dạng objects với metadata, phù hợp cho unstructured data, backup, archiving, và static web content.
1.1 Amazon S3 (Simple Storage Service)
- Dùng khi: cần object storage scalable, durable, với nhiều storage classes
- Tính năng:
- 99.999999999% (11 nines) durability
- Unlimited scalability
- Multiple storage classes: Standard, Intelligent-Tiering, Standard-IA, One Zone-IA, Glacier Instant Retrieval, Glacier Flexible Retrieval, Glacier Deep Archive
- Versioning, lifecycle policies, encryption
- Static website hosting
- Event notifications (SNS, SQS, Lambda)
- Use case:
- Backup và archive
- Static website hosting
- Data lakes và analytics
- Media storage và content delivery
- Application data storage
- Ưu điểm:
- Highly scalable và durable
- Cost-effective với lifecycle policies
- Rich integration với AWS services
- Strong security và compliance features
- Hạn chế:
- Eventual consistency cho overwrite PUT và DELETE
- Không phù hợp cho database workloads
- Latency cao hơn block storage
1.2 Amazon S3 Glacier
- Dùng khi: cần archive data lâu dài với chi phí thấp nhất
- Tính năng:
- Glacier Instant Retrieval: Access trong 1-5 phút, chi phí thấp hơn Standard-IA
- Glacier Flexible Retrieval (trước đây là S3 Glacier):
- Expedited: 1-5 phút
- Standard: 3-5 giờ
- Bulk: 5-12 giờ
- Glacier Deep Archive: Lowest cost, retrieval 12 giờ
- 99.999999999% durability
- Lifecycle policies tự động chuyển từ S3 Standard
- Use case:
- Long-term data archival
- Compliance và regulatory retention
- Backup và disaster recovery
- Media archives
- Ưu điểm:
- Chi phí cực thấp cho long-term storage
- Tích hợp với S3 lifecycle policies
- Strong durability
- Hạn chế:
- Retrieval time lâu (trừ Instant Retrieval)
- Retrieval fees có thể cao nếu access thường xuyên
- Không phù hợp cho data cần access ngay lập tức
2. Nhóm Block Storage (Block Storage)
Block storage cung cấp raw storage volumes gắn vào EC2 instances, phù hợp cho databases, file systems, và applications cần low-latency, high IOPS.
2.1 Amazon EBS (Elastic Block Store)
- Dùng khi: cần persistent block storage cho EC2 instances
- Tính năng:
- Volume Types:
- gp3: General purpose SSD, baseline 3,000 IOPS, có thể scale đến 16,000 IOPS
- gp2: General purpose SSD, IOPS phụ thuộc vào size (3 IOPS/GB)
- io2 Block Express: High-performance SSD, 256,000 IOPS, 4,000 MB/s throughput
- io2/io1: Provisioned IOPS SSD, up to 64,000 IOPS
- st1: Throughput Optimized HDD, phù hợp cho big data, data warehouses
- sc1: Cold HDD, chi phí thấp nhất, phù hợp cho infrequent access
- Snapshots: incremental backups, có thể tạo AMI
- Encryption: AES-256
- Multi-Attach: một volume có thể attach vào nhiều instances (chỉ io1/io2)
- Fast Snapshot Restore (FSR): instant restore từ snapshot
- Volume Types:
- Use case:
- Database storage (RDS, self-managed databases)
- Application data và file systems
- Boot volumes cho EC2
- High-performance workloads
- Ưu điểm:
- Low latency và high IOPS
- Persistent storage, không mất data khi stop instance
- Flexible volume types cho nhiều use cases
- Snapshot và backup dễ dàng
- Hạn chế:
- Chỉ attach được trong cùng Availability Zone
- Chi phí cao hơn S3 cho large datasets
- Không share được giữa instances (trừ Multi-Attach)
3. Nhóm File Storage (File Storage)
File storage cung cấp shared file systems có thể mount vào nhiều EC2 instances, phù hợp cho shared storage, content management, web serving.
3.1 Amazon EFS (Elastic File System)
- Dùng khi: cần shared file system cho Linux workloads
- Tính năng:
- Performance Modes:
- General Purpose: Low latency, phù hợp cho web servers, content management
- Max I/O: Higher throughput, phù hợp cho big data, analytics
- Throughput Modes:
- Bursting: Baseline throughput dựa trên size, có thể burst
- Provisioned: Set throughput độc lập với size
- Storage Classes:
- Standard: Frequently accessed data
- Infrequent Access (EFS-IA): Chi phí thấp hơn 85%, access ít hơn
- Lifecycle Management: Tự động chuyển sang EFS-IA
- Multi-AZ, tự động scale
- NFSv4 protocol
- Encryption at rest và in transit
- Performance Modes:
- Use case:
- Shared storage cho web servers
- Content management systems
- Application logs và shared data
- Container storage (ECS, EKS)
- Big data và analytics
- Ưu điểm:
- Fully managed, tự động scale
- Shared access từ nhiều instances
- Pay only for what you use
- Multi-AZ availability
- Hạn chế:
- Chỉ hỗ trợ Linux (NFS)
- Latency cao hơn EBS
- Chi phí cao hơn EBS cho single-instance use cases
3.2 Amazon FSx
- Dùng khi: cần file system với specific protocols hoặc performance requirements
- Tính năng:
- FSx for Windows File Server:
- SMB protocol, Active Directory integration
- SSD và HDD storage options
- Multi-AZ với automatic failover
- Native Windows file system features
- FSx for Lustre:
- High-performance file system cho HPC và ML workloads
- Sub-millisecond latency, hundreds of GB/s throughput
- Tích hợp với S3 (data repository)
- SSD storage
- FSx for NetApp ONTAP:
- Enterprise file system với NFS, SMB, iSCSI
- Advanced features: snapshots, clones, replication
- Multi-protocol support
- FSx for OpenZFS:
- OpenZFS file system với NFS protocol
- Snapshots, clones, data compression
- Tích hợp với AWS services
- FSx for Windows File Server:
- Use case:
- FSx for Windows: Windows applications, .NET apps, shared storage
- FSx for Lustre: HPC, machine learning training, big data analytics
- FSx for NetApp ONTAP: Enterprise applications cần advanced file system features
- FSx for OpenZFS: Linux workloads cần ZFS features
- Ưu điểm:
- Fully managed với specific protocol support
- High performance (đặc biệt Lustre)
- Enterprise features (ONTAP, OpenZFS)
- Tích hợp với existing infrastructure
- Hạn chế:
- Chi phí cao hơn EFS
- Specific use cases, không phù hợp cho general purpose
- Learning curve cho advanced features
4. Nhóm Hybrid Cloud Storage (Hybrid Cloud Storage)
Hybrid cloud storage kết nối on-premises infrastructure với AWS cloud, cho phép seamless data migration và hybrid workflows.
4.1 AWS Storage Gateway
- Dùng khi: cần kết nối on-premises với AWS storage, hybrid cloud workflows
- Tính năng:
- File Gateway:
- NFS và SMB protocol
- Store files trong S3
- Local cache cho frequently accessed data
- Tích hợp với S3 features (lifecycle, versioning)
- Volume Gateway:
- Stored Volumes: Local data, async backup to S3
- Cached Volumes: Primary data trong S3, local cache
- iSCSI protocol
- Point-in-time snapshots
- Tape Gateway:
- Virtual tape library (VTL)
- Backup software integration (Veeam, Commvault)
- Store virtual tapes trong S3/Glacier
- Deploy như hardware appliance hoặc VM
- Encryption in transit và at rest
- File Gateway:
- Use case:
- Hybrid cloud storage
- Backup và disaster recovery
- Data migration to cloud
- Archive on-premises data
- Cloud bursting
- Ưu điểm:
- Seamless integration với on-premises
- Multiple gateway types cho different use cases
- Cost-effective cloud storage
- Minimal changes to existing workflows
- Hạn chế:
- Cần on-premises infrastructure
- Network latency có thể ảnh hưởng performance
- Initial setup và configuration
5. Nhóm Backup và Disaster Recovery (Backup & Disaster Recovery)
Backup và disaster recovery services giúp protect data, ensure business continuity, và meet compliance requirements.
5.1 AWS Backup
- Dùng khi: cần centralized backup management cho multiple AWS services
- Tính năng:
- Centralized Backup:
- Backup cho EBS, EFS, RDS, DynamoDB, Storage Gateway, FSx
- Single console để manage tất cả backups
- Backup policies và schedules
- Backup Plans:
- Define backup frequency, retention, lifecycle
- Tag-based backup rules
- Cross-region và cross-account backup
- Backup Vault:
- Encrypted backup storage
- Access control với IAM
- Backup organization và tagging
- Point-in-Time Recovery (PITR):
- Continuous backup cho supported services
- Restore to any point in time
- Backup Monitoring:
- CloudWatch integration
- Backup success/failure notifications
- Compliance reporting
- Centralized Backup:
- Use case:
- Centralized backup strategy
- Compliance và regulatory requirements
- Disaster recovery planning
- Data protection best practices
- Ưu điểm:
- Centralized management
- Automated backup policies
- Cost-effective với lifecycle management
- Compliance-ready
- Hạn chế:
- Chỉ hỗ trợ specific AWS services
- Backup windows có thể ảnh hưởng performance
- Restore time phụ thuộc vào service type
5.2 AWS Elastic Disaster Recovery (DRS)
- Dùng khi: cần continuous replication và fast disaster recovery
- Tính năng:
- Continuous Replication:
- Real-time replication của servers (physical, virtual, cloud)
- Block-level replication
- Low RPO (Recovery Point Objective)
- Fast Recovery:
- Launch recovered servers trong vài phút
- Point-in-time recovery
- Automated failover testing
- Multi-Platform Support:
- On-premises servers
- AWS EC2
- Other cloud providers
- Cost Optimization:
- Pay only during replication và recovery
- Use Spot Instances cho recovery
- Right-sizing recommendations
- Disaster Recovery Plans:
- Automated recovery procedures
- Network configuration
- Application dependencies
- Continuous Replication:
- Use case:
- Business-critical applications
- Low RTO (Recovery Time Objective) requirements
- Multi-region disaster recovery
- Compliance với disaster recovery requirements
- Ưu điểm:
- Fast recovery time
- Continuous replication
- Automated failover testing
- Cost-effective với pay-as-you-use
- Hạn chế:
- Chi phí replication có thể cao
- Cần network bandwidth cho replication
- Initial setup phức tạp
6. Bảng So Sánh Tổng Quan Các Dịch Vụ AWS Storage
| Dịch vụ | Loại | Protocol | Use Case | Performance | Chi phí | Ưu điểm | Hạn chế |
|---|---|---|---|---|---|---|---|
| S3 | Object Storage | REST API | Backup, archive, static web, data lakes | High throughput | Pay per GB | Unlimited scale, durable, cost-effective | Eventual consistency, không phù hợp database |
| S3 Glacier | Object Archive | REST API | Long-term archive, compliance | Retrieval 1-12 giờ | Lowest cost | Chi phí cực thấp | Retrieval time lâu, retrieval fees |
| EBS | Block Storage | iSCSI | Database, boot volumes, apps | Low latency, high IOPS | Pay per GB/month | High performance, persistent | Chỉ trong AZ, không share (trừ Multi-Attach) |
| EFS | File Storage | NFSv4 | Shared storage, web servers, containers | Moderate latency | Pay per GB/month | Shared access, auto scale | Chỉ Linux, chi phí cao hơn EBS |
| FSx for Windows | File Storage | SMB | Windows apps, .NET, shared storage | Moderate latency | Pay per GB/month | Windows native, AD integration | Chỉ Windows, chi phí cao |
| FSx for Lustre | File Storage | POSIX | HPC, ML training, big data | Sub-ms latency, high throughput | Pay per GB/month | Ultra-high performance | Chi phí cao, specific use case |
| Storage Gateway | Hybrid Storage | NFS/SMB/iSCSI | Hybrid cloud, backup, migration | Depends on network | Pay per gateway + storage | On-prem integration | Network latency, on-prem required |
| Backup | Backup Service | N/A | Centralized backup, compliance | Depends on service | Pay per GB stored | Centralized, automated | Limited service support |
| Elastic DR | Disaster Recovery | Block-level | Business continuity, low RTO | Fast recovery | Pay per replication | Fast recovery, continuous | Setup phức tạp, chi phí replication |
7. Decision Guide: Chọn AWS Storage Phù Hợp
7.1 Chọn Storage Type
Object Storage (S3/Glacier) khi:
- Cần store unstructured data (images, videos, documents)
- Backup và archive data
- Static website hosting
- Data lakes và analytics
- Cost-effective storage với lifecycle management
Block Storage (EBS) khi:
- Cần persistent storage cho EC2 instances
- Database workloads cần low latency, high IOPS
- Boot volumes
- Applications cần direct disk access
File Storage (EFS/FSx) khi:
- Cần shared file system cho multiple instances
- Content management systems
- Container storage (ECS/EKS)
- Windows applications (FSx for Windows)
- HPC và ML workloads (FSx for Lustre)
Hybrid Storage (Storage Gateway) khi:
- Cần kết nối on-premises với AWS
- Data migration to cloud
- Hybrid cloud workflows
- Backup on-premises data to cloud
7.2 Chọn S3 Storage Class
- S3 Standard: Frequently accessed data, production workloads
- S3 Intelligent-Tiering: Unknown access patterns, tự động optimize cost
- S3 Standard-IA: Infrequently accessed, cần fast retrieval
- S3 One Zone-IA: Infrequently accessed, không cần multi-AZ
- S3 Glacier Instant Retrieval: Archive với retrieval trong 1-5 phút
- S3 Glacier Flexible Retrieval: Archive với retrieval 3-12 giờ
- S3 Glacier Deep Archive: Long-term archive, lowest cost, retrieval 12 giờ
7.3 Chọn EBS Volume Type
- gp3: General purpose, most workloads, cost-effective
- gp2: General purpose, legacy option
- io2 Block Express: High-performance databases, up to 256,000 IOPS
- io2/io1: Provisioned IOPS, predictable performance
- st1: Throughput optimized, big data, data warehouses
- sc1: Cold HDD, infrequent access, lowest cost
7.4 Backup và Disaster Recovery Strategy
- AWS Backup: Centralized backup cho multiple services, compliance
- EBS Snapshots: Point-in-time backup cho EBS volumes
- S3 Versioning + Lifecycle: Object-level backup và archive
- Elastic Disaster Recovery: Continuous replication, fast recovery
- Cross-Region Replication: Geographic redundancy
8. Best Practices cho AWS Storage
8.1 Cost Optimization
- S3 Lifecycle Policies: Tự động chuyển sang storage classes phù hợp
- S3 Intelligent-Tiering: Tự động optimize cost cho unknown patterns
- EBS gp3: Sử dụng gp3 thay vì gp2 để tiết kiệm chi phí
- EFS Lifecycle Management: Tự động chuyển sang EFS-IA
- Delete unused resources: Regular cleanup của snapshots, old backups
8.2 Security
- Encryption: Enable encryption at rest và in transit
- Access Control: Sử dụng IAM policies, bucket policies, ACLs
- Versioning: Enable versioning cho critical data
- MFA Delete: Protect against accidental deletion
- VPC Endpoints: Sử dụng VPC endpoints cho S3 access từ VPC
8.3 Performance
- S3 Transfer Acceleration: Tăng tốc upload/download cho global users
- EBS Provisioned IOPS: Sử dụng io2/io1 cho high-performance workloads
- EFS Provisioned Throughput: Set throughput độc lập với size
- FSx for Lustre: Sử dụng cho HPC và ML workloads cần ultra-high performance
8.4 Availability và Durability
- Multi-AZ: Sử dụng multi-AZ cho critical workloads
- Cross-Region Replication: Geographic redundancy
- Backup Strategy: Regular backups với automated policies
- Disaster Recovery Plan: Test và document recovery procedures
9. Use Case: Kiến Trúc Storage cho Enterprise Application
9.1 Scenario
Enterprise application với:
- Web servers (multiple EC2 instances)
- Database (RDS)
- Application logs và shared data
- Backup và archive requirements
- Disaster recovery requirements
9.2 Storage Architecture
┌─────────────────────────────────────────────────────────┐
│ Enterprise Application │
├─────────────────────────────────────────────────────────┤
│ │
│ Web Servers (EC2) │
│ ├─ EBS gp3 volumes (boot + app data) │
│ └─ EFS (shared logs, config files) │
│ │
│ Database (RDS) │
│ └─ EBS io2 volumes (high IOPS) │
│ │
│ Backup & Archive │
│ ├─ AWS Backup (EBS snapshots, RDS backups) │
│ ├─ S3 Standard (frequently accessed backups) │
│ ├─ S3 Glacier (long-term archive) │
│ └─ Cross-region replication │
│ │
│ Disaster Recovery │
│ └─ Elastic Disaster Recovery (continuous replication) │
│ │
└─────────────────────────────────────────────────────────┘
9.3 Benefits
- High Performance: EBS io2 cho database, EFS cho shared storage
- Cost Optimization: S3 lifecycle policies, EFS-IA cho infrequent data
- Availability: Multi-AZ, cross-region replication
- Disaster Recovery: Elastic DR cho fast recovery
- Compliance: Automated backups, encryption, audit trails
10. Kết Luận
AWS cung cấp đa dạng giải pháp storage, từ object storage (S3), block storage (EBS), file storage (EFS/FSx), đến hybrid cloud (Storage Gateway) và backup/disaster recovery services.
Hiểu rõ use case, performance requirements, cost, và availability needs sẽ giúp bạn chọn dịch vụ storage phù hợp:
- Object Storage (S3) → scalable, cost-effective, phù hợp backup/archive
- Block Storage (EBS) → high performance, low latency, phù hợp databases
- File Storage (EFS/FSx) → shared access, phù hợp web servers, containers
- Hybrid Storage (Storage Gateway) → on-premises integration, migration
- Backup & DR → data protection, business continuity
Kết hợp nhiều storage services với lifecycle policies, backup strategies, và disaster recovery plans sẽ giúp bạn xây dựng resilient, cost-effective storage architecture cho applications của mình.
