AWS EFS

Amazon EFS (弹性文件系统)

第一章:核心定义与核心价值

Amazon EFS 是一种完全托管、无服务器(Serverless)、弹性且“设定后即忘”的网络文件存储服务。

  • 服务本质: 它使在 AWS 云中设置和扩展文件存储变得简单,自动管理所有底层基础设施,避免了部署、补丁和维护的复杂性。
  • 协议支持: 支持网络文件系统第 4 版(NFSv4.1 和 NFSv4.0)协议。
  • 平台兼容性: 可以挂载到运行 Linux 或 MacOS(Big Sur 及更新版本)的 EC2 实例上。注意:不支持 Windows
  • 多资源共享: 除了 EC2,还支持挂载到 ECS 任务、EKS Pod 和 Lambda 函数。
  • 并发访问: 成千上万个 EC2 实例可以同时访问同一个 EFS 文件系统,为多实例运行的工作负载提供通用数据源。

第二章:存储类与生命周期管理

EFS 提供多种存储类,以根据访问频率优化成本。

1. 存储类划分

  • Amazon EFS Standard: 用于跨多个可用区(AZ)存储频繁访问的文件。
  • Amazon EFS Infrequent Access (EFS IA): 为访问频率较低的文件提供成本优化。
  • Amazon EFS Archive: 针对每年访问几次或更少的长生命周期数据进行优化,成本比 IA 低高达 50%。
  • Amazon EFS One Zone: 将频繁访问的数据存储在单个 AZ 中,成本更低,但可用性也较低。
  • Amazon EFS One Zone-IA: 在单个 AZ 中存储低频访问的数据。

2. 生命周期管理 (Lifecycle Management)

  • 自动迁移: EFS 会自动将设定周期内(如 7、14、30、60 或 90 天)未被访问的文件从 Standard 迁移到 IA,或从 IA 迁移到 Archive。

第三章:性能与吞吐量模式

1. 性能模式 (Performance Modes)

  • 通用模式 (General Purpose - 默认): 理想的延迟敏感型用例选择。
  • 最大 I/O 模式 (Max I/O): 可以扩展到更高水平的总吞吐量和每秒操作数,但文件操作延迟略高。适用于大数据分析、媒体处理和基因分析。

2. 吞吐量模式 (Throughput Modes)

  • 弹性模式 (Elastic - 推荐): 吞吐量随工作负载活动自动扩展,只需为使用的量付费,无需提前配置。适合波峰明显或不可预测的工作负载。
  • 预置模式 (Provisioned): 允许你指定文件系统的吞吐量,与其存储的数据量无关。
  • 突发模式 (Bursting): 吞吐量随文件系统大小而增长。

第四章:架构组件与连接性

  • 挂载目标 (Mount Targets): 要在 VPC 中访问 EFS,需在每个可用区创建一个挂载目标,它为 NFSv4 终端节点提供 IP 地址。
  • DNS 挂载: 使用 DNS 名称挂载文件系统,它会自动解析为对应挂载目标的 IP 地址。
  • 访问点 (Access Points): 简化应用程序对共享数据集的访问。它们与 IAM 配合工作,可以为通过访问点发出的每个请求强制执行特定的操作系统用户、组和目录。
  • 混合云访问: 本地服务器(必须是 Linux)可以通过 AWS Direct Connect 或 VPN 连接到 VPC 来挂载 EFS。

第五章:安全性与监控

  • 访问控制: 必须拥有有效凭证和相应权限才能创建或访问资源。

  • 安全组: 必须为 EC2 实例和 EFS 挂载目标指定相应的安全组。

  • 权限管理: 默认仅根用户(UID 0)拥有读写执行权限。可利用 IAM 策略和角色管理特定客户端的 NFS 访问权限。

  • 加密: 支持静态加密(At Rest)和传输中加密(In Transit)。

  • 数据保护: * 通过控制台创建的文件系统默认开启 AWS Backup 每日自动备份(保留 35 天)。

  • AWS DataSync 可用于在不同区域或账号的 EFS 之间安全复制文件。

  • 监控: 利用 CloudWatch 指标(如 PercentIOLimit)监控 IOPS 利用率。


第六章:计费与计量细节

  • 按需计费: 你只需为文件系统使用的存储量付费。

  • 计量规则:

  • 普通文件: 逻辑大小向上舍入到下一个 4-KiB 增量进行计量。

  • 稀疏文件 (Sparse Files): 如果实际存储使用量小于逻辑大小,EFS 按实际使用的存储报告计量大小。

  • 目录与链接: 目录按实际存储使用的结构大小计算;符号链接和特殊文件固定计量为 4 KiB。

  • 注意: 删除文件系统是破坏性操作且不可撤销,建议在删除前先卸载。


第七章:架构师对比表 (EFS vs EBS vs S3)

特性Amazon EFSAmazon EBS (io2)Amazon S3
可用性与持久性跨多个 AZ 冗余存储存储在单个 AZ 内跨多个 AZ 冗余存储
访问能力数千个 EC2 实例跨多 AZ 并发访问通常单个 AZ 内的单个实例连接通过 Web 提供百万级连接
延迟低且一致的每操作延迟最低且一致的延迟低延迟且集成 CloudFront
典型用例大数据分析、内容管理、Web 服务、主目录启动卷、事务型数据库、数据仓库、ETL静态 Web 托管、媒体分发、数据湖、备份