1.什么是 Synology High Availability?
术语“high-availability”是指专为减少因服务器故障造成服务中断的情况而设计的一种服务器布局解决方案。Synology High Availability (SHA) 部署 2 台服务器组成“high-availability 集群”,其中一个服务器作为“活动服务器”,另一个服务器作为待机“无源服务器”。
在 high-availability 集群中,活动服务器中的数据将连续复制到无源服务器,因此,这两台服务器中有所有文件的镜像副本。这样,在发生活动服务器损毁或故障的情况下,无源服务器可接管所有的服务,最大程度地降低系统服务中断的时间。
2.尝试创建 high-availability 集群前请仔细阅读以下部分。
硬件要求:
SHA 需要两台相同的 Synology 服务器作为活动和无源服务器。
两个不同的 Synology 服务器可起到活动服务器和无源服务器的作用,但有限制。
系统需求:
活动和无源服务器必须为相同型号,并都支持 Synology High Availability。
两台服务器上必须都安装同样版本的 DSM。
注:上图仅供参考。您的型号和 DSM 版本可能有所不同。
卷和硬盘:
两台服务器的硬盘容量必须完全相同以避免数据不一致的情况发生。
活动和无源服务器都必须有同样数量的硬盘。此外,硬盘的位置必须相同。
这两台服务器都不能包含任何 SHR 格式的卷。进入存储管理器 > 卷以确保不存在 SHR 卷。
注:上图仅供参考。您环境中的硬盘数量和大小可能不同。
网络环境:
两台服务器必须指派为静态 IP 地址。请确保两台服务器的 IP 地址皆可访问并属于同一子网,否则在初始化到无源服务器的转换时可能发生错误。要更改网络设置,请登录各服务器并进入控制面板 > 网络 > 网络接口,选择网络接口然后单击编辑。
两台服务器必须有相同数量的局域网端口。如果两台服务器都配备了更多的网卡,则这些网卡都将被视作额外的局域网端口。
Synology High Availability 不支持:代理服务器、DHCP、DHCP 服务器、IPv6、PPPoE 以及 Wi-Fi。请确保在创建 high-availability 集群之前将上述功能全部关闭。
注:一旦创建 high-availability 集群,SSH 和 NTP 服务器将在活动服务器上自动创建。
3. 连接服务器
本节将介绍如何连接两台服务器以创建 high-availability 集群。请参阅以下步骤:
1>>请使用网线将两台服务器相互连接起来。此连接将作为两台服务器之间的“Heartbeat”连接,以加快通信并将数据从活动服务器复制到无源服务器。此连接必须满足以下条件:
两台服务器上使用相同的网络接口。例如,如果其中一端连接到服务器的 LAN 1 接口,则另一端也必须连接到另一台服务器的 LAN 1 接口。
两台服务器皆使用最快的网络接口。如果两台服务器都配置了 10GbE 附加网卡,则该连接必须使用该网卡。
两台服务器之间采用直接连接而无需通过任何交换器或路由器。
2>>使用网线将这两台服务器连接到剩余的网络接口。 请确认这些连接有效且都属同一个网络。
注:为防止服务因网络故障而中断,我们建议在您的网络环境中部署多个交换机,以使 high-availability 集群中的各服务器能够连接到独立的交换机。
3>>服务器现在可组合为一个 high-availability 集群。请按照下列步骤继续。
4. 合并服务器并创建 high-availability 集群
两台服务器正确连接后,您可按以下步骤将其组合为一个 high-availability 集群。
1>>登录您要以属于 administrators 群组的帐户承担活动服务器作用的服务器。
2>>打开High Availability Manager。
3>>单击创建 HA 集群来启动设置向导。
4>>单击下一步。
5>>指定您要将其用作无源服务器的 IP 地址、域用户名和密码。(要找到 IP 地址,登录到其它服务器并进入控制面板 > 网络 > 网络接口。记得确认两台服务器都使用静态 IP 地址。)然后单击下一步。
选择要用于 high-availability 集群 Heartbeat 连接的网络接口。(此选项应与您用于将两台服务器进行相互连接的网络适配器相同。)然后单击下一步。
指定 high-availability 集群的名称。此外,选择用于连接到数据网络的网络接口,然后为 high-availability 集群指定 IP 地址和子网掩码。您可用在此指定的名称和 IP 地址访问 high-availability 集群资源。然后单击下一步。
确认设置。然后单击应用。
设置向导将开始创建 high-availability 集群。创建时间根据系统环境而有所不同。
完成后,您将在概述页面中看到集群状态。
5. 发生故障后解决问题
发生某些错误时,系统会自动将服务从活动服务器转移到无源服务器。这情况称为“故障转移”。在下列情况下,系统可能启动故障转移。
5.1 损毁的存储空间
活动服务器上的存储空间 (例如存储卷、iSCSI LUN) 处于损毁状态,但无源服务器上相应的存储空间运行正常时,将会出现故障转移。例如:如果服务器 A 为活动服务器,而服务器 B 为无源服务器。当服务器 A 上的存储空间损毁但服务器 B 上的相应存储空间仍良好时,系统将执行故障转移。
注:如果已损毁的存储空间上没有卷或 iSCSI LUN (段落分块),则系统不会启动故障转移。
故障转移过程完成后,请进行以下操作:
1>>进入硬盘状态页面并识别服务器 A (现在为无源服务器) 上丢失或损毁的硬盘。
如果有硬盘丢失,请在相应的插槽上安装硬盘,这样,两台服务器就有相同的硬盘数量。
如果有损坏的硬盘,请进行更换。
2>>确认两台服务器都含有相同的硬盘配置,所有硬盘的状态均为正常或未初始化。
3>>进入存储空间状态页面并单击修复以修复存储空间。
5.2 服务出错
当监控的服务出现错误,会出现故障转移。例如:如果在服务器 A (活动服务器) 上监控的服务发生故障,系统将向服务器 B 实施故障转移。在此情况下,请在故障转移完成后执行以下操作。
1>>前往总览页面。
2>>服务器 A 现在应为无源服务器,单击管理 > 关闭无源服务器。
3>>服务器 A 完成关闭后,再次启动。
5.3 电源故障
当活动服务器关闭、重启、两个电源组件失效或外部电源断电时将出现故障转移。例如:如果服务器 A 为活动服务器且其电源失效,系统将对服务器 B 实施故障转移。电源恢复后,请将服务器 A (其现在为无源服务器) 开机。
6. 维护 high-availability 集群
要了解日常维护的程序,请参见以下说明。
程序 |
说明 |
---|---|
移动这两台服务器到其他位置 |
|
升级两台服务器上的 RAM 或 NIC |
|
更换无源服务器上的故障组件 (如 RAM、风扇或 NIC) |
|
更换活动服务器上的故障组件 (如 RAM、风扇或 NIC) |
|
将活动服务器切换为无源服务器 |
|
取消无源服务器与集群的绑定 |
|
绑定新无源服务器 |
|
删除 high-availability 集群并将服务器恢复到独立状态 |
|
更新系统 |
|