数据备份与容灾

企业该如何进行数据备份?

前段时间,相信每个IT从业者的朋友圈都被这样一条消息刷屏了,“腾讯云北京三区部分云硬盘IO异常,导致互联网创业公司“前沿数控技术”线上生产数据完全丢失”。听闻此消息后,众多人都痛心疾首的说到,“备份,备份,一定要备份啊!”

“在没有惨痛的事故教训之前,很难下决心在看不见业绩的地方投入成本,这是很难改变的惯性思维。” 前车之覆,后车之鉴,在这么惨痛的代价面前,我们再来重温一下数据备份的意义和重要性

为什么要数据备份?

我们先来看一下什么是数据备份?数据备份是容灾的基础,是指为防止系统出现操作失误或系统故障导致数据丢失,而将全部或部分数据集合从应用主机的硬盘或阵列复制到其它的存储介质的过程。

为什么要数据备份呢?数据备份的定义已经给出了清晰的答案,就是为了防止因为各种原因导致数据丢失。但其实数据从其诞生之初就伴随着各种丢失的风险,阿里巴巴数据库事业部备份专家衡铁刚曾在采访中表示,“你今天躲过了硬件bug,明天避开了雷劈,后天绕开了断电,大后天还是可能会“手滑”碰到误删除。”

如何做数据备份?

数据备份方案需要考虑哪些因素呢?首先是考虑数据的重要程度和变化频繁程度,其次要考虑备份硬件的配置,最后要考虑备份需要的时间和对服务器资源消耗对实际业务处理的影响。而一个好的数据备份方案要同时具备以下特点:

1.对业务处理的影响要尽可能地小,把需要长时间才能完成的备份放在业务处理空闲的时间

2.对于重要的数据,要保证在任何破坏下都可以被恢复

3.数据库出现故障时,能尽快地恢复数据

4.对备份硬件的使用要合理,不会盲目地浪费备份硬件,也不会让备份硬件空闲

.因为在企业中数据库的用途各有不同,所以对应的备份系统的策略也会有所不同。如果从数据库用途粗略划分,企业中的数据库可分为测试数据库、生产数据库和核心数据库。

通常的备份策略都是小库进行全库备份就可以了,中库进行全库备份、差异备份和日志备份,而大库进行全库备份和文件、文件组备份以及日志备份。如果按照数据库用途分类来看的话,测试数据库如果是个人使用可以不用备份,如果是企业研发使用需要开启备份。生产数据库需要开启备份、评估备份周期、测试备份数据是否恢复正确。核心数据库的重要性要高于前面两者,所以在备份时除了常规操作,还需要一些额外辅助,例如数据快速恢复、定期演练等等。

备份数据保存多久?何时会用到?

根据监测统计,2017年全球的数据总量为21.6ZB(1个ZB等于十万亿亿字节) ,目前全球数据的增长速度在每年40%左右。在这样的大环境下,企业中的数据也在以前所未有的速度爆发式增长,如果是把所有数据都永久备份,显然是不现实的。

这就引发出了另一个问题,“备份数据保存多久”?数据保存的周期当然还是要根据企业自身业务来确定。不过,也有网友爆料称,他们的活跃数据本地存储7天,查询数据在阵列中存储2个月,冷数据在对象存储中存储1年,汇总整理会保留有效数据3年。

养兵千日用兵一时,我们花了这么多的心力和成本去做数据备份,那么何时是数据备份大显神威的时刻?

1.需要升级数据库或者是需要增加一个从库的时候;

2.主库或者从库宕机,需要数据备份;

3.人为的DDl或者是DML的语句,导致主从库的数据消失;

4.跨机房的灾备,需要备份数据到远端程序。

企业数据保护与数据救援方案