Tech Notes: 备份强迫症

年底的时候有一天在Neverland发了个帖子,说我手头有一个1T的大硬盘里装满了东西并且时刻担心万一它坏了怎么办,于是考虑再买一个大硬盘来备份之。然后,很快的这个想法就被大家联系到所谓的和面强迫症上去,这个古老的比喻是说,从前有一个人要和面但是不知道面和水的正确比例,于是随便加了一些水,结果稀了,于是又只好加面,结果面太多了,于是又只好加水,这样水多了加面面多了加水……最后和出一大缸面来。

我不知道别人都是怎么处理这种焦虑的,但是备份本身无论如何都是个麻烦的问题。

备份当然不仅仅是因为硬盘可能会坏,而且也因为电脑的生命周期相当有限——至少比大多数数据值得保存的期限更短。理论上来说,最理想的情况当然是自己手头的一切有价值的电子资料都储存在至少两种不同的介质里,并且最好有一种介质是网络可达的,也就是说,换了环境也能接触到的。对于某些特定的文件来说,这一点不算困难,比如所有的照片都可以同时存在本地电脑和Picasa或者Flickr上,但是大多数文件没有这样类似的办法。

一个自然的选择是专门购买一块网络空间来干这件事情。如今网络空间越来越便宜(至少美国的服务商基本上都能以很低廉的价格提供无限量硬盘空间),今天甚至看到了一则广告说Dreamhost正在促销其网络空间,无限量空间的两年租用价格为10美元左右(该优惠已过期),基本上对大多数不敏感的个人资料来这种备份办法是一个很好的选择,但是有一个限制:你不能存储任何有版权争议的文件,而且,他们真的会检查……我曾经因为一些pdf格式的电子书被警告过。于是,如果你的硬盘上全是各种健康或不健康的各国及日本电影的话,此路不通。

(我自己不收藏任何形式的电影,特此声明。)

但是备份和简单意义上的存储毕竟还不完全是一回事。备份的要义在于,如果本地电脑上的文件作了任何更改和增添,我们希望有一种简便易行的方式让这种变化也能有效率地在备份端反映出来。如果是照片的话,类似于Picasa的客户端软件可以很方便的在网络上同步更新自己的收藏。如果是一般的数据文件,也有很多专门的备份软件都能做到这件事情(比如诺顿360就有一个子功能可以做这件事),但是其空间价格往往远比自己直接购买空间贵得多。直接在个人网络空间里不停的“更新基本靠手”也是可行的,但是毫无疑问,这是个麻烦得要死的工作。

我自己的做法(其实也是很笨的做法)是平时把自己在电脑上作的工作全部按时间区域分成目录,然后尽量保证自己在每段时间里所增添和修改的文件都只发生在相应的目录里。然后每过一段时间(比如每到年底)统一备份一次更新过的目录。这个办法听来很复杂,操作起来其实很容易,但是说到底还是依赖于手动——只是动得不那么勤而已。

我一直在想这种局面有没有可能在短期内得以改变。理论上来说,现在炒得火热的“云计算”本质上就是为了解决这类问题的——把一切都直接放在远端,让专业的数据维护人员操心备份的问题,用户只要随时调用就可以了。(其实我一直没弄明白这个概念到底和十年前微软和Oracle鼓吹的网络计算机有什么区别,也许只是当年无法实现而今天可以实现了?)但是我总觉得这里有某种心理上的障碍存在。毕竟,一个个人电脑上的全部(合法获得的)数据都可以心安理得的看作是个人财产的一部分,它可以包含任意形式的个人隐私而同外界完全无关。可是存在远端的数据呢?在这个越来越数字化的时代,个人电脑就像是自己的家一样。我们真的愿意把自己家里的针头线脑统统托管给别人么?

归根结底,这是一个同时关系到个人的数字存在和物理存在的问题。如果一个人的物理状态很稳定而数字财产相当有限,那么备份不会是个严重的问题——大不了每次换电脑的时候拷贝一遍就是了。但是如果一个人大多数生活资料和记录都以数字形式存在而现实中又处于四海为家的状态,那么备份就是一个本质的问题——至少和传统意义上的个人财产保护一样重要。

就我自己而言,大概介乎两者其间。我固然现实中不至于漂泊不定,但是在可以看到的未来里大约必然会辗转居住于若干不同的城市。而更重要的是,我确实很难想象(虽然不是绝对无法想象)我完全失去自己的全部数字资料会是什么感觉。它们并没有提供任何现实生活的制约和支撑,但是它们提供了某种至关重要的安全感,让我可以更放心地面对现实生活中的变迁和不确定性。也许我可以说,是它们部分地定义了我的存在。

于是在上面那些技术性问题得以彻底解决之前,我大概只能带着我的大硬盘到处走来走去。好在硬盘终究也使越来越便宜和越来越便于携带的。也许有朝一日我的全部文件都可以放在一个U盘大小的存储器里,然后真的随身携带着它。——看样子那一天应该不远了。

20 Responses to “Tech Notes: 备份强迫症”

  1. eyesopen
    January 4th, 2009 13:17
    1

    我發現你總喜歡以“那一天”結尾。。只不過有的遠有的不遠。。

  2. 木遥
    January 4th, 2009 13:21
    2

    巧合……巧合……

  3. Julia
    January 4th, 2009 14:46
    3

    喵喵!和面男!

  4. iColor
    January 4th, 2009 21:52
    4

    类似 Time Capsule 的设备吧.虽然和你所想要的效果有些不同..

    突然想到 iPod 就是这样的,机子里的音乐文件都在 iPod 的保留了”备份”

    突然感觉最好的方式是不是 移动系统 呢? 可能还需要一定的时间来发展,自己只需要一个移动硬盘,里面包括系统和自己的一些文档,可以到任何地方接显示器显示就可以了,在自己家的话可以接电脑进行数据同步…希望很快实现…

  5. dimlau
    January 5th, 2009 00:40
    5

    live mesh很不错
    多平台支持、同步、版本控制

  6. Yizhou@Oracle
    January 5th, 2009 01:13
    6

    Larry看得更远,网络计算机被设计成完全无硬盘的I/O设备,不仅仅是基于云的。

  7. 木遥
    January 5th, 2009 01:40
    7

    Time Capsule本质上也就是大硬盘嘛。。。而且太贵了也。。。

  8. 木遥
    January 5th, 2009 01:41
    8

    啊,没用过这个。。。我只用过Live Sync,研究一下这个去。

    为啥微软近期研发的东西都闷声不吭的。。。

  9. eyesopen
    January 5th, 2009 02:44
    9

    原来你们两个认识。。?

  10. 木遥
    January 5th, 2009 02:52
    10

    不认识。。。在我这里留言的很多我都不认识。。。。

  11. nk
    January 5th, 2009 08:58
    11

    备份方面可以在本地用版本控制工具如 svn 或 git 来管理,然后定时(比如30分钟)把仓库打包并上传至任何的网络空间,比如dreamhost。考虑到要备份的文件会越来越多,也可以选择做增量备份,如果有涉及版权或者隐私的文件,不妨用gpg加一下密(提示:务必务必务必保存好私钥,丢了这个比把硬盘砸了更严重),这样无论怎么查都没问题了吧?

    还有最重要的一点,这些都不能手工来操作,那就写一个脚本放到后台去运行,每半小时备份一次。。。。。。

    这样所有工作全部自动化,甚至于完全不用手工干预。。。。。。

    另外,你关于云计算的理解有些偏差,它要完成的东西可不是你想的那么简单,如果它能够得以广泛应用的话,对于现在的信息技术和产业来说,那将算是一场革命了。。。。。。

  12. 木遥
    January 5th, 2009 09:25
    12

    可是我觉得我现在想象的这些已经完不成了。。。。 

  13. amio
    January 5th, 2009 10:13
    13

    真巧,我的论坛也叫Neverland

    SVN的问题是文件冗余很厉害,本地都要双倍的空间,服务器端不清楚,只会更多吧,因为还要带回退功能

  14. nk
    January 5th, 2009 14:01
    14

    svn我用的不是很多,推荐它是因为大家一般都听过这个,其实我自己比较喜欢git…

  15. anonymous
    January 6th, 2009 13:06
    15

    不一定要买Time Capsule的 很多普通的便宜的移动硬盘就可以用time machine来备份,每次就是备份你新加的东西 直到硬盘填满 呵呵

  16. ilovebach
    January 9th, 2009 22:57
    16

    zt,这不是物理存在和数字存在的问题,明明是你的精神依赖于外物才能够获得安全感嘛。。。

  17. 木遥
    January 10th, 2009 14:02
    17

    你居然还活着。。。。

  18. xpandan
    January 11th, 2009 11:31
    18

    大家不是(权且当作)放心把钱放在银行和各种证券机构里么,个人数据也会一样的。

  19. 王力
    February 8th, 2009 11:40
    19

    其实觉得使用Time Machine 向网络硬盘备份基本可以达到楼主要求

  20. uda1341
    January 24th, 2010 23:52
    20

    1 云服务模式之不可行。
    为各种需求提供服务的不会是一个超级大公司,这些公司还有竞争关系,在这样的模式下,把个人信息从一处搬到另一处是必不可少的工作,如果存在数据的形式不兼容,那就更加麻烦。
    2 个人资料自己备份。
    操作麻烦,更何况,是不保险的。
    3 基于通用协议的模式。
    这种模式下例如会有个机器代理为你找上10000个好友,自动处理好友间的互助存储协议,并通过协议来确保每一份重要性不同的内容都有对应可靠性的存储方案。私密性可通过拆分数据与加密方式得到。而且,每个人的原创数据量都是很少的,大多数都是通用的内容,所以,本机每天例行的工作只不过是不断的维持数据源的可靠性而已,真正要存储的内容,即使每份都在1000台电脑上备份,也不会显得过分。