标签时代 (一)

如果要在我的记忆里为web 2.0找一个对我来说印象深刻的起始坐标,我想应该是2004年的愚人节。

那一天,google戏剧性的发布了gmail这个划时代的产品。在所有的邮箱服务商都斤斤计较2M还是4M邮箱容量的时候,google宣布它的邮箱容量为1G。我相信很多人都和我一样还记得这个消息带来的冲击。Google说,我们相信很久以前的信有时候也是有价值的,所以我们希望能够使得我们的用户不怎么需要删除旧信,所以邮箱当然是越大越好。

可是信攒了那么多,怎么收拾呢?分类,管理都是个麻烦事。Google说,你忘了我的本行是什么了么?不用管理,不用建立目录。你可以给你的重要的信加上若干关键字,想用的时候搜索就好了。

Google起家当然是因为搜索,而搜索引擎的壮大背后是互联网信息量几乎无限制的增长。从2M的邮箱变成1G的邮箱,反映的是信息爆炸的速度。可是这些信息是从哪里来的呢?把报纸搬上网络,把商店搬上网络,就会有这么多新信息么?

我请大家和我一起回忆一下十年前我们用浏览器看些什么内容:那时的热门网站有新浪,有搜狐,当然还有别的大同小异的网站用来看新闻、看小说。而今天,我们的浏览器里仍然有这些内容,可是还多了维基百科,多了youtube,多了豆瓣,还多了无数大大小小的blog。

请注意这些新生网站和它们的前辈的一个微妙而本质的差别:几乎所有的经典网站都是内容的提供者,我们看到的是和经典的报刊书籍类似的内容。几乎所有的的新兴网站都不提供内容而只提供空间和发表机制,我们在上面看到的一切具体内容都是我们自己提供的。——这是一个安静而深刻的转型,网站的角色从内容提供者,变成了信息组织者,而信息的提供者变成了我们自己。

这个转型的产物,就是人们一般所说的web 2.0。

某种意义上来说,这才是互联网上无限增长的信息的真正来源:我们自己的撰写。这些新的撰写和从前的时代里的任何撰写都不同,它们从诞生之日起,就建立在电子技术之上。它们具备传统信息所完全没有的庞大数量,也摆脱了传统信息天然具备的物理负担。所以,仔细观察这些崭新的信息的组织方式,我们就能够在某种意义上了解什么才是对管理和收藏信息来说真正的要素,什么只是旧介质的无奈累赘。

一个鲜明的事实是:几乎所有的新兴网站都遵循了一条简单的管理准则:要标签,不要目录。

什么是标签?标签是一个元素的多个属性描述。什么是目录?目录是一个元素的层层单一归属。当我们写了一篇日记,写到了一次旅游里波士顿的中餐馆的印象,我们希望用哪种方式来标识这一则日记?是“旅行、中餐、波士顿”,还是“日记/旅行日记/波士顿旅行日记/关于中餐馆的波士顿旅行日记”?答案是前者。

(顺便说一句,你没准又忍不住选择“日记/关于餐馆的日记/关于波士顿餐馆的日记”这另一条路径,每个整理过手头收藏目录的人都体会过变更目录树的痛苦。)

更关键的是,如果我们希望别人通过搜索引擎看到这篇文章,我们是希望他搜索“旅行、中餐、波士顿”中的任何一个词就能看到,还是沿着“../…/…./…..”这唯一的路径才能走到?答案也是前者。——这就是为什么几乎全部的web 2.0网站都建立在标签的基础上,因为这才是更自然的方式。

让我们看看维基百科。截至今天为止,英文维基已经收录了两百多万词条,中文维基也有近十五万条词条。它已经是人类历史上最成功,影响最广泛的百科全书之一。随便点开一个词条,譬如美国总统大选,词条的地址是:

http://en.wikipedia.org/wiki/United_States_presidential_election

注意这个地址,在http://en.wikipedia.org/wiki/后面直接就是词条本身。几百万个词条,无论是“美国”还是“美国总统”还是“美国总统大选”还是“2008年美国总统大选”,无论其重要性为何,都被放在同样的层次之下。没有目录树。

让我们看看youtube,这个建立只有三年的网站在今天的互联网流量排名上位居全球第四,收录超过五千万条视频,每天有超过一百万条视频被点播。当然,这些视频的组织完全依赖于标签和搜索。没有目录树。——本来你也很难给一条关于同学生日聚会的录像以合适的编目。

(回想一下生活中的那些影视资料馆吧,阴暗的架子上面贴着模糊不清的分类编号,大家弯着腰眯着眼睛仔细查看厚厚的目录本子。)

让我们看看del.icio.us,如果你还不知道这是什么的话,恭喜你,你落伍了。这是今天全球最主要的网络书签中心。人们用它代替了自己电脑上的收藏夹,并且把自己喜欢的网页推荐给别人。人们可以随时随地在任何电脑上查看自己喜欢的网页列表,或者看到别人眼中的好网页。当然了,所有的网页都是以标签来标记的,没有目录树。

(作为对照的是,本地电脑上的收藏夹却是典型的目录结构,可是越来越多的人已经不再用它了。)

最后再让我们来看看整个互联网本身。还记得若干年前一个典型的门户网站的样子么?比如Yahoo,首页上就是一个庞大的目录,左右上下排列得整整齐齐。今天谁还在用那样的门户目录?我们只要Google就够了。

(顺便说一句,其实google也有一个基于目录树的版本:http://directory.google.com/。 有多少人用过?)

不用分类管理,关键字标签就够了。Gmail当年的宣传语现在看来格外意味深长。目录树的建立很大程度上基于传统时代人们对于快速检索实体信息的需要——准确的定位、单一的路径以及缩短相似信息之间的物理距离,为此我们不得不忍受着它的种种不便(我不需要在此列举这些不便,任何一个曾经试图整理大量散乱资料的人都有所了解)。互联网的历史告诉我们,一旦基于电子搜索引擎的大规模检索方式成为可能,目录树的概念几乎立刻就被抛弃了。

我们不妨猜测,假如人类文明自始就建立在电子基础上,先天的具有快速信息检索能力,那么目录这一结构是不是远远不会扮演今天这么重要的角色呢?

事情当然不会这么非黑即白的简单,现成就有一个显然的反例存在。我口口声声在讨论电子资源,可是电子资源的大本营——电脑,却是建立在目录文件结构之上的。这又作何解释?

这个问题恰恰反映出了标签系统的一个缺陷。尽管它建立了一个极易为用户接受的查询和使用机制,可是它的非线性的特点使得它实在是难于用机械算法来直接实现——于是就出现了上述吊诡的事实。一方面,借助电脑,人类终于得以摆脱目录结构的桎梏,进入标签的自由世界;另一方面,电脑本身却极大的发挥了目录结构的长处,才能够快速的存取数据交换信息。通过数据库技术,电脑得以实现出越来越精致易用的面向用户的信息管理和查询界面,让我们能够最快最准确的迅速得到想要的信息,可是电脑自己的文件系统却倾向于建立在经典的目录树结构的基础上,至少在常见的文件系统下是如此。

事实上,把自身的目录结构在用户面前隐藏起来正是电脑操作系统的一个重要的发展趋势。说到底,电脑上有几个磁盘,每个磁盘下有几个目录,每个目录下有几个文件,这和用户有什么关系?这完全不是真正让用户觉得自然的方式。不幸的是,囿于操作系统技术的限制,尽管我们已经从网络上的目录树里解放了出来,却还困在本地电脑上大大小小的文件夹里。如果你像我一样整理过大容量的硬盘收藏,你一定和我一样同意把目录结构应用于电子资料的过程简直让人发疯:建立科学方便的分层目录极其耗费和精力,更不用说总有那么几个特殊例子的难于分类。如果偶尔还需要调整一下分类方式,工作量更是大的吓人。我自己的电脑上有几百G的音乐文件(只是古典音乐,这已经够理想了,至少我不用操心古典音乐和流行音乐不同的分类特点),而我从来就没有把他们以令人满意的的方式成功归类过。按作曲家划分?按创作时代划分?按体裁划分?按风格划分?按国别划分?按CD专辑编号划分?我常常笑话那些放着电脑在前面还要费劲打草稿算乘法的人,可是我自己还是不得不面对着电脑干如此艰巨的体力劳动,并且处理的事情还是电脑最擅长的数据管理,一想到这个事实我就气愤不已。

所以人们一直在努力着,一步步的把用户和目录隔离开来。用过itunes的人也许注意过这样一个事实:itunes管理的音乐本身是以极其复杂的目录格式存储在硬盘上的,可是那和用户并没有关系,用户面对的只是itunes的界面,在那里可以随心所欲的按照任何属性寻找自己想要的音乐。另一个例子是google desktop,google声称这款软件可以让用户像搜索互联网一样搜索自己电脑上的内容,忘掉真实的目录,想要什么内容的时候直接搜索相关的关键词就可以了。

(至少就我看来,这两款软件都还远远称不上真正好用——本地信息管理技术的发展远远的被网络上的对应技术抛在后面,这真是让人沮丧。)

所以在理想的技术手段下,我们既不需要关心文件怎么存放也不需要知道它的任何分类信息,那都是电脑的事情。我们需要的只是一个纯粹的用户界面,在那里我们看不见文件夹也看不见目录树,我们只看见电脑对我们说,先生您要点什么?

我要听贝多芬的最后一首弦乐四重奏的第四乐章,要Emerson重奏组的版本。我还要看一看清朝一个诗人的诗集,我忘了他的名字了,但是他写过一句“国家不幸诗家幸”来着。

于是音乐开始播放,赵翼的诗集也打开了。

这并不是什么遥远的事实,实际上,新一代的更傻瓜化的操作系统已经站在门口准备敲门了。如果有人还没有听说过微软的surface计划,我强烈建议他去看一看http://www.microsoft.com/surface/上的三段视频。请注意视频里那些令人惊叹的操作并不是伪造的录像,那是一台真实的原型机,也就是说,我们离它已经不远了。

4 Responses to “标签时代 (一)”

  1. 标签时代(一) 于 枕着云的远航
    January 26th, 2008 20:03
    1

    […] 标签时代(一) […]

  2. 光芒~
    March 28th, 2008 02:22
    2

    看了你这里的东西~~收获很多~学习到了很多·

    想转载东西~~看见另外一个地方你说转载注明地方就可以了~~

    呵呵···我会注明的好不~~ 直接拿了哈~~

    多谢多谢~~

  3. Lanz
    November 10th, 2012 19:44
    3

    最近一直在看您写的博客,真的是很巧呀,Surface在前些天正式的发布了,我也正好看到了您写的关于Surface的期待,我很有兴趣知道在四年前您写的这篇博客里和现在看来对Surface的感想发生了什么变化呢,

  4. fei
    October 15th, 2013 05:31
    4

    ipad 这些 device 就是这个概念了吧,用户不管理目录,只接触应用然后触发内容