[科技谈]云服务太慢 只好快递接收数据

海量数据云传要等很久?有时“快递寄盘”反而更快

听起来可能有些奇怪,但全球云计算第一名亚马逊云服务(AWS)的核心业务之一,其实就是“数据快递”。字面意思,就是把计算机数据打包好,送到客户家门口的业务。在从查看电子邮件到电影流媒体都通过云端解决的超连接时代,为什么这种看上去麻烦的业务还存在呢?


数据快递箱,亚马逊 Snowball

用于转移数据的快递箱 Amazon AWS Snowball 图片来源 AWS官网截图

用于转移数据的快递箱 Amazon AWS Snowball 图片来源 AWS官网截图

View original image

亚马逊在2016年推出了一种名为“Snowball”的边缘型计算服务器。Snowball是用特殊外壳安全保护起来的小型数据中心。通常部署在AWS数据中心的中央处理器和内存设备都一应俱全,功能也完全相同,只是把体积缩小到了一个重约20千克的小箱子而已。


Snowball的目的只有一个,就是以“物理方式”把客户的计算机和云连接起来。一旦接到订单,亚马逊会在4~6天内把Snowball寄送给客户。客户接通电源,用局域网(LAN)把自己的计算机与Snowball相连,然后将计算机中的数据转移到Snowball中。之后亚马逊工作人员再把Snowball取回,运送到AWS数据中心。


有时候快递员比通信更快

既然可以使用云,为何还要通过收发一个箱子大小的服务器来搬运数据?乍一听确实让人难以理解,就好像不通过互联网发送电子邮件,而是打印出来再去邮局寄送一样。


但Snowball之所以诞生,是有原因的。如果用过谷歌云等服务,就会知道传输或下载几十GB这样的大容量数据,大致需要花费多少时间。


以现代通信技术也难以承载拍字节规模的数据。Pixabay供图

以现代通信技术也难以承载拍字节规模的数据。Pixabay供图

View original image

然而企业的情况则完全不同。经常会出现需要转移太字节(TB,1TB约等于1000GB)甚至拍字节(PB,约1000TB)级别数据的情形。从我的电脑通过网络把文件传到数据中心,根据网络环境不同,可能要花2~3周,甚至几个月以上。


由于数据量过大,在云端产生的瓶颈(Bottleneck),是数据驱动型企业普遍面临的问题。用8~12K分辨率视频进行制作的好莱坞电影业、传输超高分辨率图像的天文研究所、银行等,都是典型代表。


将海量数据存入雪球后,由人工亲自搬运。 [图片来源=YouTube提供]

将海量数据存入雪球后,由人工亲自搬运。 [图片来源=YouTube提供]

View original image

那该如何解决这个问题呢?方法出人意料地简单:建立一个临时数据中心,用来接收超大规模数据,然后再把它带进云端。这就是Snowball。亚马逊已经在全球各地设有物流据点。当光纤电缆为了一整个月才能传完这些数据而忙得不可开交时,手里拎着Snowball的快递员却可以在一周内完成同样的数据传输工作。


云端要花10年的工作,缩短到6个月

不过,以物理方式搬运数据不会太危险吗?反而可能更安全。包裹Snowball服务器的特殊外壳采用了最尖端的材料工程技术设计,据称即便从美国空军运输机上用降落伞投下,也丝毫无损。正因如此,Snowball在军队、灾区等场景中也被广泛使用。


集装箱式数据中心移动设备“Snowmobile”。AWS供图

集装箱式数据中心移动设备“Snowmobile”。AWS供图

View original image

还有一种连接了约1100台Snowball的集装箱式数据中心,名为“Snowmobile”。这个数据中心由大型卡车运送。AWS之所以构想出Snowmobile,据说是源于过去一家名为“DigitalGlobe”的卫星照片企业的委托。


DigitalGlobe当时持有规模达100PB的照片资料,如果全部迁移到AWS,预计需要整整10年时间。而改用Snowmobile进行“物理”运输后,所需时间大幅缩短到6个月。


超连接时代,网络的极限依然存在

Snowball这个案例说明,即便在数字时代,“通信”这个概念依然复杂艰难。有时,比起最尖端的通信网络,一辆普通的快递卡车反而更快。



当然,线下数据传输系统终将逐渐成为过去的遗产。AWS在上个月已表示,将逐步终止Snowmobile服务。随着最新数据传输技术的普及,已经没有必要再搬运集装箱规模的数据中心了。将来如果有一天,能够快速传输PB级数据的通信网络在全球范围内建成,Snowball也会逐步退出历史舞台。