【推荐】网盘中的秘密

之前国内各家大公司之间的网盘大战吵的沸沸扬扬,很多同学都在自己的博客上说今天领取了XXXT容量,1元XXXX,免费升级到XXT之类的,鸡冻你没发现dropbox这种网盘鼻祖却始终提供那么点容量,你们就没有想到过为什么么?我只想说,图样图森破啊~

事实是这样的~

我想要为每个用户提供 1G 的网络存储空间。

如果服务器上有一颗 1000G 的硬盘可以全部为用户提供数据储存,如果每个用户分配 1G 的最大储存空间,那么能非配给多少个用户使用呢?

你一定说是 1000/1=1000 个用户。

但事实上你这么分配了,你会发现每个用户平时根本不会上传 1G 的东西将容量占的漫漫的,有多又少,但平均用户平时只上传 50M 的文件,也就是说,你将 1000G 的硬盘分给 1000个 人使用,但只有效利用了其中的 50M*1000=50G 的空间,剩余 950G 的空间基本都完全浪费了。

【推荐】网盘中的秘密

那么怎么解决呢?

你可以变通一下,将这 1000G 的空间分配给 20000个 用户使用,每个人的上传上限容量还是 1G,但每人平时还是平均上传 50M 的数据,那么 20000*50M=1000G,这下子就把宝贵的服务器上的存储空间充分利用了。但你又怕这样分配给 20000个 人后,万一某一刻人们突然多上传点数据,那么用户不是就觉察出来你分给人家的 1G 空间是假的了吗?所以可以不分配那么多人,只分配给 19000 人,剩下一些空间做应急之用。

突然发现一下子将可分配的用户数量翻了 19倍啊,了不起。那还有买有办法更加有效的利用一下呢?

如果我有 1000个 以上的服务器,一个服务器上有 1000G 空间,那么我们个服务器上都要留下 50G 的空白空间以备用户突然上传大数据时导致数据塞满的情况,呢么我这 1000个服务器上就空出了 1000台*50G=50000G 的空间被浪费了,所么可惜。所以我们发明了计存储集群,使得一个用户的数据可以被分配在多个服务器上存储,但在用户那看起来只是一个 1G 的连续空间,那么就没必要在每个服务器上预留出应急的空间了,甚至可以充分的将前一个服务器塞满后,在将数据往下一个服务器中塞。这样保证了服务器空间的最大利用,如果某一刻管理员发现用户都在疯狂上传数据(在一个大规模用户群下,这样的概率少之又少)导致我现有提供的空间不够了,没关系,只需要随手加几块硬盘或者服务器就解决了。

好吧,这下子我们的服务器空间利用高多了,可以将一定量的空间分配给最多的用户使用了。但有没有更好的改进方案呢?

管理员有一天发现,即使每个用户平局下来只存储 50M 的东西,但这 50M 也不是一蹴而就的,是随着1-2年的使用慢慢的达到这个数量的,也就是说,一个新的用户刚刚注册我的网络空间时,不会上传东西,或者只上传一点非常小的东西。那么我为每一个用户都初始分配了 50M 的空间,即使将来2年后他们会填满这 50M ,但这期间的这空间就有很多时浪费的啊。所以聪明的工程师说:既然我们可以分布式、集群式存储,一个用户的数据可以分布在多个服务器上,那么我们就假设一开始就给一个新注册的用户提供 0M 的空间,将来他用多少,我就给他提供多少存储空间,这样就彻底的保证硬盘的利用了。但用户的前端还是要显示 1G 的。

工程师的这个点子,使得我在建立网盘初期能用 1台 1000G 的服务器提供了大约 1000000 人来注册和使用,随着注册的人多了,我也有钱了,也可以不断增加服务器以提供他们后期的存贮了。同时因为一部分服务器完了一年多购买,我的购买成本也下来了。

那么…这结束了吗?

若是邮箱提供商的话,这样的利用率够高了。但网盘就不一样了。

聪明的工程师发现:不同于邮箱,大家的内容的附件绝大多数都是自创的和不同的。但网盘上大家上传的东西很多都是重复的。

比如:张三 今天下载了一部《TOKYO HOT》上传上传到了自己的网盘上,李四在三天后也下载了一模一样的《TOKYO HOT》上传到了网络硬盘上,随着用户的增多,你会发现总计有 1000个人 上传了 1000份 一模一样的文件到你宝贵的服务器空间上,所以工程师想出一个办法,既然是一样的文件,我就只存一份不久好啦,然后在用户的前端显示是没人都有一份不久行啦。当某些用户要删除这个文件的时候,我并不真的删除,只需要在前端显示似乎删除了,但后端一直保留着以供其他拥有此文件的用户下载。直到所有使用此文件的用户都删除了这个文件我再真的将其删除吧。

这样子随着存储的数据越来越多,注册的用户越来越多,其上传的重复数据越来越多。你发现这样的检测重复文件存储的效率越来越大。这样算下来似乎每个人上传的不重复的文件只能平均 1M/用户。这下子你可以提供超过 50倍 的用户使用您这有限的空间了。

但伴随这使用,你又发现一个规律:

张三上传的《TOKYO HOT N0124》和李四上传的《TH n124》是同一个文件,只不过文件名不一样,难道我就不能识别出他们是一个文件,然后只将其分别给不同的用户保存成不同的文件名不久行啦?确实可行,但这要利用一些识别文件相同性的算法,例如 MD5 值等。只要两个文件的 MD5 值一样,文件大小一样,我就认为它们是相同的文件,只需要保存一份文件并给不同的用户记作不同的文件名就好了。

有一天你发现,因为每一个文件都需要计算 MD5 值,导致 CPU 负荷很大,而且本来一样的文件非要浪费带宽上传回来才可以检测一致性,能改进一下吗?

聪明的工程师写了个小软件/.小插件,美其名曰“上传控件”,将计算 MD5 的工作利用这个软件交给了上传用户的点老来完成,一旦计算出用户要上传的数据和服务器上已经存储的某个数据是一样的,就干脆不用上传了,直接在用户那里标记上这个文件已经按照 XX 文件名上传成功了。这个过程几乎是瞬间搞定了,并给其起了个高富帅的名字“秒传”!

通过以上这么多步骤,你发现本来你只能给 1000用户 提供网络空间的,这么多改进办法后,在用户端显示 1G 空间不变的情况下,近乎可以为 1000000个用户 提供网络空间了。

这样若是您哪天心情好,对外宣传说:我要将每个用户的存储空间上限提升到 1TB。那么每个用户平均还是只上传 50M 数据,只有极个别极个别的用户上传了突破 1G 原始空间的数据,你会发现所付出的成本近乎是微乎其微的。

辛勤的工程师还在为如何更有效率的利用服务器提供的磁盘空间在不屑努力和挖掘着……

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至253000106@qq.com举报,一经查实,本站将立刻删除。

发布者:卢松松,转转请注明出处:https://www.chuangxiangniao.com/p/1070484.html

(0)
上一篇 2025年1月13日 16:44:02
下一篇 2025年1月13日 16:44:24

AD推荐 黄金广告位招租... 更多推荐

相关推荐

  • 微信视频号火力全开,新增直播三件套+巨大流量入口

    当我们大部分人,做一件事情,经常性地会问要干什么,及其如何做,也就是what和how。 但如果我们干了一阵子,便会发觉,相同行业里边,同一件事情,总有人做得不错。 这也使我们感觉到焦虑情绪,羡慕嫉妒的同時,便会想: 是否都能够效仿借鉴呢? …

    2025年1月14日
    100
  • 传统生意以及门店如何做引流,让你的业绩翻倍

    传统生意难做,线下门店难做。 各种支出,各种成本,各种不确定性,各种政策也在变。 所以要想让营业额良性增长,可持续赚钱就要做好私域以及门店的引流获客和用户运营。 想要做好引流以及用户运营,就要先准备好私域四件套:微信群、微信个人号(企业微信…

    2025年1月14日
    100
  • 设计前端诱饵,引爆流量

    很多人说我有产品,但是不知道怎么找流量,不知道怎么引流。 没有流量,就没有转化,没有转化就没有盈利。 所以产品是1,流量是1后面的0。 产品是基石,流量是顶梁柱。 不管是做线下传统行业还是互联网行业,都离不开流量。 说白了流量即市场。 没有…

    2025年1月14日
    100
  • 小红书的引流方法,简单可上手

    做小红书一定要重视搜索流量,搜索就是用户有需求、痛点,然后通过关键词去搜索然后能够搜索到我们排在前面。只要我们能够生产出好的内容,然后埋好搜索关键词、引导用户互动的点、引流的点,然后就等着用户过来搜索就好了。 而想要排在前面就要能够让系统推…

    2025年1月14日
    100
  • 打造个人IP之私域引流

    私域引流主要是说把流量引流到微信公众号和微信个人号。一般微信个人号就是一个私域用户池。 公众号和个人号是封闭的,要想长期持续获得流量,就必须在公域平台持续输出内容,再将用户吸引到私域。或者通过其他方式将用户引流到私域。想要引流涨粉的前提是做…

    IT业界 2025年1月14日
    100
  • 做自媒体、个人品牌、个人IP、私域用户池的几个要点分享给你

    01 其实我们现在不管是做自媒体、个人IP、个人品牌、还是做私域用户池,是要靠时间沉淀的,是要靠一次次的价值输出沉淀的,最后沉淀下来的是一批忠实的用户,沉淀下来的是信任度,这种信任度不是想模仿就能够模仿的。 我认为现在最好的营销就是分享、提…

    2025年1月14日
    100
  • 详解如何打造个人IP?

    最近我一直在思考IP是什么,怎么去打造自己的个人IP。现在互联网极大地放大了个人的能力,所以,未来个人IP会变得越来越重要,这是趋势。 其实我觉得IP简单来说就是:专注+专业+垂直+坚持+持续输出+利他+价值+信任+积累+耐心。 做IP要让…

    2025年1月14日
    100
  • 玩赚闲鱼项目赚钱和引流

    闲鱼作为一个二手为主的交易平台近几年一直收到大众的青睐,流量极大的平台同样也更容易引流。 闲鱼相比其它二手交易平台,它的鱼塘功能相当出色,不仅能划分地域还能把各类买卖需求的用户按照需求分类,同类需求的用户集中,卖家的目标用户十分精准。 鱼塘…

    2025年1月14日
    100
  • 3个步骤,让你知道究竟该如何运营个人微信号

    之前说过随着时代的发展,即时通讯软件、社交软件已经成为人们生活中和工作中必不可少的存在了。在国内,微信是一家独大,可以说基本上是没有竞争对手,而且现在微信日活跃用户已经达到10亿以上。现在很火的一个词“私域流量“是怎么也绕不开微信的,微信就…

    IT业界 2025年1月14日
    200
  • 公域拉新,私域掘金

    以后的流量会越来越贵,想要提高用户的终身价值,想要提高业绩以及利润。就要懂得在公域拉新,私域掘金。 公域拉新,拉的是新客户,私域掘金,掘的是客户的终身价值,掘的是后端价值。降低前端新客的进入门槛,提高后端的客户价值。 公域引流,私域沉淀,公…

    IT业界 2025年1月14日
    100

发表回复

登录后才能评论

联系我们

156-6553-5169

在线咨询: QQ交谈

邮件:253000106@qq.com

工作时间:周一至周五,9:30-18:30,节假日休息

联系微信