您现在的位置是:首页 > 网络趣梗网络趣梗

大数据平台架构设计,大数据系统架构图

2022-08-27 12:17:29网络趣梗0人已围观

简介  
大数据:顾名思义,就是大量的数据

  大数据:顾名思义,就是大量的数据。但是,就此打住就太敷衍了。大数据除了体量大还有其他几个特点:借用5V理论,体量大,速度快,多样,价值密度低,真实可信。因为这五个单词的英文都是V开头的,所以叫5V。

  但在普通人眼里,大数据是被误解的,很多人把大数据理解为用户的隐私。比如我今天早上刚在网上搜了买房的信息,今天下午就有中介打电话给我推荐一套二手房给我。诸如此类的事情比比皆是。我们每个人几乎每天都被骚扰电话困扰。除了广撒网,很多骚扰电话可以非常精准的匹配你的需求。当你需要钱的时候,会有人给你打电话,推荐你贷款;当你想买房的时候,房产中介会给你打电话,推荐二手房;当你想买车的时候,4S店里的人会给你打电话……总之,不管你想做什么,总会有一个陌生人突然给你打电话,卖给你你刚刚想到的东西。

  隐私数据无处不在。

  真的很可怕,但这不是我今天想说的。今天我要谈谈大数据技术。以上是个人隐私泄露,其中一部分确实得益于大数据技术的发展,但更重要的原因是大家和整个社会对个人隐私数据的保护力度不够。好在我国相关立法部门正在重点关注这一领域,未来我们每个人的隐私数据都会得到越来越好的保护。

  那太远了。让我们回到大数据技术。大数据技术是因为近年来,工业互联网和工业互联网产生了大量的数据。为了处理这些数据,准确的说是为了处理这些数据更方便、更快捷、更便宜,于是大数据技术应运而生。工业互联网离我们太远了,所以我们暂时不谈这个。先说产业互联网,更狭义的是指我们的移动互联网。随着4G的到来,手机正成为人们不可或缺的工具,人们每天花在手机上的时间越来越多。自然,人们会在手机上保存越来越多的数据。购物、吃饭、乘车、打车、刷短视频、看新闻、聊天、工作、学习、看电影、看综艺、玩游戏……你可以自己查看手机上安装了多少app。这么多app组成了每个人的基本画像。为了处理这个海量的数据,为了让这个海量的数据跟我们说话,告诉我们有价值的信息,告诉我们每个人的喜好,智能技术人员发明了大数据技术。

  因为IT界的开源概念,大数据相关的技术很多。最著名的是Hadoop家族,这也是世界上最流行的大数据框架。Hadoop系谱见下图:

   Hadoop家族

  以上是大数据技术的通俗解释。说白了,这个东西就是一个技术,处理海量数据的技术。为什么要处理海量数据?因为数据只有经过处理才有价值,不经过处理就是一堆占用存储资源的无用垃圾。这种处理包括数据采集、数据存储、数据清洗、数据集成、数据挖掘、数据探索、数据开发等等,最终形成我们想要的数据,为我们做决策提供依据。这些决策可以是大端未来的商业策略,也可以是小端手机向用户推荐的视频和商品。几乎所有的互联网巨头都是大数据技术应用的高手,我们平时看到的大数据开源框架几乎都是由那些互联网巨头主导和开源的。这种技术只能像互联网一样被土壤孕育,因为他们需要;传统企业甚至传统IT企业都做不了这样的研发,因为不需要。这又是一句名言:技术的发展永远是为需求服务的。

  从具体的技术细节来看,大数据不是一个系统或软件,而是一种技术,一种数据处理方法或一个平台,它包括很多组件,比如Hadoop平台。这个平台可以按上图组合,也可以根据实际情况自行组合。一切以实际需要为准。

  数据平台架构图

  大数据技术是跨领域的技术,大数据平台是集成平台。你在市场上买不到一个大数据软件,但是你可以找到能提供大数据服务的公司。他们可以提供咨询、实施和服务。在实现和服务的过程中,你会发现你所购买的不是一个软件,甚至不是几个软件,而是一堆软件的组合,加上一系列的实现方法论,以及前人的经验。

  大数据技术就像一块积木,灵活多变,但唯一不变的是,它服务于每一个客户、每一个用户的需求。

  未来,数据将是每个公司的核心资产,随着人们对数据资产重要性认识的提高,大数据技术将变得越来越重要。

Tags: 网络趣事  

很赞哦! ()

随机图文

留言与评论 (共有 条评论)
验证码:

本栏推荐