最新动态

news

你知道数据仓库,数据挖掘,bi三者之间的区别和联系吗?

2021-02-01 来源: 科技测评师

分享到:

数据仓库:数据仓库顾名思义,是一个很大的数据存储集合,面向主题的,集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。对多样的业务数据进行筛选与整合。它为企业提供一定的bi(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。数据仓库的输入方是不同的数据源,比如:有的数据存在mysql里,有的数据存在mongdb里,还有一些第三方的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。多数据源通过etl(extract-数据抽取;transform-数据转换;load-数据加载)集成。还有数据仓库和数据库的关系,这里在网上找了个图,讲的还是比较清楚的。面向业务的数据库常称作oltp,面向分析的数据仓库亦称为olap数据挖掘:数据挖掘看穿你的需求,广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是bi。但从技术术语上说,数据挖掘(data mining)特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的提炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测、支持决策。bi经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的crm、erp、oa等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为oltp(online transaction process,在线事务处理),指的就是系统运行了一段时间以后,必然帮助企事业单位收集大量的历史数据。但是,在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。业务人员所需要的是信息,是他们能够看懂、理解并从中受益的抽象信息。此时,如何把数据转化为信息,使得业务人员(包括管理者)能够充分掌握、利用这些信息,并且辅助决策,就是商业智能(bi)主要解决的问题。如何把数据库中存在的数据转变为业务人员需要的信息?大部分的答案是报表系统。简单说,报表系统已经可以称作是bi了,它是bi的低端实现。 现在国外的企业,大部分已经进入了中端bi,叫做数据分析。有一些企业已经开始进入高端bi,叫做数据挖掘。而我国的企业,目前大部分还停留在报表阶段。目前国内现在做bi的厂家有很多,比较知名的bi厂家比如:永洪科技,核心产品yonghong-z-suite帮助企业构建大数据应用,也有很丰富的行业积累,政府,电力,能源,金融等等,有兴趣可以自己查些资料。系吗?

  数据仓库:

  数据仓库顾名思义,是一个很大的数据存储集合,面向主题的,集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。对多样的业务数据进行筛选与整合。它为企业提供一定的bi(商业智能)能力,指导业务流程改进、监视时间、成本、质量以及控制。

  数据仓库的输入方是不同的数据源,比如:有的数据存在mysql里,有的数据存在mongdb里,还有一些第三方的数据源,最终的输出用于企业的数据分析、数据挖掘、数据报表等方向。

  多数据源通过etl(extract-数据抽取;transform-数据转换;load-数据加载)集成。

  还有数据仓库和数据库的关系,这里在网上找了个图,讲的还是比较清楚的。

  面向业务的数据库常称作oltp,面向分析的数据仓库亦称为olap

  数据挖掘:

  数据挖掘看穿你的需求,广义上说,任何从数据库中挖掘信息的过程都叫做数据挖掘。从这点看来,数据挖掘就是bi。但从技术术语上说,数据挖掘(data mining)特指的是:源数据经过清洗和转换等成为适合于挖掘的数据集。数据挖掘在这种具有固定形式的数据集上完成知识的提炼,最后以合适的知识模式用于进一步分析决策工作。从这种狭义的观点上,我们可以定义:数据挖掘是从特定形式的数据集中提炼知识的过程。数据挖掘往往针对特定的数据、特定的问题,选择一种或者多种挖掘算法,找到数据下面隐藏的规律,这些规律往往被用来预测、支持决策。

  bi

  经过几年的积累,大部分中大型的企事业单位已经建立了比较完善的crm、erp、oa等基础信息化系统。这些系统的统一特点都是:通过业务人员或者用户的操作,最终对数据库进行增加、修改、删除等操作。上述系统可统一称为oltp(online transaction process,在线事务处理),指的就是系统运行了一段时间以后,必然帮助企事业单位收集大量的历史数据。但是,在数据库中分散、独立存在的大量数据对于业务人员来说,只是一些无法看懂的天书。业务人员所需要的是信息,是他们能够看懂、理解并从中受益的抽象信息。此时,如何把数据转化为信息,使得业务人员(包括管理者)能够充分掌握、利用这些信息,并且辅助决策,就是商业智能(bi)主要解决的问题。

  如何把数据库中存在的数据转变为业务人员需要的信息?大部分的答案是报表系统。简单说,报表系统已经可以称作是bi了,它是bi的低端实现。 现在国外的企业,大部分已经进入了中端bi,叫做数据分析。有一些企业已经开始进入高端bi,叫做数据挖掘。而我国的企业,目前大部分还停留在报表阶段。目前国内现在做bi的厂家有很多,比较知名的bi厂家比如:永洪科技,核心产品yonghong-z-suite帮助企业构建大数据应用,也有很丰富的行业积累,政府,电力,能源,金融等等,有兴趣可以自己查些资料。



责编:梅亚川