Home | 简体中文 | 繁体中文 | 杂文 | 打赏(Donations) | 云栖社区 | OSChina 博客 | Facebook | Linkedin | 知乎专栏 | Github | Search | About

Chapter 6. 商业与大数据

Table of Contents

6.1. 大数据的误区
6.2. 数据驱动商业

6.1. 大数据的误区

什么是大数据,大数据一定是非结构化,来自互联网用户,多渠道,多维度,而非企业运营产生的结构化数据,例如订单、财务数据等等,这属于OLAP的范畴。

抓取、存储并对海量人机数据进行分析,然后据此进行预测的能力,这就是所谓的大数据。

大数据这一概念描述的是一种技术生态系统,它使大量非结构化的、不均匀分布的数据能够被捕捉、存储和分析。大数据与之前基于数据库仓库的商业智能BI(Business Intelligence)技术有着划时代的差异。

大数据的概念远远超越了简单的销售点(POS终端)数据以及客户关系管理(CRM)中包含的线层数据,甚至企业资源规划(Enterprise Resource Planning)。他所涵盖的数据包罗万象有着丰富多样的来源,例如图片、文本、网页、社交媒体,还有传统的结构化交易数据。

大数据一词已经被用烂了,Hadoop 更像是一个超级大的网络硬盘。例如某公司将系统日志存放到Hbase中也称为大数据,这是不正确的。仅仅用到大数据概念中的存储环节,这些数据并不能进行分析,预测,为企业提供决策支撑。

在中国95%的大数据实际仍停留在报表阶段,仅仅是换一种技术做报表。实际上使用 Excel 轻松可以应付这种需求,而不需要一个技术团队用各种大数据软件(Hadoop/Hbase/Hive...)堆叠起一个大数据平台。