大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
//最小的基本单位是bit按顺序给出所有单位:bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。//它们按照进率1024(2的十次方)来计算:1 Byte =8 bit1 KB = 1,024 Bytes = 8192 bit1 MB = 1,024 KB = 1,048,576 Bytes1 GB = 1,024 MB = 1,048,576 KB1 TB = 1,024 GB = 1,048,576 MB1 PB = 1,024 TB = 1,048,576 GB1 EB = 1,024 PB = 1,048,576 TB1 ZB = 1,024 EB = 1,048,576 PB1 YB = 1,024 ZB = 1,048,576 EB1 BB = 1,024 YB = 1,048,576 ZB1 NB = 1,024 BB = 1,048,576 YB1 DB = 1,024 NB = 1,048,576 BB//全称:1 Bit(比特) =Binary Digit8 Bits = 1 Byte(字节)1,000 Bytes = 1 Kilobyte1,000 Kilobytes = 1 Megabyte1,000 Megabytes = 1 Gigabyte1,000 Gigabytes = 1Terabyte1,000 Terabytes = 1 Petabyte1,000 Petabytes = 1 Exabyte1,000Exabytes = 1 Zettabyte1,000 Zettabytes = 1 Yottabyte1,000 Yottabytes = 1Brontobyte1,000 Brontobytes = 1 Geopbyte
应用
洛杉矶警察局和加利福尼亚大学合作利用大数据预测犯罪的发生
Google流感趋势(Google Flu Trends)利用搜索关键词预测禽流感的散布统计学家内特·西尔弗(Nate Silver)利用大数据预测美国选举结果麻省理工学院利用手机定位数据和交通数据建立城市规划梅西百货的实时定价机制。根据需求和库存的情况,该公司基于SAS的系统对多达7300万种货品进行实时调价医疗行业早就遇到了海量数据和非结构化数据的挑战,而近年来很多国家都在积极推进医疗信息化发展,这使得很多医疗机构有资金来做大数据分析
大数据特点:
主要特点
海量化(Volume)
数据量从TB到PB级别
多样化(Variety)
数据类型复杂,超过80%的数据是非结构化的
快速化(Velocity)
数据量在持续增加(两位数的年增长率)
数据的处理速度要求高
高价值(Value)
在海量多样数据的快速分析下能够发挥出更高的数据价值
大数据能做什么
海量数据背景下
快速查询 - 全量查询
数据存储 - 量大,文件大
快速计算 - 对比传统方案
实时计算 - 最新数据
数据挖掘 - 新价值