专业的短链接生成工具
链接域名
短网址有效期
数据的进化:从小数据到大数据再到全数据
更新时间:2025-6-1 11:19:38 作者:爱短链
做小数据研究的人会被淘汰吗? 如今,大数据行业十多年来一直很强大。
回顾数据蔑视链底层的传统市场研究公司,新兴的大数据公司未能完全消除传统的小数据公司。
相反,我们也看到一些传统的市场研究公司积极拥抱大数据,成为数据智能服务提供商,找到了公司业务增长的新曲线,业务规模没有减少而是增加。
人们不禁要问,为什么大数据不能完全取代小数据?今天,让我们来谈谈小数据和大数据之间的关系。
1、大数据和小数据的基本概念 大数据的概念一直有不同的看法。
首先,近年来,每个人都变得更加务实。
他们不再与大数据的概念纠缠在一起,而是更加关注大数据的应用场景和价值。
为了写作的需要,这里简要介绍一下基本概念。
关于大数据的定义有两种相对权威的说法。
首先,麦肯锡全球研究所给出的定义是:数据收集大于传统数据库软件工具的获取、存储、管理和分析,数据规模大,数据流快,数据类型多样,价值密度低;其次,在维克托·迈尔-舍恩伯格,肯尼斯·库克耶在《大数据时代》中指出,大数据是指利用所有数据进行分析处理,而不是随机分析(抽样调查)。
此外,IBM大数据提出的5V特点:Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度),Veracity(真实性),也被业内人士普遍认可。
小数据是什么?(Small Data)那怎么样?在百度百科全书中,互联网研究员吕兰涛给出了以下定义:小数据是指需要新的应用方法来反映高价值的个人、高效、个性化的信息资产。
例如,通过智能家用电器、手机、平板电脑、可穿戴产品可以收集个人的一举一动,这些个人信息资产是个人色彩丰富的小数据。
以上对大数据和小数据的定义有一定的原因。
为了便于比较和表达,我将大数据定义为由结构化数据和非结构化数据组成的数据集合,并将小数据定义为面向特定用户群体的结构化数据。
二、大数据和小数据的区别比较 大数据和小数据有什么区别?以下是对属性层面和应用层面的比较和分析。
1、 属性层面 数据获取方法:大数据一般通过爬虫、埋点、API通过其他方式获取数据,几乎所有的数据获取都交给机器进行处理,具有较高的自动化程度。
小数据通常依赖于人工数据采集,如传统的实证调查,如问卷调查、电话调查、街道拦截调查等。
表现形式:大数据多为非结构化和半结构化数据,小数据以结构化数据为主; 数据量级:至少大数据TB以上级别的数据量通常是小数据MB等级数据; 实时性:实时数据在大数据中所占比例较高,而小数据一般具有一定的滞后性; 数据质量:大多数大数据处于混乱状态,数据缺失、代码混乱、异常值较为常见,小数据一般经过严格的标准化和统一处理,数据质量相对较高; 数据处理技术:大数据往往采用爬虫技术、埋点技术、分词技术、可视化技术、机器学习算法等复杂的数据处理技术。
数据处理技术难度大,技术要求高,一般需要搭建大数据平台进行处理。
由于小数据处理量小,以结构化数据为主,数据处理简单,一些常用的数据分析工具可以轻松处理。
2、 应用层面 范围和对象:大数据注重对所有用户的分析,分析的内容往往侧重于群体行为,即表面数据分析,如双11网上购物的大数据分析。
小数据的对象通常是抽样用户,通常更关注单个用户的行为分析,即点数据分析,个性化是小数据的特征之一; 知识发现过程:大数据注重预测,小数据注重决策。
大数据的分析方法是自下而上的知识发现过程,从复杂的数据和不确定性中发现规律。
小数据分析通常采用统计方法,首先找到特定用户组的规则,然后具体分析单个用户的情况,分析方法自上而下; 数据分析深度:大数据擅长全球实时感知和分析,如交通流量监控、舆论监控等应用。
由于对象清晰,分析更集中、更有针对性,分析内容更深入、更准确。
分析导向性:大数据注重相关性分析,关注结果而不纠结于为什么,通过相关性给出问题的解决方案,因此大数据分析的结果往往解释性较弱。
小数据通常以结果为导向,关注因果关系分析,关注现象背后的内部机制和业务逻辑。
因此,小数据的分析结果具有很强的可解释性。
三、大数据与小数据共生 在过去的十年里,可以说是大数据和小数据之间的爱和杀戮时期。
从表面上看,大数据行业发展迅速,小数据公司日益衰落。
事实上,大数据产业的发展并不顺利,小数据产业也从不愿意被淘汰。
虽然大数据有其优势,但小数据也有其不可替代的特点。
通过多年的实践,不难发现大数据并不是万能的,小数据仍然有其独特的价值。
使用数据的最好方法是吃大吃小,并驾齐驱。
未来仍将是大数据和小数据共存的全数据时代,而能够同时控制大数据和小数据的公司将更具竞争力。
如何同时控制大数据和小数据?作者认为,至少有三种方式:从大到小,从小到大,从小到大。
1、从大到小:利用大数据维度、变量的特点,可以进行全用户行为聚类分析,得到一些典型的用户组特征,对于这些组用户可以使用市场研究方法进行深入研究和分析,从表面了解全用户的全貌,也可以从在线洞察组用户组,甚至深入具体的点单用户特征。
此外,通过大数据对所有用户进行聚类和分组后,可以更有效地指导用户调查中的抽样策略,减少样本配额的偏差。
从大到小,就是从大数据中找到适合小数据的场景,帮助小数据锁定要聚焦的用户,然后用小数据的研究方法深入探讨大数据分析结果的原因。
2.从小到大:小数据在用户心理、态度和情感方面的深入研究具有独特的优势。
当我们通过深入访谈和小组研讨会对少数用户进行深入分析时,我们可以获得一些典型用户群的肖像模型和特征标签。
例如,当我们需要针对更多的用户群体进行有针对性的广告时,我们可以将这部分用户视为种子用户,并在小数据方法获得的种子用户标签的基础上扩大类似群体的规模,以找到更多符合要求的用户群体。
使用这个lookalike该方法获得的新用户群可以通过大数据分析进一步研究其行为特征和广告后的响应。
从小到大,一方面是指研究对象从个人或小范围扩展到更广泛的用户群,提高产品或营销的覆盖范围,另一方面,分析的维度可以在小数据的基础上进一步扩展和丰富。
3.大小结合:大数据和小数据各有优缺点。
大数据重分析,轻情感;小数据重态度,轻行为。
大数据的挖掘取决于计算机,掘靠个人能力。
大数据弥补了小数据实时性和单一维度的不足,小数据不仅可以有效地补充大数据,还可以挖掘用户行为的深层动机。
大数据和小数据可以深度融合,相辅相成。
对于同类用户群,大数据负责行为数据的综合分析,小数据负责心理和态度的点线分析,有利于用户洞察力的更全面。
从大数据中获效的数据应用方小数据来匹配个人,将是一种更有效的数据应用方法。
总之,大数据时代的到来并不意味着小数据时代的结束。
大数据与小数据对立,但最终会统一。
大数据和小数据不是颠覆和颠覆的敌对关系,而是替代和替代。
相信在不久的将来,大数据和小数据之间的界限最终会模糊,大、中、小、小数据将在全数据时代相遇并共存。
从小数据到大数据,再到全数据的演变,全用户和全域数据的智能时代终将到来。
-END- 特别说明:本网站的主要目的是收集与互联网运营相关的干货知识,为运营伙伴提供便利。
本网站收集的公共内容来自互联网或用户的贡献,这并不意味着本网站同意其观点,也不对网站内容的真实性负责。
如有侵权行为,请联系网站管理员删除,。