大数据并非一个确切的概念,这个概念一方面指数据体量巨大,超出一般电脑所处理数据量几个级别;另一方面也指处理的数据类型多样化,远远超出传统数据格式和分析工具能处理的范畴。也有观点指大数据是指不用抽样方法得到的数据。
与实验科学、理论分析和计算机模拟这三种经典科研范式相比,大数据科学将成为一种全新的科研范式。
数据无处不在,麦肯锡全球研究院预测,到2020年,全球数据使用量预计相对于2011年将暴增44倍,达到35ZB。具体而言,数字信息从各种各样的传感器、测试仪器、模拟实验室、文化娱乐企业和个人使用的数字终端中源源不断地涌出。报告称,超过传统数据库系统处理能力的海量数据即大数据隐含巨大价值,以网络数据为例,报告称,网络数据之间的相互关系其实是人与人的相互关系。
然而,这其中许多数据缺失、重复或是没有价值。对科学家而言,未来的主要任务不是获取越来越多的数据,而是进行数据的去冗分类,去粗取精,从数据中挖掘知识。报告称,几百年来,科学研究一直在做“从薄到厚”的事情,把“小数据”变成“大数据”,而现在要做的事情是“从厚到薄”,要把“大数据”变成“小数据”。
生命健康大数据与医药健康产业发展有着重大的关系,有兴趣的可以参考华大基因董事长汪建在“生态文明贵阳国际论坛2014年年会”分论坛所作的题为《大数据与医药健康产业智“惠”发展》的讲座,分别从跨组学大数据,控制出生缺陷,减少肿瘤、心脑血管病发生率及死亡率等几个方面深入浅出地阐述了生命健康大数据与医药健康产业发展的关系。
我要很醒目 开发者_运维百科 2021-10-31 00:51
个人觉得,从科研的角度来看的话,与大数据关联性比较大的学科应该要书生物信息学了。
生物信息学时计算机科学在生物研究领域的体现。生信的数据量会随着测序物种的持续增加以及测序费用的逐步降低而增大,在生物学研究方面,该数据量主要包含两方面的内容,一是基因组数据,大的几百兆;另外就是后基因组数据了,包括对基因组数据的组装与注释而产生的大量数据。
精彩评论