有用管理大数据的五大战略
- 时间:2013-06-04
- 泉源:
尊龙凯时(泉源:机房360 作者:不详)
据悉,Gartner最近的一份视察报告显示,企业数据年平均增添速率约莫在40%到60%。而美国政府在即将到来的大数据项目中将面临重重挑战,其中之一就是天生数据量缺乏。一些天生大宗数据机构(包括国家天气服务局、国家海洋和大气管理局)的主管政府部分,美国商务部的这一数字甚至更低。
美国商务部CIOSimonSzykman在最近的FOSE大会上体现:“我们不保存挑战的领域之一就是我们天生数据的能力。我们天生数据的基本能力提升很大,从很洪流平上讲,这一能力已逾越了我们处置惩罚数据、管理数据和转移数据的能力。”
怎样管理数据,并将数据从一点转移到另一点,将是美国政府面临的一大挑战。Szykman还提到了商务部在大数据中遇到的其他一些主要问题,主要为以下五个方面:
数据的真实性
大数据的主要性不但是在于数据所天生的纪录,更大的价值在于凭证这些数据得出科研效果的“复制能力”。而从学术层面来看,这正是你证实所做事情价值的时间:其他人也可以对效果举行复制。另一方面,若是你丧失了得出科研效果的那些数据,这会降低效果的合理性。
数据工程师
研究领域的许多科学家正在研究大数据的细密使用,好比在预防医学、药品设计和胎儿检查领域怎样开发基因数据。但Szykman担心的是,真正相识大数据手艺构架的人太少。我们需要好好想想大数据及我们怎样使用它,特殊是在一些特殊领域。无论是政府的直接应用照旧由政府出资科研,政府都在推动大数据这一前沿手艺的生长。
大思绪,早妄想
在向开放数据转移的历程中,尽早搞清晰系统生命周期的要求显得越来越主要。在已往,没有做的一件事就是尽早研究开放数据在生命周期上的要求。数据模子、分享和信息的情形会越来越普遍,而系统性的战略会越来越多。在生命周期的早期,当我们乐成装置新的系统或应用程序后,就应该尽早思量该问题。
保密性vs完整性
关于那些有科研基础的机构而言,大数据清静不但仅是一个保密问题。数据的恒久完整性也是企业更大的担心。这是IT界一直为之起劲的议题。有时间,我们太过关注效果而忽视了清静。人们有时会问:‘我们最终都要和公众分享这一数据,那清静有什么主要呢?’
这一问题的最佳谜底来自科研机构,如NOAA。他们网络的基准数据正巧是美国天气转变政策备受争议所在。不管这些政策的政治倾向性怎样,它们都对经济有重大影响。若是我们放弃了这些恒久天气纪录数据的清静性,那将造成严重效果。我们简直得好好想想大数据的问题。
制订基准线
由于很少保存类似的应用程序,难以获取相关信息或举行比照,因此有时间很难评定大数据以及其他高科技项目的开支和危害。出台开支和危害的基线,对大数据和数据中心来说都是一大挑战,由于还没有相关标准。操作一些简朴事情有时间充满挑战,如盘算数据中心的能耗。大数据基线不但在基础设施层面,还包括数据包,都需要对未来资源举行更优妄想。