2013年7月17日,习近平总书记到中国科学院视察工作并发表了重要讲话,他在讲话中就指出,浩瀚的数据海洋就如同工业社会的石油资源,蕴含着巨大生产力和商机,谁掌握了大数据技术,谁就掌握了发展的资源和主动权。习近平总书记的重要讲话,深刻揭示了大数据对当今世界发展的重大战略意义,具有很强的战略性和前瞻性,对中国加快发展大数据具有重大指导意义。最近几年,中国大数据飞速发展,对经济社会各个方面都产生了深刻影响,得到各方面的高度关注。贵州在大数据方面走在了前列,2017年“中国国际大数据产业博览会”(以下简称“数博会”)将让世界更深地了解贵州大数据的发展,也将对未来大数据研究、开发和应用产生深远影响。
随着互联网、云计算、移动通信等相关领域技术的快速发展,大数据在数据采集存储、分析处理等关键技术方面取得一系列新突破,呈现出加速发展的趋势,全方位进入到产业经济、社会管理和我们的工作、学习、生活之中,可以说我们已经生活在一个无形的“数据海洋”之中。据国际数据公司(IDC)统计,目前全球数据总量每年都以倍增的速度增长,预计到2020年将达到44万亿GB。中国的数据总量也呈现出高速发展的态势,预计到2020年将占全球的近20%。这次数博会将以多种方式进行数字传播,估计会产生上万GB的数据量。
现在,越来越多的人认识到,大数据具有可以反复使用、不断增值的特点,蕴藏着巨大的价值和潜力,是与自然资源、人力资源一样重要的战略资源。大数据对经济社会发展产生了巨大推动作用,也为我们的生活带来了深刻改变,突出体现在五个方面。
一是大数据在引领经济社会发展中新引擎作用更加凸显。
据估计,2015年全球大数据核心产业的产值已超过300亿美元,潜在规模超过8000亿美元。有预测认为,到2020年,大数据将带动全球GDP增长超过2%。麦肯锡预测,医疗领域未来10年因采取大数据技术,将使得美国医疗市场获得每年3000亿美元价值,减少2/3的医疗开支。一方面,大数据作为新兴产业,数据采集、数据分析、数据服务已经成为信息产业中最具活力、发展迅速、潜力巨大的细分市场,相关的硬件制造和软件开发也吸引了更多的资金和研发投入。另一方面,大数据与现有产业已经实现深度融合,广泛应用于几乎每个产业领域,大幅提升了生产、管理和决策的科学性和精确性,大幅降低了各环节的成本,加快推动了相关产业的转型升级,生产更加绿色智能,生活更加便捷高效。在制造业领域,运用大数据技术可以高效、精准提供更多个性化服务;在人工智能与先进制造、自动驾驶、金融与商业服务、医疗与健康管理、天气预测、科学研究等领域都有着广泛的应用前景;在社会保障、突发事件监测预警、信用评估、城市管理等方面,也将发挥越来越重要的作用。这次数博会展览馆里有很多企业展出了在大数据方面的应用,开幕式上根据讲话语音实时转换成中文和英文,就是以大数据技术为重要基础的科大讯飞软件实现的。
围绕大数据应用,形成了新的、多样化的创新生态链,重塑了传统产业的发展结构和形态,推动了共享经济的蓬勃兴起和发展,催生了众多的新产业、新业态、新模式,也给我们的衣食住行带来了深刻改变。从中国发展来看,在“互联网+”和大数据战略的政策引导下,大数据应用的广度和深度不断被挖掘、拓展、重塑,由此也带动了全社会掀起新的创新创业热潮。对很多中国人来说,一部智能手机在手,通过支付宝、微信等平台,就能解决生活中绝大部分个性化的需求。比如,滴滴打车、共享单车已经成为很多人出行的主要选择,精准医疗、个性化定制也逐步走进我们的日常生活。
二是大数据成为全球科技和产业竞争的重要制高点。
大数据是信息技术领域又一次技术变革,掌握了大数据核心技术就掌握了信息“制权”。美国2012年就制定了“大数据研发计划”(Big Data Research and DevelopmentInitiative),2014年发布了大数据白皮书(BigDta: Seizing Opportunities,PreservingValues),2016年又启动实施了“联邦大数据研发战略计划”(TheFederal Big Data Research and Development Strategic Plan),积极布局大数据研究,建立大数据研发基地,培养和吸引大数据人才,以保持美国在数据科学和创新领域的竞争力。日本、英国、德国、法国等都围绕大数据发展制定了国家战略。
与此同时,一些信息技术领域领先企业也向大数据产业转型,并加大了对大数据产业的资金投入和研发布局。总体上看,目前美国在与大数据相关的专利、论文产出中,依然占据领先地位,谷歌、IBM、Facebook等在大数据的关键技术和应用开发方面整体上保持着领先地位。在大数据细分市场中,也涌现出一批新兴的龙头企业。比如,世界首家大数据上市公司Splunk,短短几年营业收入就达10亿美元,年增长近50%,市值近100亿美元。
三是科技创新突破将为大数据发展打开新空间。
信息技术硬件软件发展的速度和水平,决定了大数据发展的广度和深度。信息技术在快速发展的半个世纪里,都基本遵循了摩尔定律,相关硬件性能大幅提升,而成本却大幅下降,为大数据发展提供了重要的技术基础。随着纳米尺度的晶体管越来越小,面临物理极限的挑战越来越明显,存储空间、计算速度难以按照摩尔定律无限发展下去。围绕这些制约信息技术发展的重大关键科技问题,科技界、产业界都在积极寻找更有效的解决之道。
在数据储存方面,科学家们一方面致力于现有存储介质、存储硬件软件与系统的改进提升,另一方面也在积极探索新材料和新方法,以实现存储能力更强、功耗更低。比如,科学家已经能够在石墨烯上实现高密度存储的理论上限,即每一个原子代表一个字节,石墨烯有望成为下一代高密度存储介质。最近,DNA存储技术也取得重要进展,这是利用DNA编码方法解决高密度、大规模数据的存储问题,可以在一克DNA中存储上百PB的数据。
无所不在的信息网络,无所不在的人类活动,将持续带来数据的爆炸式增长,对现有的计算能力提出了新的挑战。量子计算机成为解决未来海量数据计算的一条有效途径,而且已经展现出良好应用前景。量子计算具有超快的并行计算能力:求解一个亿亿亿变量的方程组,亿亿次的“天河二号”需要100年,万亿次量子计算机只需0.01秒。最近,中科院潘建伟院士研究团队利用高品质量子点单光子源,构建了世界首台超越早期经典计算机的单光子量子计算机,实现了十个超导量子比特的纠缠,打破了之前公开报道的九个超导量子比特的操纵,使量子计算的发展迈出了实质性一步。中科院还研发了寒武纪芯片、“千万核可扩展全球大气动力学全隐式模拟”软件,对大幅提升大数据分析能力和效率都具有重要价值。
此外,海量数据的存储、处理、服务,都依赖于超大规模的硬件支撑,由此带来的能耗问题也会制约大数据的进一步发展。量子计算机、高性能芯片、高速算法等,既能解决硬件的性能问题,也能解决能耗问题。
四是大数据深刻改变科技创新研究范式。
2008年,英国《自然》杂志发表了以“大数据”为主题的专刊,将大数据列为信息科技领域中一个重要的研究对象和新兴方向,并逐步引起科技界和产业界的广泛认同和关注。通过大数据技术的应用,科技创新的研究方法和手段得到了极大提升,研究对象、范围和层次得到了极大拓展,高效协同成为科技创新的主要组织模式。中科院的空间天文研究、高能物理研究、遥感探测、深海观测等,每天都会产生海量的科学数据。大数据技术为及时深入分析这些科学数据,进而发现新的科学规律、新的科学现象等,提供了强有力的技术方法和手段。
比如,目前世界上最大单口径射电望远镜——500米口径球面射电望远镜(Five-hundred-meter Aperture Spherical radio Telescope,FAST)就与大数据密切相关。FAST突破了射电望远镜的百米极限,拥有30个足球场大的接收面积,与号称“地面最大机器”——德国波恩100米射电望远镜相比,灵敏度提高约10倍,被称为“中国天眼”。2016年9月25日,FAST落成启用,习近平总书记专门致信祝贺。FAST正式运行后,将通过大范围、远距离搜集宇宙各种变化的数据,原始数据流量达到3.8GB/秒,未来10年数据存储需求接近1亿GB,计算能力需求每秒1000万亿次。通过对这些天文大数据的处理分析,将可能搜寻到更多的奇异天体,探测到更多的脉冲星,甚至可以搜索星际通信信号,进而深入研究宇宙起源和演化、星系与银河系的演化等重大科学前沿问题。
五是大数据安全问题引起越来越多的关注。
大数据孕育着很多机遇,大家在享受大数据带来的进步和便利的同时,个人的偏好、健康和财务状况等涉及隐私的数据也被收集、分析。有研究指出,近50%的数据都面临隐私泄露的问题。大数据安全问题成为关注的焦点,如何防止这些数据被过度或非法利用,给政府治理、市场监管、社会管理带来了新的课题。解决好大数据安全问题,从制度层面来说,要通过立法确保大数据资源和技术得到合理应用;从技术角度来说,需要不断提高信息安全技术能力以保障数据安全,目前这方面已有一些重要进展。
中科院在应用量子通信技术解决信息安全方面,开展了一系列重要研究。量子信息加密是基于量子态不可克隆的特性来产生二进制密码,在理论上绝对安全,因为量子态在传输时无法克隆任意量子态,任何窃听拦截量子通信的行为都会改变所截获到的量子态。在量子信息技术应用方面,中科院已将防黑客安全传输距离扩展至200公里,目前正在实施“京沪干线”示范工程。2016年,中科院又成功发射了世界上首颗量子通信实验卫星,成功开展了星地通信实验,已经取得重要进展,有望从技术上有效解决信息传输、处理过程中发生的安全问题。
中国在大数据研究开发应用方面起步较早,并逐步上升为国家战略,得到前所未有的重视和发展。2013年,习近平总书记在视察中科院时,就强调要发展大数据。2014年,国务院《政府工作报告》对大数据发展作了明确部署。2015年,国务院印发了《促进大数据发展行动纲要》。2016年,国家大数据“十三五”规划——《大数据产业发展规划(2016-2020年)》出台,明确将大数据作为基础性战略资源,从国家层面全面推动大数据的发展。
作为中国大数据领军企业,百度、阿里巴巴、腾讯等互联网公司很早就开始应用大数据进行数据挖掘、用户分析、市场预测等,在大数据应用方面走在了世界前列。中国先后批准建立了8个大数据综合试验区。贵州省作为中国最早开展大数据研究、开发和应用的地区之一,2015年率先建设了大数据产业发展试点示范区,2016年成为首个获批的国家级大数据综合试验区,并建设了全国首个大数据工程实验室,在中国大数据综合试验区发展中发挥了引领作用,也取得显著成效。目前,贵州大数据企业超过4000家,产业规模总量达1300亿元,聚集了一批世界500强企业和国内领军企业。贵州已连续成功举办3次数博会,吸引了全球的关注,大数据已经成为贵州一张靓丽的名片。
总体上看,在国家战略的全面支持和推动下,中国大数据已经具备了加速发展的良好基础和独特优势。目前,中国拥有全球规模最大的互联网用户群体,网民超过7亿人,宽带接口超过4亿个,成为全球最重要的大数据市场之一和名副其实的“世界数据中心”,中国大数据“金矿”具有巨大的潜力和价值。从企业、研究机构到个人,围绕大数据进行创新创业的热情持续高涨,显示出前所未有的活力,新技术新模式新业态层出不穷,为大数据发展提供了强劲的动力。中国在大数据方面展现出的发展态势、发展潜力,也将为推动全球大数据进一步发展发挥重要作用。
大数据既是需求和技术驱动下的必然结果,也是解决未来发展诸多问题的有效选择。大数据涉及到科技、社会、伦理等诸多方面,需要我们以更加开放的心态,以创新发展的理念,积极主动适应大数据时代所带来的深刻变革。当前,科技界和产业界要通力合作,重点做好四件事。
第一,要深化国际合作和产学研合作,加强开放创新。大数据研发和应用涉及到众多学科领域和产业行业门类,也涉及到国家与公共安全、知识产权、隐私权等诸多问题,关键技术需求复杂,应用对象复杂。国际科技界、产业界应加强合作,成立国际大数据创新联盟,研究制定国际大数据标准规范,推动有关大数据新技术、新模式的推广应用。加强产学研合作,联合开展海量数据存储、数据清洗、数据分析挖掘、数据可视化、安全和隐私保护等关键核心技术研发,加快发展大数据软硬件产品,加快推动大数据与移动互联网、云计算、物联网的深度融合。
第二,加强开放共享,消除“数据鸿沟”。在充分保障国家和公共安全,有效保护知识产权、商业秘密和个人隐私的前提下,政府应进一步健全完善大数据共享平台,推动开放有关大数据资源,保证大数据资源得到高效利用、发挥更大作用。积极推动政府、科研机构、企业间的大数据交流与合作,开放共享大数据的技术成果。同时,要积极推动发达地区向落后地区进行技术转移和人才培养,开展数据服务,打破数据壁垒,缩小“数据鸿沟”。
第三,加强大数据专业人才培养。最近,中国很多大学都开始设立大数据相关专业。要以大数据发展的实际需求为导向,加强大数据相关学科基础建设,推动大学与科研机构、企业联合开展专业人才培养,重点培养面向大数据研发应用的高端技术人才和大数据的专业管理与政策人才。
第四,加强政府治理,保障大数据安全。大数据涉及到国家安全利益、商业秘密和个人隐私,需要在推动大数据的高效利用和开放共享的同时,加强大数据管理的安全规范建设。要积极开展大数据相关的法律、制度、社会、伦理等深层次问题研究,进一步优化完善政府治理,健全完善相关法律法规,明确规范和约束企业、个人的数据使用权益,促进大数据持续健康发展。
中科院作为中国自然科学最高学术机构、科学技术最高咨询机构、自然科学与高技术综合研究发展中心,目前有104个研究所、3所大学,6.8万名员工,770多位院士,80多位外籍院士,在学研究生5.6万人。在大数据方面,中科院有近十个核心研究机构、2000多人的骨干队伍进行研发和应用,拥有大数据分析系统、计算与分析等国家工程实验室,承担了“科学大数据公共服务平台与创新应用”国家大数据工程。以卫星、台站网络、天文望远镜、科考船等重大科技设施为基础,形成了空天地海一体化的科学数据获取能力,目前已存储科学大数据规模达数百PB。
“十三五”期间,中科院将重点加强超级传感器、神经网络芯片、新存储介质、量子计算机、基础算法、网络信息安全等大数据前沿领域的科研布局;在北京、上海、合肥、贵州等地,通过产学研合作等方式,建设一批大数据研究单元和团队;充分发挥科教资源优势,加强大数据专业人才培养;进一步开放各类科技设施和数据资源,为产业界和社会提供大数据技术支撑和服务。目前,中科院已启动“地球大数据科学工程”,努力建设国际领先的数字地球科学平台。希望科技界、产业界、大学开展全方位的战略合作,积极支持和参与“地球大数据科学工程”,共同为大数据发展作出更大贡献。
注:本文是作者在2017年“中国国际大数据产业博览会”开幕式上所作的主旨报告,略有修改。