探析基于大数据环境下的数据安全论文

2024-09-12

探析基于大数据环境下的数据安全论文(共9篇)

探析基于大数据环境下的数据安全论文 篇1

学号:E41314059 姓名:李俊梅 专业:信息安全

一.引言

随着互联网、物联网、云计算等新兴技术的高速发展,各种智能终端、社交网络服务的大量涌现,全球数据量出现了巨幅增长。据相关数据统计,仅在2011年就达到1.8万亿GB。互联网数据中心预计到2020年全球数据将翻50倍。显而易见,真正的大数据时代已经到来。一方面,云计算技术的成熟,为这些多样化的数据提供了存储和运算的平台。与此同时,数据挖掘和人工智能等技术为大数据时代提供了信息参考,大数据的快速发展进一步扩大信息的开放程度,但是随之而带来的数据的安全性,防止数据泄露和保障数据安全已经成为我们研究的课题

二.大数据的概念与特征

大数据本身是一个较为抽象的概念,我们从表面上理解规模庞大的数据,但是随着应用的越来越广泛,对大数据研究越来越深,可以发现大数据不仅是在数量规模上庞大,而且还包括数据结构相当复杂,数据与数据之间的关联程度相当高。大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。当前,普遍较为统一对大数据特征的认识可以用4V来表达:数据规模大(Volume),数据种类多(Varity),数据要求处理速度快(Velocity),数据价值密度低(Value),概括为所谓的四V特性。这些特征让大数据即区别与传统的数据概念,又体现出大数据的复杂。大数据除了有四个特性之外,大数据时代的数据还呈现出其他三个特征。第一个特征是数据类型繁多。第二个特征是数据价值密度相对较低。第三个特征是处理速度快,时效性要求高。这是大数据区分于传统数据挖掘最显著的特征。

三.大数据面临的安全挑战

大数据的广泛应用注定了大数据的安全保卫战必须是持久战。在大数据时代,各种智能终端、互联网社交服务和各种数字化存储无处不在。不得不承认,大数据已经遍布各行各业,互联网的高速发展使得获得数据十分便利,同时也给信息安全带来了巨大的挑战。当前,数据安全的形势也不容乐观,需要保护的数据量增长已经超过了数据总量的增长。首先个人隐私很容易通过互联网泄露,随着社交网络、电子商务的兴起,们之间的联系越来越依赖网络,个人的信息会分散在不同的网络位置,只要将个人的相关数据聚集起来分析,就可以很容易获取个人的相关信息,从而分析出个人的隐私数据。上升到国家层面,大数据也可能给国家安全带来隐患。但是在网络高速发展的今天,如果在大数据处理技术方面落后的话,就可能导致数据的单向性。一些发达国家诸如美国已经开始大数据研发计划,大数据技术的发展和完善有助于增强国家数据的安全性。其次,网络普及化使大数据极易受到攻击。网络的高速发展,各个行业领域利用大数据技术能实现彼此资源共享和数据互通。加之云计算技术的普及,为大数据提供了一个开放的环境,将分布在不同区域的资源进行快速整合,智能化分配,从而实现数据资源的共享。正因为大数据处于一个开放的环境中,吸引黑客对其中的有价值的数据感兴趣,比如个人的银行账户信息等成为主要攻击目标。也就是说,在当今开放的网络化社会,大数据的本身数据量庞大,而且数据之间关联性强,对于黑客而言,只要付出相对低的成本,就可以获得巨大的收益。再次,数据的非结构化对大数据存储提出新要求。在大数据之前,数据存储一般分为关系型数据库和文件服务器两种。而相对于当前的大数据来说,数据类型的多样化也使我们措手不及。如今大数据一般都采用NoSQL数据库存储技术,该技术具有可扩展性和可用性等优点,但该技术仍然存在诸多漏洞,没有内置足够的安全性。所以时常会发生类似于身份验证、输入验证等大量安全问题。最后,计算机技术的发展也增加了安全风险。随着计算机网络技术的发展,各种服务器、防火墙、无线路由等网络设备的更新普及,数据挖掘等新兴技术越来成熟,为大数据智能化采集以及智能化数据分析性提供极大的方便。但是,我们也必须注意到一个问题就是技术的快速发展也会相应地增加了大数据的安全风险。一方面,从大数据本身的安全性来说,自身的防护也有不完善的地方,存在着漏洞。虽然云计算对大数据提供极大的方便,但云毕竟是一个开放的环境,对大数据的安全性无法提供最大的保证;API(Application Programming Interface,应用程序编程接口)访问安全权限控制以及密钥生成、存储技术和数据管理方面的不足都有造成数据泄漏的可能。同时大数据他本身可以成为一个可持续攻击的载体,有大量的恶意代码存在其中很难被发现,从而达到持续隐藏性攻击的目的。另一方面,黑客攻击的技术也在逐步提高,数据挖掘和数据分析技术的原理被黑客利用作为攻击的主要技术。

四.大数据安全策略

4.1 大数据存储安全策略

基于云计算架构的大数据,数据的存储和操作都是以服务的形式提供。目前,大数据的安全存储采用虚拟化海量存储技术来存储数据资源,涉及数据传输、隔离、恢复等的问题。解决大数据的安全存储,一是数据加密。在大数据安全服务的设计中,大数据可以按照数据安全存储的需求,被存储在数据集的任何存储空间,通过SSL(安全套接层)加密,实现数据集的节点和应用程序之间移动保护大数据。在大数据的传输服务过程中,加密为数据流的上传与下载提供有效的保护。应用隐私保护和外包数据计算,屏蔽网络攻击。二是分离密钥和加密数据,使用加密把数据使用与数据保管分离,把密钥与要保护的数据隔离开。同时,定义产生、存储、备份、恢复等密钥管理生命周期。三是使用过滤器。通过过滤器的监控,一旦发现数据离开了用户的网络,就自动阻止数据的再次传输。四是数据备份。通过系统容灾、敏感信息集中管控和数据管理等产品,实现端对端的数据保护,确保大数据损坏情况下有备无患和安全管控。4.2 大数据应用安全策略

随着大数据应用所需的技术和工具快速发展,大数据应用安全策略主要从以下几方面着手:一是防止APT攻击。借助大数据处理技术,针对APT安全攻击隐蔽能力强、长期潜伏、攻击路径和渠道不确定等特征,设计具备实时检测能力与事后回溯能力的全流量审计方案,提醒隐藏有病毒的应用程序。二是用户访问控制。根据大数据的密级程度和用户需求的不同,将大数据和用户设定不同的权限等级,并严格控制访问权限。而且,通过单点登录的统一身份认证与权限控制技术,对用户访问进行严格的控制,有效地保证大数据应用安全。三是整合工具和流程。整合点平行于现有的连接的同时,减少通过连接企业或业务线的SIEM工具的输出到大数据安全仓库,以防止这些被预处理的数据被暴露算法和溢出加工后的数据集。同时,通过设计一个标准化的数据格式简化整合过程,同时也可以改善分析算法的持续验证。四是数据实时分析引擎。数据实时分析引擎融合了云计算、机器学习、语义分析、统计学等多个领域,通过数据实时分析引擎,从大数据中第一时间挖掘出黑客攻击、非法操作、潜在威胁等各类安全事件,第一时间发出警告响应。

4.3 大数据管理安全策略

通过技术措施来保护大数据的安全必然重要,但管理也很关键。大数据的管理安全策略主要有:一是规范建设。大数据建设是一项有序的、动态的、可持续发展的系统工程,一套规范的运行机制、建设标准和共享平台建设至关重要。规范化建设可以促进大数据管理过程的正规有序,实现各级各类信息系统的网络互连、数据集成、资源共享,在统一的安全规范框架下运行。二是建立以数据为中心的安全系统。基于云计算的大数据存储在云共享环境中,为了大数据的所有者可以对大数据使用进行控制,可以通过建设一个基于异构数据为中心的安全方法,从系统管理上保证大数据的安全。三是融合创新。大数据是在云计算的基础上提出的新概念,大数据时代应以智慧创新理念融合大数据与云计算,以智能管道与聚合平台为基础,提升数据流量规模、层次及内涵,在大数据流中提升知识价值洞察力。积极创造大数据公司技术融合平台,寻找数据洪流大潮中新的立足点,特别是在数据挖掘、人工智能、机器学习等新技术的创新应用融合创新。

五.结束语

探析基于大数据环境下的数据安全论文 篇2

1 大数据的概念及特点

大数据就是指数据信息量的规模非常巨大, 从而导致无法以当前的主流工具在合理时间内进行正常的收集处理。它是一种数据量大且数据形式多样化的数据。通过对它概念的研究可以得出它具有以下几个特点: (1) 数据量大。大数据是数据信息来那个超大的资料, 每天都会产生无数的数据, 而且信息数据级别也越来越高。统计数据的级别PB的级别甚至更高。 (2) 形式多样。形式多样主要是指它的数据类型呈现出多样化的特点。随着信息技术的发展, 越来越多的数据以非结构化的形式出现。比如视频、音频、图片等。据统计, 非结构化数据在数据中的比重已经超过了80%。 (3) 价值密度低。大数据在运行过程中会产生大量有价值的信息, 这些信息对于生产生活会产生非常大的帮助。但是大数据由于数据信息量太大, 也就存在着价值密度低的特点。在很大一个数据统计中, 可能有价值的信息只有很少一部分。

2 大数据环境下存在的问题

大数据环境下的数据存在以下几个关键问题。

2.1 可表示问题

大数据环境下的一些非结构化数据呈几何的形式在增长, 数据的规模巨大, 形式多样化使得用户对于数据的需求也呈现出多样化的趋势。数据的不断增大导致数据运行的效率却越来越低。对于这些多而杂的非结构化数据, 如何表示将是一个非常重要的问题。

2.2 可靠性问题

大数据环境是一个非常庞大的网络环境, 在网络开放和共享的时代, 计算机数据面临着安全性和可靠性的考验。在大数据环境下, 数据的收集和发布方式比以前更加的灵活, 但一些不确定的数据将很有可能会造成数据的失真, 在网络开放的环境下, 失真的数据就会影响巨大的负面影响。因此大数据环境下的数据的可靠性将是一个急需解决的问题。

2.3 可处理问题

由于目前的数据信息每天都以成千上万的形式增长, 现有水文计算机处理能力已经很难有效地对其进行处理, 在进行数据分析的过程中, 需要研究一种新型的数据分析方法, 将多种学科的计算方式相结合, 对数据信息进行规律性的研究。

3 大数据环境下影响数据安全的因素

3.1 自然灾害

自然灾害这里主要是指台风、龙卷风、飓风、地震、洪水、火灾等。随着信息技术的发展, 网络已经成为世界人民生活中不可或缺的一部分。人们在使用计算机网络的过程中, 有很多数据存储在服务器之中, 并且经常与它们实时交互。在运营过程中, 因为各种灾害例如火灾、停电、地震以及数据传送时线路的突然中断, 将造成各种数据的丢失。

3.2 网络硬件

在信息化快速发展的今天, 硬件虽然更新换代很快, 但数据量的增长速度却是爆炸性的增长, 进而造成以前的存蓄环境不能满足当前海量数据的需要, 因此, 应该对存储环境进行优化升级, 使其能满足现今对数据存储的需要。在传输数据的过程中如果数据量过于庞大, 而硬件设备由于老化导致传输速率的降低, 那么网络的延迟可能会导致系统崩溃造成数据丢失, 影响数据存储过程的安全。

3.3 操作失误

数据管理人员不管是面对怎样的应用软件, 都有可能出现操作不当的情况。任何一个人在开展工作时都有可能会误删除系统的重要文件, 或者修改影响系统运行的参数, 以及没有按照规定要求或操作不当导致的系统宕机, 尤其是进行数据库管理的工作人员, 面对的数据量比较大, 系统的运作也极为复杂, 这都将导致操作不当或失误情况的发生, 进而威胁到系统数据的完整性与安全性。

3.4 管理不善

由于存储系统越来越复杂, 对管理维护人员的素质要求也越来越高, 因管理不善而造成数据丢失的可能性会大大增加[2]。比如计算机网络中终端用户随意增减调换, 每个终端硬件配备 (CPU、硬盘、内存等) 肆意组装拆卸、操作系统随意更换、各类应用软件胡乱安装卸载, 各种外设 (软驱、光驱、U盘、打印机、Modem等) 无节制使用。

4 如何保证大数据环境下的数据安全

4.1 建立大数据信息安全体系

大数据的应用规划以及它的信息安全应要提高到发展战略的高度, 对大数据进行系统的分类, 明确一些重点的保障对象, 强化对数据的监控管理。大数据环境是一个庞大的数据信息系统, 要确保数据信息的安全性, 需努力建立起一个完整的数据信息安全体系。

4.2 进行数据安全删除

当今信息安全技术当中一个极为关键的问题。所谓的数据安全删除指的就是对数据恢复正常的条件进行破坏, 使数据在删除之后无法恢复, 无法逆转。相对于部分敏感数据而言, 数据安全删除是十分关键的。众所周知, 普通文档实行删除操作仅仅是对其标记进行删除;高级格式化同样无法对数据区内的数据信息进行覆盖处理, 因此不能将其叫做安全删除。

4.3 对动态数据进行安全监控

相对与静态的信息数据, 动态的信息数据更容易产生安全问题。因此需要对动态数据进行安全监控, 完善对于动态数据的安全监控机制。在对动态数据进行监控的过程中, 必须要对分布式计算系统进行健康监控, 以保证其健康运行。在一些大规模的分布式计算中, 要对动态数据的细粒度进行安全监控和分析, 对大数据分布式进行实时监控。

5 结语

随着信息化时代的到来, 如今大数据环境下的数据不断增长。在大数据环境下的数据信息的安全性成为信息化时代的一个重要问题。对数据的安全性采取保障措施对整个大数据环境下的信息化发展具有非常大的意义。

摘要:大数据环境下的数据安全问题是信息化时代必须解决的问题。文章阐述了大数据的概念及特点以及其存在的一些问题, 再来分析大数据环境下影响数据安全的因素, 最后对如何保证大数据环境下的数据安全提出一些方法。

关键词:大数据环境,数据,安全

参考文献

[1]郭三强, 郭燕锦.大数据环境下的数据安全研究[J].科技广场, 2013 (02) .

[2]朱东华, 张嶷, 汪雪锋, 李兵, 黄颖, 马晶, 许幸荣, 杨超, 朱福进.大数据环境下技术创新管理方法研究[J].科学学与科学技术管理, 2013 (04) .

[3]聂元铭.大数据及其安全研究[J].信息安全与通信保密, 2013 (05) .

基于大数据环境下的气象数据分析 篇3

关键词:大数据 气象数据 分析

中图分类号:TP311.52 文献标识码:A 文章编号:1674-098X(2016)04(c)-0079-02

在社会的发展过程中,天气对社会中的很多行业都有一定的影响。在当前阶段,天气预报作为我国主要对天气进行预测的手段就对数据进行了一定的应用,但是随着大数据时代的到来,不仅是数据的数量,还是数据所隐藏的信息都有了很大的增加,在这种情况下,只是天气预报一种使用数据的手段就不能满足社会发展的需求,在这种条件下,加强对气象数据的研究,使其在气象工作中发挥出更大的作用,为人们的生活、工作提供良好的帮助。

1 大数据

1.1 大数据的内容

在当今社会的发展中,网络技术得到了大力的发展,在这种情况下,在网络中就会出现大量的数据,这些数据就构成了大数据,这些数据具有一定的实时性,其本质不在“大”上面,而是要对这些数据进行有效分析,将数据中所包含的内容全部挖掘出来,使用挖掘出来的信息来进行工作。因此,大数据就不只是对数据数量的一种诠释,更是对数据进行处理的一种手段。这就表示其与以往的数据有很大的不同,首先就可以发现两者之间规模具有很大的区别,其次是在对数据使用时,使用的方式也完全不同,在使用传统的数据时,只是使用单一的或者几种方式就可以了,而在使用大数据时,往往需要很多的方式才能完成[1]。

1.2 大数据的特征

随着社会科技的不断发展,大数据的应用越来越广泛,其特征也随之在增加。在大数据刚刚出现时,只是具有数据量大、处理传输的速度较高、数据的种类较多3个特征,而随着大数据的发展,在大数据的特征中又加入了数据真实性的特征,而到了现在,随着商业活动的不断增加,使数据又有了商业价值大的特征。根据这些特征可以发现,这些大数据中都含有一定的信息,为了将数据中的信息进行使用,就需要一定的手段将其从这些数据中寻找出来,这也是当前阶段中一个重要的工作内容。

2 气象数据

2.1 气象数据的内容

在气象部门工作的过程中,会出现很多的数据,其包括了气候数据与天气数据,这些数据统称为气象数据。气候数据就是使用一定的检测仪器对环境进行测量,将测量到的结果进行分析与整理所得到的数据。而随着社会的发展,世界各国对气候的研究有了更深层次的理解,使气候数据的内容有了进一步增长。天气数据就是为了推测天气变化而产生的数据,这些数据大部分是来自于卫星传输的。两者之间的区别主要在于前者往往反映的是一个地区长时间的环境变化,而后者只是表现了一个地区在一定的时间内的环境变化。但是两者之间还有一定的联系,对很长时间的天气数据进行分析与整理,就可以确定出某个地区的气候数据[2]。由于很多因素的存在,导致在我国当前阶段中对气象数据研究的对象为天气数据。

2.2 气象数据的特征

气象数据作为大数据中的一种,因此,其具有的特征就是大数据存在的一些特征。对其具体分析后可以发现,首先就可以发现其具有数据量大的特点:在气象部门发展的过程中,国家安装了很多雷达设备以及地面接受装置,同时,随着科技的发展,卫星技术的不断成熟,我国也向太空发射了一些气象卫星,在这些设备的使用过程中,产生了大量的数据,使其数量大的特点很好地体现出来。但是,对气象的观察并不是一直在进行的,这就使其产生的数据不是无限增长的[3]。同时其还具有一定的商业价值:在气象数据产生的过程中,来源比较单一,内容比较重复,这就不能使其自身带来经济价值,但是,其不能受到人为的干扰,在交通、旅游等行业中,就可以被很好地使用,将其商业价值很好地体现出来。

3 大数据对气象数据的影响

3.1 数据采集的影响

在对当前气象数据的采集过程中,已经将“大”的特点体现出来,但是这些只是对字面上的体现,而没有真正体现出来其真正的含义。在当前对气象数据的研究中,只是针对专门的气象数据进行研究,而与气象数据有关的其他数据研究得比较少,其中存在的利用价值很难被人们使用。因此,在对气象数据进行采集的过程中,不仅要将纯气象数据寻找出来,还要对其他气象中有关的数据进行采集。例如人们远距离出行要坐飞机,这时就可以对航班的信息进行了解,使人们出行更加便捷[4]。

3.2 数据存取的影响

由于大数据存在数量大的特点,这就为其存取造成了一定的影响。首先就是储存容量的问题,在我国当前阶段中,由气象产生的数据达到了5 PB(5×10245 B),需要的储存空间相当大。其次是存取速度的问题,由于数据量较大,在寻找有用数据的过程中需要花费一定的时间,可能达不到“1秒钟输出结果”的定律。在这两个问题当中,既有一定的联系,又存在着一定的矛盾,因此,在对气象数据存取时,就要进行统筹管理。对数据储存环境的扩建不是根本的解决办法,而是要加强对大数据的管理。在存储过程中,使用有效的方式对其进行分类,将其按照每种分类进行管理,使数据系统的性能更加强大[5]。

3.3 数据分析的影响

在气象部门的工作过程中,很早就将对气象数据的分析作为了主要的任务,但是在大数据环境下的分析还处在起步的阶段,其他行业大数据的分析过程中为气象行业的数据分析提供了良好的保证。在气象部门进行数据分析的过程中,将相对关系进行有效把握,对其进行良好分析,就可以对未来做出预测。而在大数据环境下,气象数据的数量得到了一定的增加,对未来预测的过程中就有更多的数据来进行分析,可以保证预测的结果更加准确。

4 结语

在对当前阶段中的气象数据进行分析可以发现,大数据对气象工作产生的影响有很多,上述几点只是其中影响最广泛的几点。从国家的发展角度来说,在大数据环境中,气象数据面向社会各界是必然的趋势,加快了社会各行业的发展;从公共服务角度来说,要对大数据进行有效分析,将数据中人们的需求信息寻找出来,根据这些信息加强对服务的改善,使其能满足人们的需求。在当今社会中,大数据对社会的影响还会继续的增加,在这种情况下,有效地利用好大数据就可以使其更好地发展。

参考文献

[1]刘立明,王彬.气象网格环境下大数据的端到端传输机制研究[J].计算技术与自动化,2014,8(1):122.

[2]刘培宁,韩笑,杨福兴.基于R语言的NetCDF文件分析和可视化应用[J].气象科技,2014,4(4):629.

[3]米卫红,巢惟忐,支星,等.移动互联网环境下的上海市气象信息数据发布:需求、现状与探索[J].电子政务,2014,10(11):23.

[4]聂俊岚,刘益萌,陈贺敏.非线性映射的气象数据可视化及其应用[J].燕山大学学报,2015(3):276.

探析基于大数据环境下的数据安全论文 篇4

大数据环境下信息的传播必然会经过复杂的网络环境,会利用多种网络协议进行信息传播。但由于网络环境存在诸多的不确定性以及网络协议存在漏洞,这些均会对信息传播安全造成影响。另外,大数据环境下的许多数据均是通过云计算技术进行存储,而云存储服务通常是由第三方提供,对信息传播安全也带来了一定的隐患。

1.2 物理安全

大数据环境下的网络物理安全是保障整个网络安全的基础,物理安全包括以下几个方面的内容:(1)软件安全。软件是指支持大数据运行的软件环境,保护基础操作系统、软件系统、防火墙与杀毒软件等。

如果没有配置安全的软件环境,势必会让病毒等渗入,同时也容易受到各种攻击,给网络安全埋下隐患。(2)硬件安全。硬件是网络安全保障的重要物质基础。

因此,要保障大数据环境下的硬件安全,就必须建立完善的硬件运行管理机制,包括稳定的电源、安全的防雷与防天灾等措施。(3)内容安全。内容安全是指大数据环境下的数据安全,需求建立合理的内容安全控制措施,保障信息不被窃取、破坏等。

1.3 数据管理安全分析

探析基于大数据环境下的数据安全论文 篇5

摘 要 目前,我国信息技术水平快速提升,加速了网络金融行业发展,大数据管理和应用逐渐成为银行机构关注的焦点。然而信息泄露事件频发,信息安全问题形势严峻。本文主要从信息保护技术、敏感数据管理以及外联系统管理三方面对大数据时代下的银行信息安全保护策略提出相关建议,希望为加强银行数据信息保护提供借鉴。

【关键词】网络大数据 银行信息安全 保护

银行自身信息资源与网络数据?w系的有机结合,有效推动银行发展的大数据时代。基于大数据影响,银行用户信息不完全局限于以往的内部系统,通过与互联网相互结合,赋予银行数据信息量大、价值高一级泄露破坏性较强三大特点,本文就大数据环境下银行信息保护提出相应管理策略。加强信息安全保护技术

1.1 数据加密

基于大数据环境下,银行数据与外部环境接触频率逐渐增加,银行信息安全受到严重威胁,数据加密是从根本上加强安全防护,大数据自身具有灵活性特点,其要求银行系统应选择多样形式的加密方式,并对结合运行环境实行针对性的数据加密。根据现存技术条件分析,多模加密技术针对银行系统较为使用。该项技术在保证数据安全防护质量的前提下,实现了对称算法及非对称算法的相互结合,并基于其自身特性对加密模式进行灵活选择,满足了网络大数据时代下,信息安全多样化的实际需求。

1.2 访问控制

不同种类的大数据使访问控制需求具有一定差异性,在分析客户信息过程中,需针对历史记录信息进行访问控制、在分析地理信息过程中,需针对精度和尺度进行访问控制、在处理流动数据过程中,需针对实施具体时间进行访问控制。访问控制具备灵活性是符合网络大数据特点需求的必要条件,根据银行大数据的特点分析发现,在常规性和强制性的自主访问控制范围外(DAC/MAC),实行信息流访问控制较为合适,其主要对信息的流动过程进行授权处理,从而在保证信息机密性与完整性的基础上,实现有效管理。

1.3 安全审计

在网络大数据时代的影响下,使银行系统关联关系具备较强的复杂性。安全审计技术对保证银行系统安全具有重要意义,其在实施过程中需对系统内部的各个功能及用户实现全面覆盖,从而提升该项技术的实效作用。安全审计的工作重点主要有三个方面:首先,银行系统日志。利用日志反馈信息对外部因素侵入情况及其过程进行科学分析。其次,用户必要性权限。主要是严格控制权限范围较大的用户,对其登录信息泄露进行有效控制,从而降低违法侵入的安全隐患。最后,系统更新。根据实际情况进行系统版本升级,对已知系统漏洞进行及时修复,从根本上掐断违法侵入者的窃取路径。加强敏感数据管理

2.1 选择DLP避免数据泄密

通常情况下,负责存储数据相关设备缺乏严格管理是导致银行系统信息泄露的主要原因,违法侵入者通过特殊手段对数据信息进行盗取,增加了信息安全隐患。DLP(Dataloss prevention)是集数据加密与内网监控一体的软件,其自身功能充分满足银行系统信息保护需求,该软件的实施可对非法信息复制、窃取、拍摄、电子邮件以及信息浏览等操作行为进行监控阻止。同时该软件可结合相关解密技术使用,升级数据被窃取的防御能力,同时如该设备未进行DLP授权,则其不具备查看的权限。

2.2 控制敏感数据访问

严格控制敏感数据并赋予指定人员浏览权限,当指定人员中出现职位调动或离职情况则该访问权限被取消。在网络运行环境安全的前提下对敏感数据进行查看,一旦处于安全环境之外需进行权限审批。同时在查看或使用敏感数据过程中,必须进行相关信息登记及跟踪复查,主要复查数据申请意愿是否符合实际用途,在完成使用工作后,对相关记录进行物理清理,加强保护敏感数据浏览程序的严谨性。

2.3 加强测试数据管理

在数据测试过程中选择实验数据不包括真实数据,如业务需要则需进行数据脱敏处理和传输过程技术加密。提取生产数据时应以最小化需求为主要原则,并通过安全运维平台或安全专项终端进行数据提取,让所有操作流程有迹可循。同时针对测试数据的使用过程,应建立实名制监督机制,遵循最小权限原则,在条件允许的情况下,银行可开设云环境进行测试工作,从而保护数据信息安全。

2.4 加强工作人员信息安全教育

银行信息安全维护关键因素是在于人的问题,加强内部监管并制定惩罚机制,同时明确信息泄露需要承担的责任,对违规操作形成有效制约。目前,银行现存制度中,对敏感数据信息安全和人员保护责任有明确规定,关键是人员层面落实不到位。因此,银行应加强内部工作人员信息安全教育,集体人员开展信息安全分析会,普及风险知识、防御知识以及法律知识,结合相关知识制定员工手册,针对册中内容定期进行考核。同时针对有权限接触敏感信息的人员要求其出具保密证书,并明确因其信息泄露承担的责任。加强外联系统管理

目前,我国针对大数据的应用处理尚处于初级阶段,关于银行大数据处理通常会选择合作方式,该种合作模式被各大银行认可并快速发展,然而相对应的管理机制却有待完善,导致信息安全风险增加。因此,银行机构应从外包现场服务、外联系统以及外包合作开发系统三方面进行有效控制。首先,外部人员维护敏感设备时应有内部人员现场监督。其次,缩短与外联系统的通信时间,避免信息遭到非法截获。最后,针对外包合作系统,银行建立完善的安检机制,审查相关文件代码,保证信息安全。结语

综上所述,大数据金融环境,银行信息保护措施应不断加强,对维护用户自身权益具有总要意义。而通过加强信息保护技术、敏感数据管理以及外联系统管理是网络大数据时代下银行保障数据安全的重要途径。

参考文献

[1]吕虹.大数据背景下的计算机信息安全及隐私保护策略[J].通讯世界,2016(10):116.[2]李晗.大数据时代网上银行的安全保障义务研究[J].当代法学,2016(04):118-127.[3]邵若男.大数据时代下电子商务用户个人信息安全问题及保护[J].商,2015(23):235.作者简历

刘宜奎(1987-),男,广东省茂名市人。大学本科学历。现为广东轻工职业技术学院实习研究员,从事计算机网络、计算机应用技术方面研究。

作者单位

探析基于大数据环境下的数据安全论文 篇6

1.云计算与云存储的概述

云计算是指通过互联网进行动态的扩展且为虚拟化的资源,随着互联网相关服务的增加,按使用量付费的模式。网络的数据传输功能发展迅速,使得计算机逐渐组成了一个相互关联的集群,并且由统一的数据处理中心进行资源的调配和处理。其具有规模大、形式虚拟、兼容性强等特点。云计算中的关键环节在于云存储,其具有集群应用和分布式文件系统等功能,将网络中不同类型的存储设备通过应用软件进行组合工作,为用户提供业务访问等服务的系统,属于云计算衍生出的新兴的网络存储技术。当云计算系统需要存储和管理大量数据时,系统需要配置存储设备,此时,云存储成为主要进行数据存储和管理的核心云计算系统,方便用户随时随地,通过任何可联网的装置进行信息数据的存取。

2.云数据存储结构

云计算环境下数据存储结构利用了先进的互联网技术,实现了按照用户的网络需求来分配资源。与传统的数据存储结构比较,从服务和实际应用的角度分析,云数据存储是一个硬件的同时还是由客户端程序、访问接口、软件、服务器等设备组成的存储系统。

云数据存储结构通过云计算系统中的应用软件为用户提供数据存储及业务访问等服务,其中,存储层是云数据存储结构的最基层,其主要内容包含存储管理和虚拟化设备,存储层中的存储管理系统用于对硬件设施的维护和升级等功能。管理层是云数据存储结构的核心层,其通过分布式文件系统和集群管理技术进行内容分布和数据备份,具有良好的拓展性,还可以完成云存储系统中的数据加密等任务,符合用户对信息可用性及存储功能的需求。接口层属于云数据存储结构中的重要组成部分,其应有与云计算系统的结构开发与应用,供应商包括网络接入、身份论证、权限管控、应用软件接口等部分,供应商通过接口层为用户设置统一的编程,方便用户自主开发应用程序。云数据存储结构的顶层为访问层,其主要是系统应用程序的入口,用户通过访问层进入云计算系统,实现系统中的资源共享。

3.云计算环境下数据存储安全及其关键内容

3.1 云计算环境下数据存储安全

云计算在其实际应用中存在用户信息遭泄露等不安全问题,因此,云计算环境下数据存储安全问题是当前计算机技术发展过程中面临的挑战。为了降低企业中事务的使用成本,减少繁琐的工作程序,就需要在云数据存储的过程中,确保其安全可靠性,使的云计算系统提供优质的服务。在云计算技术的背景下,通过服务式的操作和存储数据,保证数据的稳定性。虽然个体用户使用的数据由提供商管理,用户存储和使用数据是借助网络服务的,但其数据的安全性也需要由云计算系统统一负责。可以将计算机的使用过程看成一个节点,当这些节点出现安全隐患问题时,就需要采取不同的手段对其进行访问和使用,即保证云计算中的安全存储与数据的传输、恢复联系起来,并且得以稳定的发展。

3.2 云计算环境下数据安全的关键内容

云数据安全的关键内容包括数据传输安全,其主要指在云计算的服务下,用户将数据传输给云计算系统服务商,由服务商进行数据的处理工作。其间,云计算需要确保用户的数据在传输过程中被加密,保证不被泄露。服务商获取用户数据后,按照行业要求进行保存,服务商还需要做到对用户进行权限认证之后再给予访问数据的权利,访问的对象只能访问自身的数据。云数据安全的关键内容包括数据存储安全,其主要指实现系统中存储数据资源共享的模式,在云计算系统服务下,服务商采取必要的手段隔离不同的数据。当用户准确知道其数据存放位置的情况下,服务商还需要保证对用户托管的数据进行了有效的备份,以防出现突发状况时,数据的丢失,云计算服务商需要最大限度地保护用户的数据,使其恢复到初始状态。在系统中,数据的残留极易泄露用户的信息,因此,云计算服务商需要保证为用户提供数据的安全性。云数据安全的关键内容还包括数据审计安全,通过云计算的服务模式,服务商为用户提供必要的信息支持,并且不对其他用户的数据造成威胁。云计算的服务费为保证数据的安全,需要协助第三方机构准确地对数据安全进行审计,保证用户的信息安全性,同时也促进云计算服务系统的健康长远发展。

4.基于云计算的数据存储安全技术

云计算环境下数据存储在保证数据运算效率的同时还需要确保其安全性,因此,服务商在为用户提供云存储服务时,需要对其信息进行加密保护,保证用户的数据出现在任一存储空间中,非授权用户看到的是无序的乱码,确保用户的个人信息不被泄露。在保证云计算服务商真实可信的前提下,需要将提高云计算的系统运算效率和安全性作为主要任务,探宄出适合互联网信息技术发展的数据存储安全技术。

4.1 数据加密技术

目前我国的云存储系统保护隐私数据的能力有限,为保证云存储数据的完整性,用户在使用互联网的同时也需要对自身信息进行有效的加密。云计算系统用户需要提高信息安全意识,加强数据的密钥管理,通过科学的数据加密技术保障云存储系统数据的安全性,提高其使用效率。用户在进行数据加密的过程前,对应的加密算法公钥需要用户端从密匙库中提取,之后应用对称加密的算法,形成具有校验信息的密钥。其中具备校验信息的密钥可以通过非对称的加密算法进行处理,确保其安全性,最后处理好的信息数据作为数据包储存于云端中。在重复加密过程中,保证所有的数据包完成数据加密的行为,方可截止,形成数据加密的全过程。

4.2 数据隔离技术

在云计算模式的背景下,用户将随意摆放系统中的数据存储结构,因此,会出现多个用户将数据存储于同一个虚拟服务器中的现象。出现此类情况时,用户需要使用数据隔离技术,将自身的信息与其他用户的信息有效的隔离开,保证云计算环境下数据存储的安全性。

4.3 访问权限控制

当用户将数据上传至云计算数据存储系统后,云计算系统的提供商将享有访问该数据的优先权。如果用户需要限制服务商的访问权限,在上传个人数据的同时,需要将该数据的访问优先级别设置为自己,以此确保自身数据在云计算环境下数据存储的安全性。

4.4 数据加密传输

各类数据在云计算系统中的传输是必不可少的,因此,其在传输过程中的安全性是当前面临的大考验。数据的加密传输是指在数据的传输过程中在网络链路层、传输层等区域使用加密技术,以此确保用户数据的可用性和完整性。在数据传输的前期,通过加密协议为用户的数据传输提供加密通道,在数据传输的后期,则采用必要手段防治非法用户对数据的窃取,进而维护用户的数据安全,保证云计算环境下的数据加密传输。

5.结语

大数据环境下的网络安全分析 篇7

通过分析不同专家给出的概念,总结得出:大数据不是对数据量大小的定量描述,而是一种在种类繁多、数量庞大的多样数据中进行快速信息获取,所涉及的资料量规模巨大到无法透过目前主流软件工具在合理时间内达到撷取、管理、处理、并整理。大数据更大的意义在于:通过对海量数据的交换、整合和分析,发现新的知识,创造新的价值,带来“大知识”、“大科技”、“大利润”和“大发展”。

随着物联网、移动互联网和云计算技术及应用的蓬勃发展,人类产生的数据量正以指数级增长,其中,很多是用户信息等敏感信息,甚至涉及到国家机密。所以,难免会吸引来自世界各地的各种人为攻击(例如信息泄漏、信息窃取、数据篡改、数据删添、病毒攻击等)。同时,网络实体还要经受诸如水灾、火灾、地震、电磁辐射等方面的考验,因此,大数据环境下的网络安全将直接影响到社会的经济效益,同时应对日益增多的网络攻击、病毒破坏和黑客人侵等问题已经成为各界关注的重点。

一、发展现状

近两年,大数据问题(Big Data Problem)已成为信息技术学术界和产业界热论的焦点,鉴于其关系到信息产业的各个方面,因此专家普遍认为,大数据将成为信息科学技术领域的重要前沿课题之一。

根据IDC(国际数据公司)的监测统计[2],2011年全球数据总量已经达到1.8ZB(1ZB等于1万亿GB,1.8ZB也就相当于18亿个1TB移动硬盘的存储量),而这个数值还在以每两年翻一番的速度增长,预计到2020年全球将总共拥有35ZB的数据量,增长近20倍。

在学术界,国际顶级期刊《Nature》和《Sciences》近期针对大数据分别出版了专刊《Big Data》[3]和《Dealing with Data》[4],从互联网技术、互联网经济学、超级计算、环境科学、生物医药等多个方面讨论了大数据处理面临的各种问题[5]。在中国,2011年11月26日,中国软件开发联盟(CSDN)在北京成功举办大数据技术大会[6]。为推动大数据这个交叉学科的发展,中国计算机学会(CCF)成立了大数据专家委员会(CCF Big Data Task Force,简称CCF TF-BD)。

在互联网商业界,“大数据”已成为炙手可热的产业领域,全球互联网巨头都已意识到了大数据时代的数据重要意义。美国互联网领域近日频现较大规模并购交易[7],最新的一笔是亚马逊5月13日宣布收购三星旗下荷兰显示技术公司Liquavista;而最活跃的主角当属微软、雅虎、谷歌等著名IT巨头:微软日前曝出拟出资10亿美元收购Nook?Media公司数字资产,雅虎上半年则收购了5家初创公司,总额达1600万美。互联网并购交易近期如此频繁,一方面体现了IT业巨头在实力和竞争力方面的博弈,另一方面则是对行业未来发展趋势的战略性布局。而在国内,在年初全国“两会”上,更有代表提案将“发展大数据”上升到国家战略。

在信息网络安全方面,近两个月,国际黑客组织“匿名者”多次攻击朝鲜网站并致其瘫痪[8],甚至造成会员账号信息泄露。最近一次,名为“Anon TAIWAN”的台湾黑客群[9],在岛内网站公布了菲律宾政府的DNS注册数据,以及其它重要菲律宾网站的管理员账号密码,受到影响的菲律宾政府网站,估计将超过2300余个。

这些事件的发生,使得人们的目光迅速聚焦到网络信息安全上面,无不提醒人们注重网络安全的重要性。

二、网络安全分析

大数据环境下,在互联网上每天有大量敏感信息持续不断地产生,而网络安全成为保障数据安全的重要保证。大数据环境下的网络安全分析体现在以下几个方面。

2.1物理安全分析

在大数据环境下,网络的物理安全是整个网络系统安全的前提。在网络工程建设中,应充分考虑网络规划、网络系统设计的合理性;考虑机房环境防潮防尘;考虑各种线路之间的距离,防止电磁干扰;考虑电源电压和电源故障;考虑设备硬件配置和计算能力;考虑从设备不会被破坏,线路不会别截断;考虑报警装置和系统备份设计;考虑网络设备不受电、火灾和雷击等自然灾害的侵害;考虑人为对物理设备操作失误或错误。

2.2信息内容安全分析

大数据环境下,信息内容的安全性主要体现在两种方式,一种是信息的泄露,另一种是信息的破坏。信息泄露就是未经合法用户的授权,非法用户侦破、截获、窃取或者破译目标系统中的数据,一旦一些隐私信息被泄露出去,会给用户带来隐患和困扰;信息破坏指由于系统故障、非法行为或系统感染病毒,使得数据内容被删减、添加或者修改,破坏了数据的完整性、正确性和可用性。如果一些重要信息遭到泄露和破坏,它将对经济、社会和政治产生很大的影响。

2.3信息传播安全分析

在网络环境下,数据信息的传输的载体是各种网络通信协议[10],例如TCP/IP、IPX/SPX、HTTP、XMPP等,这些协议往往并不是专门为实现数据的安全通信而设计,通常存在安全漏洞,缺乏数据安全保护机制。许多非法入侵、网络攻击和病毒传播往往就是利用这些协议中的这些漏洞来对网络系统或用户数据进行泄露和破坏。另外,如果信息传播收到攻击,会造成数据在网络上传播失控,严重时将直接导致整个网络系统瘫痪。

2.4管理安全分析

无论何种情况下,管理都是网络中安全最重要的部分[13]。安全管理制度的不健全和缺乏可操作性等都可能引起管理安全的风险。比如,无法对网络出现攻击行为或内部人员的违规操作等进行实时的检测、监控、报告与预警。同时,当事故发生后,也无法提供黑客攻击行为的追踪线索及破案依据,缺乏对网络的可控性与可审查性。这种管理上的疏忽,造成数据的丢失无迹可寻,为以后的数据安全管理留下隐患。

三、网络安全防护措施

在大数据环境下,网络系统本身在物理上、操作上和管理上的种种漏洞,从而构成了系统的安全脆弱,尤其是多用户网络系统自身的复杂性、资源共享性使得多种技术组合应用变得非常必要。攻击者使用的是“最易渗透原则”,必然在最有利的时间地点,从系统最薄弱的地方进行攻击。因此,充分、全面、完整地对系统的安全漏洞和安全威胁进行分析、评估和检测,从网络的各个层次进行技术防范是设计网络安全防御系统的必要条件。目前采取的技术主要有:访问控制、数据加密、网络隔离、入侵检测、漏洞扫描、病毒防治、数据备份和硬件冗余等。下面对他们做出详细介绍。

3.1安全技术手段

大数据环境下,黑客攻击、病毒传播、系统漏洞等来自安全技术的攻击,就要用安全技术的手段去防卫。下面技术几种常用的网络安全技术手段:

(1)访问控制

访问控制是网络安全防御和保护的主要策略。进行访问控制的目的是对用户访问网络资源的权限进行严格的认证和控制[11],保证网络资源不被非法使用和非法访问。例如,进行用户身份认证,对口令加密、更新和鉴别,设置用户访问目录和文件的权限,控制网络设备配置的权限等。

访问控制通常以用户身份认证为前提,在此基础上实施各种访问控制策略来控制和规范用户在系统中的行为,从而达到维护系统安全和保护网络资源的目的。

(2)数据加密

无论何种情况下,加密是保护数据安全的重要手段。加密,就是采用加密算法和加密密钥将明文的数据转变成密文,从而将信息数据隐蔽起来,再将加密后的信息数据传播出去,即使加密后的信息数据在传输过程中被窃取或截获,窃取者也无法了解信息数据中的内容,从而保证信息数据存储和传输的安全性。

针对不同的数据采用不同的加密算法,实施不同等级的加密控制策略,从而能有效地杜绝机密信息泄漏和窃取事件。毫无疑问,要确保实时数据和大数据的网络安全策略的有效性,必须要有个完善的加密措施。

(3)网络隔离

大数据环境下,网络隔离一般采用在数据存储系统上部署防火墙作为主要隔离手段。防火墙[11]将网络分为内部和外部网络,内部网络是安全的和可信赖的,而外部网络则存在大量威胁。防火墙系统决定了哪些内部服务可以被外界访问;外界的哪些人可以访问内部的哪些服务,以及哪些外部服务可以被内部人员访问。通过对内部网络和外部网络之间的数据流量进行分析、检测、管理和控制,从而保护内部网络免受外部非法用户的侵入。

防火墙技术是通过对网络的隔离和限制访问等方法来控制网络的访问权限,只允许授权的数据通过,并且防火墙本身也必须能够免于渗透。

(4)入侵检测

入侵检测技术[12]就是通过对互联网络和主机系统中的关键信息进行实时采集和分析,从而判断出非法用户入侵和合法用户滥用资源的行为,并作出适当反应的网络安全技术。

入侵检测是一种主动的网络安全防御措施,它不仅可以通过监测网络实现对内部攻击、外部攻击和误操作的实时保护,有效地弥补防火墙的不足,而且还能结合其他网络安全产品,对网络安全进行全方位的保护,具有主动性和实时性的特点,是防火墙重要的和有益的补充。帮助系统对付网络攻击,扩展了系统管理员的安全管理能力(包括安全审计、监视、进攻识别和响应),提高了信息安全基础结构的完整性。

(5)病毒防治

在大数据环境下,最理想的防止病毒攻击的方法就是预防,病毒防护主要包括病毒的预防、检测与清除,在第一时间内阻止病毒进入系统[11]。而有效地预防病毒的措施实际上来自用户的行为,其方法有:在操作系统上安装防病毒软件,并定期对病毒库进行升级,及时为系统安装最新的安全补丁,从网络上下载数据前先进行安全扫描。不要随意打开未知的邮件,定期备份数据等。

一旦系统被病毒感染。就要立即对病毒进行检测并对其进行定位,然后确定病毒的类型。在确定了病毒的类型后,从受感染的程序或文件中清除所有的病毒并恢复到感染前的状态。如果成功检测到病毒但无法识别并清除该病毒,则必须删除受感染的文件,并导入未被感染文件的备份。

(6)安全审计

网络安全审计是一种高性能、高稳定性的网络信息安全审计手段,安全审计系统通过网络旁路的方式,监听捕获并分析网络数据包,还原出完整的协议原始信息,并准确记录网络访问的关键信息。它能实现网络访问记录、邮件访问记录、上网时间控制、不良站点访问禁止等功能。另外,通过统一的策略设置的规则,智能地判断出网络异常行为,并对异常行为进行记录、报警和阻断,保护业务的正常运行。

(7)数据备份

数据备份是数据保护的最后一道防线,其目的是为了在重要数据丢失时能对原有数据进行恢复。

大数据环境下,对数据备份是指将系统中的数据进行复制,当系统出现故障或灾难事件时,能够方便且及时地恢复系统中的有效数据,以保证系统正常运行。数据存储系统由于系统崩溃、黑客人侵以及管理员的误操作等都会导致数据丢失和损坏。

为了维护网络的安全,就必须对数据进行定时地备份,以防止因各种软硬件故障、病毒侵袭和黑客破坏等导致系统或数据受损时,能够快速、安全地将系统和数据恢复。即使有了防火墙、IPS等一系列的安全设备,也应该对数据进行备份,确保数据的安全;而一旦数据丢失,也能够通过备份的数据进行恢复,从而保证网络的持续运行。

3.2安全防范意识

任何网络都没有100%的安全,网络安全建设是三分靠技术,七分靠管理。因此,除了运用各种安全技术之外,还要建立一系列安全管理制度。制定严格的网络管理制度、安全设备的访问控制措施、机房管理制度、应急响应方案等,并加强对软件及操作的管理;建立完善的网络安全制度和管理措施,可以极大地提高网络的安全效能[13]。

为了保障网络的安全运行,除了要建立和完善各项安全管理制度外,还要加强用户的安全意识。使用户自觉地安装防病毒软件,及时为系统打补丁,设置强壮的口令等。只有加强了用户的安全意识,才能有效防止各种威胁网络安全事件的发生。

随着网络安全技术的不断发展,绝对的安全是不存在的,任何网络安全和数据保护的防范措施都是有一定的限度。网络安全的提高不仅要依赖于不断发展的技术,更要依赖于完善的管理和用户安全意识的提高。只有这样,才能有效地防御各种网络攻击,使网络安全、稳定地运行。

四、大数据网络安全发展前景

大量数据的生成和累积是信息化的必然结果,其带来的潜在经济价值和社会价值是巨大的,但这些价值必须通过数据的有效整合、分析和挖掘才能释放出来[14]。

随着物联网、移动互联网的迅速发展,使数据产生速度加快、规模加大,迫切需要运用大数据手段进行分析处理,提炼其中的有效信息。大数据应用也给云计算带来落地的途径,使得基于云计算的业务创新和服务创新成为现实。而以以上领域为切入点,大数据将推动整个信息产业的创新发展[15]。

对于企业来说,收集和分析交易数据可以让企业洞察到客户的选择,使其能够及时通知产品设计和服务部门,同时让其对新出现的问题进行快速补救。事实上,对大数据的使用将成为单个企业的竞争力与增长的重要基础。大数据的使用将引领世界经济的发展浪潮。

大数据的特点可以用“4V+1C”来概括[16],“4V+1C”分别代表了Variety(多样化)、Volume(海量)、Velocity(快速)、Vitality(灵活)以及Complexity(复杂)。与传统网络安全管理相比,这些特点显示出大数据安全管理具有很高的难度。根据本文上述分析,对大数据的网络安全管理只有保持清醒的认识和采取恰当的措施,才能将出现的损失降到最低。

五、总结

大数据的分析,其实是进行超前的预判,它已经成为行业共识,是未来发展的必然趋势。现在大数据是处于早期阶段,它和任何系统一样,在构建的时候一定要考虑安全,否则当企业发现有价值的数据,黑客也会觊觎它们。只有重视了网络安全,才能将可能出现的损失降到最低。

探析基于大数据环境下的数据安全论文 篇8

关键词 大数据 电子政务 政务智能 框架 政府管理模式 开源技术

分类号 G250

DOI 10.16810/j.cnki.1672-514x.2016.01.012

Government Intelligence in Big Data Environment:A Framework and Process

Li Hongbo, Xiong Li, Liu Yinbin

Abstract Big data is being penetrated into our economy, society and life, and will inevitably lead to profound changes in the way of government operations. Therefore, how to use big data to help government make better decisions is a big challenge for e-government. This paper proposes a framework of government intelligence in the big data era, also recommends some open source technology needed by government intelligence. It analyzes how the data is transferred in the proposed framework, and discusses the goals and potential benefits of the proposed framework.

Keywords Big data. E-government. Government intelligence. Framework. Way of government operation. Open source technology.

政务智能是电子政务发展到一定阶段的产物,它克服了传统数据库、数据分析方法的一些不足,如传统的数据分析工具、方法无法对大规模数据进行及时、有效的分析;现有的数据库系统虽然可以高效地实现数据录入、查询和统计等功能,但却无法发现数据之间的关系和隐含规则,无法根据现有的数据预测事物未来的发展趋势[1]。

政务智能对电子政务的发展起到了很好的促进作用,然而现有政务智能的研究,均很少考虑大数据的关键特征,已不能很好地应对大数据带给电子政务的挑战。鉴于此,本文提出了大数据环境下政务智能的框架模型,在政务智能系统中采用开源技术,不仅能够有效降低成本,还能在一定程度上确保信息安全。希望通过本文的研究,一方面在大数据时代对我国的电子政务建设有所促进作用,进一步提升政府服务和监管效率;另一方面为政务智能的研究和应用提供新的思路。

1 大数据与政务智能

1.1 大数据及其在国家政府部门中的应用情况

目前,对大数据并没有统一的定义,但各界对大数据的特征基本达成了共识。大数据主要有以下四个关键特征(简称“4V”):(1)数据量大(Volume),各种来源、各种类型的海量数据持续增长;(2)数据形式多样(Variety),有文本、图像、视频、传感器数据等,既有结构化的、半结构化的,也有非结构化的数据;(3)数据实时性(Velocity),数据实时生成、存储、处理和分析;(4)数据价值密度低(Value),单个数据的价值可能非常低,但从这些数据构成的海量集合中往往可以发现重要的知识与隐含的价值[2-3]。

大数据中所蕴含的海量数据,对于电子政务和智慧政府的建设而言,能否从中挖掘价值、辅助决策、优化服务,将是一个重要机遇;同时,鉴于新数据产生的速度已远远超过现有数据分析技术、计算平台的能力,如何开发与合理运用大数据分析方法,有效处理大数据的复杂性、安全性、隐私性等问题,也是一个重大挑战。

一些国家和地区已经认识到大数据对于智慧政府的重要性,并纷纷采取行动,推进大数据在政府部门的应用,具体内容如表1所示。从表1可以发现,美国和欧盟已经将大数据在政府部门的应用付诸行动,而我国政府部门对大数据的利用仍主要集中在行动计划上。因此,有必要对大数据环境下的政务智能模型进行深入研究,以推动大数据在我国政府部门的落地与应用。

挑战所采取的行动

政府部门应用大数据的成功关键,在于整合运用新技术的能力(如Hadoop、Spark)、开发合理的软件系统、利用大数据分析技术支持决策[9]。本文的政务智能2.0模型中,将对一些开源技术进行推荐。

1.2 由“政务智能1.0”迈向“政务智能2.0”

政务智能的目标是利用政府积累的大量历史数据来辅助政府决策,将政府所掌握的信息转换成知识,提高政府部门的决策能力、决策效率和决策准确性,并服务于公众。

政务智能的概念来源于商务智能。政务智能在技术层面与商务智能有很多共性,然而由于政务智能服务于电子政务环境,更多地表现出不同于商务智能的特点。许多学者将政务智能定义为一种信息系统,其目的在于辅助决策、服务社会[10-12]。

nlc202309032141

综合已有的观点,本文认为:政务智能是电子政务的重要组成部分,它通过对政府积累的大量历史数据进行主动获取、整合、分析,对内服务于政府部门,辅助政府决策,提高政府的决策能力、决策效率和决策准确性;对外服务于社会公众,使企业、公民便捷地获取与其息息相关的分析型信息,从而实现电子政务服务公众的目标。

目前,对政务智能的研究重点主要集中在政务智能的支撑技术、体系结构、应用系统等几个方面。现有对政务智能的研究存在一定局限性,如没有将大数据的特性纳入政务智能的研究,而这一点正是本文研究所要克服的缺陷。可以将大数据时代之前的政务智能称为“政务智能1.0”,而本文引入的大数据环境下的政务智能则属于“政务智能2.0”。

2 大数据环境下政务智能的框架模型

本文提出的大数据环境下政务智能的框架模型如图1 所示。该模型主要由4个层次模型(大数据来源层、大数据整合层、大数据应用层、大数据展现层)以及相应的管理机制和安全机制组成。其中,大数据来源层、整合层和应用层位于云计算服务器上。通过云服务的方式部署政务智能模型,可以确保政府部门灵活、方便地按需定制所需的计算能力,及时根据大数据需求部署合理的分析模型,从而以尽可能低的成本满足复杂多变的数据服务需求。

2.1 大数据来源层

大数据来源层位于政务智能框架模型的底层,是整个系统的数据源泉。大数据来源层由各政务部门产生和管理的政务信息资源组成,这些信息资源分布在各种不同类型的数据库系统中,同时各数据库在地域上也处于分散状态。在数据结构上,这些数据可能是结构化的、半结构化的或非结构化的。

2.2 大数据整合层

大数据整合层是政务智能模型的核心,它将地理上分散、结构上异构的各部门数据进行采集、整合,从而为整个政务智能系统提供良好的数据源。通过政务信息资源目录系统和交换系统,将分散的数据库资源进行整合,沟通各政府部门业务网和互联网,形成统一、共享的数据库系统,为应用层提供数据支撑。通过分布式并行计算与编程模型,实现大数据的高效处理。

由于数据量庞大,将采用分布式文件系统和分布式数据库对各类数据进行存储和管理。分布式数据库利用合理的数据处理手段形成统一的数据库。分布式数据库包括基础信息库、共享主题信息库、决策支持信息库等,管理和维护产生的各种数据。

在大数据整合层,可以采用Hadoop或Spark实现分布式文件存储与数据计算。对于非关系型数据库(NoSQL database),可以选用Redis、Voldemort、Cassandra、Hbase、MangoDB、Apache Jackrabbit等。

2.3 大数据应用层

大数据应用层是联结大数据整合层与大数据展现层的纽带。应用层通过各种大数据分析技术形成大量决策支持模型,总体上可以分为两类:面向政府的应用和面向社会的应用,这两类应用在数据方面进行安全隔离。根据政府的职能,应用层的服务对象又可以进一步分为:宏观调控、市场监管、社会管理和公共服务,这样就基本涵盖了政府的所有业务。政府跨部门的业务工作极其广泛,如宏观调控业务、财政综合管理业务、税收业务、进出口业务、涉农业务、食品药品监管业务、社会信用业务、社会保障业务、环境保护业务等主要业务[13],应用层利用整合层实现的部门间的信息资源共享来进行业务协同。

应用层的基础是应用服务器。应用服务器是实现特定应用的服务器系统,包括完成网站浏览的Web服务器、完成工作流管理的工作流服务器,以及实现一般数据库存取的应用服务器等。另外,在本模型中,应用服务器有一个很重要的作用——进行大数据挖掘与联机分析处理。应用层之上的各种应用主要是在大数据挖掘和联机分析处理的运算基础上实现的。

在大数据应用层,需要借助数据挖掘、机器学习中的算法实现大数据分析技术(Big data analytics),开源的R或者Python都可以较好地实现这一任务。

2.4 大数据展现层

大数据展现层面向政务智能系统的用户,分为政府内部用户和外部用户。展现层的目标是将分析后的数据以直观、易懂的形式呈现在用户面前,它具备多角度的数据可视化能力、深入的数据分析能力、根据需要随时调整报表格式的能力等,同时满足不同级别、不同来源用户的分析、决策需求。展现层是基于门户(Portal)技术的,其表现形式有Dashboard、报表、移动APPs等。

2.5 管理机制和安全机制

相关的管理机制和安全机制贯穿于模型的始终。管理方面,应建立完善的制度保障,如建立科学的信息收集机制和完善的信息利用机制。由于政务信息分布在各个不同的部门,建设一个高效的信息收集机制,及时准确地汇总各部门的信息,可为模型提供统一集中的数据基础;同时通过建设科学的信息利用机制实现模型自身价值,推动模型的高效运行。另外,模型还要提供绩效管理、系统管理(如角色管理、用户管理、数据字典管理、数据备份管理、系统日志管理、系统流量管理)等内容。

在信息收集和利用的过程中,全面的安全机制必不可少。例如,施行权限管理,根据数据的使用权限面向政府、公众提供服务;根据数据的不同安全等级,为政府部门和社会公众提供客观的数据产品。对内外网数据进行安全隔离,隔离状态下的数据交换安全可以采取数据加密、权限控制、内外网安全数据交换等保障措施。

3 政务智能模型的数据流程

政务智能模型的数据流程主要由三个阶段组成:大数据整合、大数据分析及大数据展现,其具体流程如图2所示。业务数据分散存储在各个部门异构的业务数据库中,首先利用前置交换系统将业务数据抽取到分布式的共享信息库中,这便完成了数据整合;然后利用数据挖掘、联机分析处理(OLAP)、分布式并行计算模型等分析工具,针对相应的任务进行处理和分析;最后通过大数据可视化技术将分析的结果展现出来。

nlc202309032141

4 政务智能模型的目标与效益分析

本文政务智能模型总体目标是整合分散在政府部门及社会组织中的大数据,为政府部门、组织、公民提供高效率、低成本的信息服务;充分挖掘大数据的内在价值,辅助政府决策,服务公众。实施该模型后的效益可以从内外两个方面分析。

一方面,在政府部门内部,有助于提高决策的科学性,降低决策成本,服务于政府监管,充分发挥政府职能。(1)可以使相关数据分析人员从收集、整理和汇总数据的繁琐工作中解脱出来,将工作的重点转向提供能用于科学决策的信息。利用政务智能发现数据中存在的关系和规则,根据现有的数据预测未来的发展趋势,提高政府决策的科学性、准确性。(2)集中政府各有关部门的业务数据,进行整合、分析,可以形成系统的数据、资料,使各自独立的职能部门全面了解政府各相关部门的业务信息,按需应用,促进信息共享,从而有利于各个职能部门更为高效、协同地行使监管职能。(3)由于政务智能2.0中广泛采用了开源技术,不仅有效降低了实施成本,也在一定程度上确保了信息安全。

另一方面,在政府部门外部,提供公众所需的分析型信息,增强公众和政府之间沟通的时效性,更好地服务公众。(1)政府部门内部、政府与社会各界之间利用电子渠道沟通,并向公众提供随时随地的个性化服务。(2)利用政务智能系统,企业可以方便查找、挖掘、分析其经营决策所需的有关宏观经济、经验等方面的信息,从而为企业节约交易成本,提高经济运行效率。

5 结语

在大数据时代,海量、异构、多源的数据持续膨胀。为了应对大数据为政府管理带来的挑战与机遇,本文提出了大数据环境下政务智能的框架模型(“政务智能2.0”),该模型由大数据来源层、大数据整合层、大数据应用层、大数据展现层及相应的管理机制和安全机制组成。本文对大数据环境下政务智能所需的一些开源技术做了推荐。此外,本文还分析了大数据环境下政务智能模型的数据流程、目标与潜在效益。本文的模型有助于提升政府服务和监管效率、降低政府决策成本,并为政务智能的研究和应用提供新的思路。限于篇幅,本文没有对模型的管理机制和安全机制进行深入、详尽的探讨,这方面的研究将在以后的工作中进一步开展。

参考文献:

[ 1 ] 李广乾.我国电子政务与信息化最新发展述评[J].信息化建设,2005(11):14-17.

[ 2 ] McAfee A, Brynjolfsson E, Davenport T H, Patil D J, Barton D. Big data:The management revolution[J]. Harvard Business Review,2012,90(10):61-67.

[ 3 ] ASSUNO M D, CALHEIROS R N, BIANCHI S, NETT

O M A, BUYYA R. Big Data computing and clouds:Trends and future directions[J]. Journal of Parallel and Distributed Computing,2015(79):3-15.

[ 4 ] Office of Science and Technology Policy, Executive

Office of the President. Obama Administration Unveils‘Big Data’ Initiative:Announces $200 Million in New R&D Investments[EB/OL].(2012-03-29)[2015-

07-27].http://www.whitehouse.gov/administration/eop/ostp.

[ 5 ] European Commission. A Digital Agenda for Europe[EB/OL].(2010-08-26)[2015-07-27].http://ec.europa.eu/digital-agenda.

[ 6 ] United Nations. E-government Survey 2012:E-gove-

rnment for the People[EB/OL].(2012-03-16)[2015-07-

27].http://unpan3.un.org/egovkb/Portals/egovkb/Docum-

ents/un/2012-Survey/unpan048065.pdf.

[ 7 ] 陆立军.政务大数据起步,助力智慧政府转型[EB/OL].(2015-06-19)[2015-07-27].http://www.gov.cn/zhengce/2015-06/19/content_2881884.htm.

[ 8 ] 国务院. 促进大数据发展行动纲要[EB/OL].(2015-

08-31)[2015-09-06].http://www.gov.cn/zhengce/con

tent/2015-09/05/content_10137.htm.

[ 9 ] KIM G H, TRIMI S, Chung J H. Big-data applications

in the government sector[J]. Communications of the ACM,2014,57(3),78-85.

[10] 程建华,李新友,潘春燕.电子政务的发展方向:政务智能[J].电子政务,2006(1):112-118.

[11] 樊博,孟庆国.面向主动服务模式的政务智能系统框架研究[J].情报杂志,2006,25(1):72-74.

[12] 王晋,舒宝淇.刍议大数据时代的电子政务[J].新世纪图书馆,2013(7):24-26.

[13] 吴焱,高栋,吴志刚.政务信息资源目录体系与交换体系标准研究[J].信息技术与标准化,2005(11):3-15.

大数据时代下的移动健康 篇9

“精准医疗大数据的普及化,正带来中国乃至全球健康产业的变革。”最近,浙大一院正式成立“精准医疗中心”,中国中国工程院院士、浙大一院传染病诊治国家重点实验室主任、感染性疾病诊治协同创新中心主任李兰娟教授在“医疗健康大数据与精准医学”的专题报告会上称。

在大数据的时代,医学最大的改进就是个性化和精准治疗时代的到来。有了大数据的分析,“看医生”模式正转变为“被医生看着”。家用智能硬件设备的生命体征检测,使得低成本、高效率的全数据收集模式成为可能,几乎人人都能适用。而精准医疗的长期目标,是每个人的健康管理。李兰娟团队将在浙江创建一个人数规模超过100万的志愿者队列,基于他们的基因数据、生物样本、生活信息及所有电子健康信息数据库将推动浙大一院团队做出一系列新研究。此前,中科院已经联合其院属企业中科新知共同研发了心晓管家健康模型和大数据挖掘,以HRV为主导的多参数健康模型能够为每个人提供专属的健康趋势。

移动健康迅猛发展,通过移动互联网,用户的个体化自我监测变成现实,通过移动APP,用户与医生能随时随地地在线联系,通过医疗大数据和健康模型报告,医生和家属能清晰地看到健康疾病趋势。我国目前医疗资源稀缺,医生和护士短缺,医疗服务业普遍人手不足,而培养一名医生需要10年到15年,培养一名护士需要8到9年,培养周期长导致后续力量难以迅速填补。此外,医疗资金短缺,使得医疗服务软硬件提升困难。因此,如何利用移动健康产品提高人们的自我监测能力,提高医生们的诊断效率显得尤为重要。北京大学创新教育与研究院执行院长蔡剑教授介绍:目前我国移动数据和桌面应用已超过美国,我国用户花在这方面的时间比例为55%,美国为38%。数据的不断增加导致了“数据洪灾”,现有数据不是不够大,而是太大,大得没有时间和精力去分析。在移动医疗健康领域,也是如此。拥有类似心晓健康模型的大数据分析工具,以精准、无扰、连续的生命体征监测数据代替医院的逐点数据进行分析,从而得出健康趋势,将使目前市场上智能硬件数据没有实际意义的现状大大改观。

上一篇:学生自我评价集合下一篇:古典诗歌常见的结构形式(教师中心稿)