手机看中经经济日报微信中经网微信
当前位置     首页 > ce专稿 > 独家稿件-综合类 > 正文
中经搜索

大数据在政府部门的应用(二)

2014年05月19日 09:57   来源:中国经济网   

  大数据在政府部门的应用(一)

  企业和政府的比较

  虽然企业和政府的主要任务并不冲突,但各自的举措具有不同的目标和价值。企业的主要目标是通过提供产品和服务获取利润,发展或维持自身的竞争优势,创造令消费者和其他利益相关者满意的价值。政府的主要目标则是维持国内稳定,实现可持续发展,确保公民的基本权利,改善国民福利和促进经济增长。

  在竞争的市场环境下,大部分企业着眼于制定短期决策,并且执行人员数量也很有限。而政府的决策制定过程通常需要更长的时间,经过不同群体(包括官员、利益集团和普通民众)反复讨论和磋商,在彼此间达成一致后才能有最终结果。因此,政府制定决策要完成很多程序性步骤,以降低决策风险,提高决策效率和确保其效果。由此看来,大数据在政府部门和私有部门的应用具有很大不同。

  数据集属性比较

  大数据环境是以信息技术为基础的决策支持系统的演进:从上世纪60年代的数据处理,到70-80年代的信息应用,再到90年代的决策支持模型,进入2000年后的数据存储和挖掘,再就是今天的大数据。大部分与大数据相关的技术和分析应用是从2010年左右开始出现的,故大数据时代正处于早期阶段/发展初期。

  大数据的属性和挑战已经用3V来描述:海量(volume)、速度(velocity)和多样性(variety)。海量是大数据的基本属性,各类机构和组织在业务活动过程中产生数以百万亿字节的数据,数据容量越来越大。速度是指数据量增长越来越快,对处理速度和响应速度提出更高要求,运用传统的信息技术手段难以有效处理,以及从中提取有价值的信息。多样性是指数据以各种各样类型的出现,包括结构化的(SQL等传统的数据库);半结构化的(具有关键字和规则,但数据结构不规则或不完整)和非结构化的(非组织性的数据,没有商业智能)。

  大数据的概念已经表明,大数据不仅仅是海量的数据,还包括通过处理大数据从中获取价值。如今,大数据与商业智能、商业分析和数据挖掘是同义词,已经使商业智能从报告和决策支持转移到预测和制定未来行动纲领。新的数据管理系统旨在应对大数据带来的挑战,如分布式架构技术是一个开源平台,目前是在管理存储和接入,以及高速并行处理大规模数据集等方面应用最为广泛的技术。然而,对于很多企业,特别是不少中小企业来说,分布式技术是一个挑战。因为这些中小企业往往不具备应用大数据需要的专业人员和经验,他们需要外部资源帮助。应该看到,大数据应用需要的不是纯粹基于技术的技能,找到正确的分析大数据的技能,或许是企业应用大数据面临的最大难题。对于大部分企业来说,发现和选择胜任的数据专家(在数据挖掘、可视化、操作和发现等方面)是困难而昂贵的。

  其他商业大数据技术包括Casandra数据库,它是一个动态的数据库工具,采用行存储格式,每一行能存储二百万个数据单元。对于企业的另一个挑战是选择最适合他们的大数据技术:开源技术(如分布式架构技术)或者商业技术(如Casandra, Cloudera, Hortonworks, MapR)。

  政府在应用大数据时,不仅要处理多个来源、不同格式数据集成等一般问题,而且还面临一些特殊挑战,最大的挑战就是数据搜集。因为政府搜集的数据不仅来自于多种渠道(如社交网络、互联网、众包),也来自于不同的来源(如国家、机构和部门),搜集难度可想而知。其次,在国家之间分享数据和信息是一个特殊的挑战。跨国分享信息,由于涉及到语言转换和不同的文化背景(内容的表现形式),分享和传递的信息有可能失真。第三个挑战是在一个国家不同的政府部门和机构之间分享数据。政府数据与商业数据最重要的不同就在范围和区域,其差异近几年都在平稳增长。政府(包括地方政府和中央政府)在实施法律和规章、提供公共服务和监管金融交易的过程中积累了大量数据。这些数据的属性、价值和带来的挑战,都不同于公司运营中产生的数据。政府的大数据特征属性可以表述为存储、安全和多样性。通常,每个政府机构或部门都有自己的存储机构,用于存储公共或机密信息,而且并不愿意分享各自的专有信息。

  每个系统都保存有与其他系统隔绝的信息,这使得政府机构和部门之间的数据集成更加复杂。彼此沟通的失败有时是影响数据集成的重要原因。例如,在英国,警察机构和医院之间曾经打算在暴力犯罪方面分享信息,但这一项目最终失败,原因就是两者之间沟通不足。另一个分享政府信息的挑战是建立统一的数据格式,能够允许不同机构进行分析。尽管大部分政府数据是结构化的,但是从多种渠道和来源去搜集数据仍然是一个更大的困难。缺乏标准化的数据格式和软件,以及从多个政府机构的离散数据库中提取有用信息的跨机构解决方法,也是政府推进大数据应用面临的挑战。但由于政府的紧缩措施,导致其缺乏相应资金去发展和推进解决上述问题。

  在使用大数据时,政府必须解决相关的法律、安全和许可要求等问题。在搜集和使用大数据用于预测分析与保障公民隐私权之间,应该有一条清晰的界限。

  在美国,美国爱国者法案允许合法监控,有时还可以监控公民;电子通讯隐私法案允许相关部门不经授权便可进入电子邮件系统;要对网络情报共享和保护法案(CISPA)加以注意,它将允许安全机构和私人网络公司之间的信息共享,这增加了人们对误解信息不适当应用的关注。

  数据安全是政府大数据最基本的属性,因此,搜集、存储和使用大数据都需要特别注意。然而,目前大部分大数据技术,包括 Casandra数据库和分布式技术,都缺乏足够的安全保护工具。对政府而言,确保安全是又一个挑战。

编译:工业和信息化部国际经济技术合作中心 高常水 江道辉

更多精彩内容参见“中国经济网-国际频道-国际IT行业资讯”  

 

(责任编辑:林秀敏)

閸掑棔闊╅崚甯窗
延伸阅读
娑擃厼娴楃紒蹇旂ス缂冩垹澧楅弶鍐ㄥ挤閸忓秷鐭楁竟鐗堟閿涳拷
1閵嗕礁鍤掗張顒傜秹濞夈劍妲戦垾婊勬降濠ф劧绱版稉顓炴禇缂佸繑绁圭純鎴斺偓锟� 閹存牑鈧粍娼靛┃鎰剁窗缂佸繑绁归弮銉﹀Г-娑擃厼娴楃紒蹇旂ス缂冩垟鈧繄娈戦幍鈧張澶夌稊閸濅緤绱濋悧鍫熸綀閸у洤鐫樻禍锟�
閵嗏偓 娑擃厼娴楃紒蹇旂ス缂冩埊绱欓張顒傜秹閸欙附婀佹竟鐗堟閻ㄥ嫰娅庢径鏍电礆閿涙稒婀紒蹇旀拱缂冩垶宸块弶鍐跨礉娴犺缍嶉崡鏇氱秴閸欏﹣閲滄禍杞扮瑝瀵版娴嗘潪濮愨偓浣规喅缂傛牗鍨ㄦ禒銉ュ従鐎癸拷
閵嗏偓 閺傜懓绱℃担璺ㄦ暏娑撳﹨鍫担婊冩惂閿涙稑鍑$紒蹇庣瑢閺堫剛缍夌粵鍓ц閻╃ǹ鍙ч幒鍫熸綀娴h法鏁ら崡蹇氼唴閻ㄥ嫬宕熸担宥呭挤娑擃亙姹夐敍灞界安濞夈劍鍓扮拠銉х搼娴f粌鎼ф稉顓熸Ц閸氾附婀�
閵嗏偓 閻╃ǹ绨查惃鍕房閺夊啩濞囬悽銊╂閸掕泛锛愰弰搴礉娑撳秴绶辨潻婵嗗冀鐠囥儳鐡戦梽鎰煑婢圭増妲戦敍灞肩瑬閸︺劍宸块弶鍐瘱閸ユ潙鍞存担璺ㄦ暏閺冭泛绨插▔銊︽閳ユ粍娼靛┃鎰剁窗娑擃厼娴�
閵嗏偓 缂佸繑绁圭純鎴斺偓婵囧灗閳ユ粍娼靛┃鎰剁窗缂佸繑绁归弮銉﹀Г-娑擃厼娴楃紒蹇旂ス缂冩垟鈧縿鈧倽绻氶崣宥呭鏉╂澘锛愰弰搴も偓鍜冪礉閺堫剛缍夌亸鍡氭嫹缁岃泛鍙鹃惄绋垮彠濞夋洖绶ョ拹锝勬崲閵嗭拷
2閵嗕焦婀扮純鎴炲閺堝娈戦崶鍓у娴f粌鎼ф稉顓ㄧ礉閸楀厖濞囧▔銊︽閳ユ粍娼靛┃鎰剁窗娑擃厼娴楃紒蹇旂ス缂冩垟鈧繂寮�/閹存牗鐖i張澶嗏偓婊€鑵戦崶鐣岀病濞村海缍�(www.ce.cn)閳ワ拷
閵嗏偓 濮樻潙宓冮敍灞肩稻楠炴湹绗夋禒锝堛€冮張顒傜秹鐎电顕氱粵澶婃禈閻楀洣缍旈崫浣烽煩閺堝顔忛崣顖欑铂娴滆桨濞囬悽銊ф畱閺夊啫鍩勯敍娑樺嚒缂佸繋绗岄張顒傜秹缁涘墽璁查惄绋垮彠閹哄牊娼堟担璺ㄦ暏
閵嗏偓 閸楀繗顔呴惃鍕礋娴e秴寮锋稉顏冩眽閿涘奔绮庨張澶嬫綀閸︺劍宸块弶鍐瘱閸ユ潙鍞存担璺ㄦ暏鐠囥儳鐡戦崶鍓у娑擃厽妲戠涵顔芥暈閺勫簶鈧粈鑵戦崶鐣岀病濞村海缍夌拋鎷屸偓鍖礨X閹藉嫧鈧繃鍨�
閵嗏偓 閳ユ粎绮″ù搴㈡)閹躲儳銇�-娑擃厼娴楃紒蹇旂ス缂冩垼顔囬懓鍖礨X閹藉嫧鈧繄娈戦崶鍓у娴f粌鎼ч敍灞芥儊閸掓瑱绱濇稉鈧崚鍥︾瑝閸掆晛鎮楅弸婊嗗殰鐞涘本澹欓幏鍛偓锟�
3閵嗕礁鍤掗張顒傜秹濞夈劍妲� 閳ユ粍娼靛┃鎰剁窗XXX閿涘牓娼稉顓炴禇缂佸繑绁圭純鎴礆閳ワ拷 閻ㄥ嫪缍旈崫渚婄礉閸у洩娴嗘潪鍊熷殰閸忚泛鐣犳刊鎺嶇秼閿涘矁娴嗘潪鐣屾窗閻ㄥ嫬婀禍搴濈炊闁帗娲�
閵嗏偓 婢舵矮淇婇幁顖ょ礉楠炴湹绗夋禒锝堛€冮張顒傜秹鐠х偛鎮撻崗鎯邦潎閻愮懓鎷扮€电懓鍙鹃惇鐔风杽閹嗙鐠愶絻鈧拷
4閵嗕礁顩ч崶鐘辩稊閸濅礁鍞寸€瑰箍鈧胶澧楅弶鍐ㄦ嫲閸忚泛鐣犻梻顕€顣介棁鈧憰浣告倱閺堫剛缍夐懕鏃傞兇閻ㄥ嫸绱濈拠宄版躬30閺冦儱鍞存潻娑滎攽閵嗭拷

閳ワ拷 缂冩垹鐝幀缁樻簚閿涳拷010-81025111 閺堝鍙ф担婊冩惂閻楀牊娼堟禍瀣杹鐠囩柉浠堢化浼欑窗010-81025135 闁喚顔堥敍锟�

精彩图片
閸忓厖绨紒蹇旂ス閺冦儲濮ょ粈锟� 閿涳拷 閸忓厖绨稉顓炴禇缂佸繑绁圭純锟� 閿涳拷 缂冩垹鐝径褌绨ㄧ拋锟� 閿涳拷 缂冩垹鐝拠姘充粧 閿涳拷 閻楀牊娼堟竟鐗堟 閿涳拷 娴滄帟浠堢純鎴n潒閸氼剝濡惄顔芥箛閸斅ゅ殰瀵板鍙曠痪锟� 閿涳拷 楠炲灝鎲¢張宥呭 閿涳拷 閸欏鍎忛柧鐐复 閿涳拷 缁剧娀鏁婇柇顔绢唸
缂佸繑绁归弮銉﹀Г閹躲儰绗熼梿鍡楁礋濞夋洖绶ユい楣冩6閿涳拷閸栨ぞ鍚敮鍌炴噷鐠囧搫绶ョ敮鍫滅皑閸斺剝澧�    娑擃厼娴楃紒蹇旂ス缂冩垶纭跺瀣€愰梻顕嗙窗閸栨ぞ鍚崚姘挬瀵板绗€娴滃濮熼幍鈧�
娑擃厼娴楃紒蹇旂ス缂冿拷 閻楀牊娼堥幍鈧張锟�  娴滄帟浠堢純鎴炴煀闂傝淇婇幁顖涙箛閸斅ゎ啅閸欘垵鐦�(10120170008)   缂冩垹绮舵导鐘虫尡鐟欏棗鎯夐懞鍌滄窗鐠佺ǹ褰茬拠锟�(0107190)  娴滅悂CP婢讹拷18036557閸欙拷

娴滎剙鍙曠純鎴濈暔婢讹拷 11010202009785閸欙拷