截稿前半个月,记者约了曾做过财政信息化专题的某省财政厅信息中心主任,想聊聊关于大数据的问题。所谈无非也就三个问题:大数据应当由谁收集,由谁管理,由谁监控。虽然他一再表示"这次一定要给我匿名",但还是说了许多听起来虽然有些刺耳,但却是大实话的话。另外,笔者整理了一部分去中原某地调研时与当地财政局信息中心主任的谈话资料,并将两者加以合并,遂成此文。 疑问之一:谁收集? 《新理财》:您知道大数据吗? 答:知道,但也就仅限于知道。这和领导的重视是分不开的。 《新理财》:您认为什么是财政大数据? 答:大数据,就是把许多财政数据归纳整理的一套系统。 《新理财》:那您认为这套系统现在进行到哪步了? 答:我就知道你要问这个问题。我先问你一个问题,你现在上网搜,有没有关于财政大数据的新闻? 《新理财》:很少。 答:为什么很少?我告诉你,因为根本就没人知道这是个什么东西。是个什么系统。说到底,这是一个伪命题,从根上就没有办法解释。你告诉我,什么叫财政数据?是财政自己的数据库吗?当然是,也当然不是。 《新理财》:怎么叫是也不是? 答:说它是,因为我们给财政大数据的定义,是政府资金及项目如何流转,如何决策的这些数据。这些数据必然在财政自己的数据库里面,所以接下来的一切工作都顺理成章。说它不是财政自己的数据,因为它涉及到很多财政之外的东西,上到政府,中到各预算部门,下到老百姓的生活方方面面。它不是财政自己拥有的东西。要是打个比方的话,它更像是一个政府资金流转的日记。所以我说它既是财政的数据,又不是财政的数据。这就是第一个矛盾。 《新理财》:所以您说,财政大数据的第一个问题,是谁来收集它的问题。 答:没错。你想,大数据首先要求的是数据的精确,时效。我们现在省市县三级财政,上下级财政局的数据网络建设到能够通,还不能说畅通的情况,花了五年。建设网络成功以后,我们让各个层级之间数据格式能够兼容,又花了两年,到现在还没完全兼容。 《新理财》:那不是说有很多数据都是废数据? 答:按照"规则"来说,我们作为省厅,不能强迫下级财政用和我们一样的软硬件。但用不一样的,很多时候就是不兼容。人家报上来数据了,好,到我们这里,打不开。人家也不管你,反正我上报了。爱看不看。你想上下级都是我们财政部门还这么多的麻烦,其他预算部门给你数据?人家就问你一句话,我们按半年,按季度报财政数据,我们就已经够了,你和我们都是平级单位,你凭什么要收集我们的数据?还每时每刻都要收集? 《新理财》:确实也存在这样的麻烦。 答:部门有私心,这是财政数据最大的阻碍。我们说历史上有很多部门有小金库,原因就在于它不是每一笔账都报给财政。有的地方做会计集中委派制度,又做会计中心制度,每个部门的每一笔钱都要经过财政部门签字同意,这就是大数据要做的一个结果。当然他们还是人工报账,但我们不能苛求。这件事让财政自己做,不可能。一定是财、政联合,政为主的决定。换句话说,也不是财政要收集你的数据,而是政府要收集数据。财政只是一个工具化的部门而已。 疑问之二:谁管理? 《新理财》:其实您说的这个已经不是收集的范畴了,是管理的范畴。 答:都收集不来,就别谈管理的问题了。还是要说我们对于数据的管理还处于一个极度混乱的状态。细化到什么程度,没有。数据密度要达到一个什么样的标准,没有。数据要公开到一个什么样的程度,不知道。这些数据收集花了多少钱?不知道。谁对这些数据的真实性负责?不知道。每年的预算为什么要几上几下,说好听一点要斟酌,说不好听一点叫财力分割。 《新理财》:而且大数据要求这些数据的量很大,需要选出有用的数据。 答:你说的是另一个问题,是数据的筛选问题。这就属于技术层面了,如果真要做到"大"数据所要求的,用一个词来形容,数据量可谓浩如烟海。但你看我们信息中心,算上维修工人都过不去十个人,筛选信息能够做到吗?不能。 《新理财》:公司理财的做法,有些是将这些数据交由专业的数据公司去处理。 答:说的严谨一点,这种做法在政府理财层面暂时不可行。为什么不行?第一点,收集不全,谈不到筛选。第二点,我们现在没有专门给政府理财层面做大数据的公司。说实话现在给这些公司去做,他们做的有时候还没我们自己做的好。第三点,也是现在很多人避讳说的一点,就是有政府机密的问题。 《新理财》:但这些数据最后也是要公开的。 答:那你说这个"最后"是什么时候?至少不是现在。为什么避讳说这个问题,因为我们现在的运行机制,是每个部门都给其他部门留一步,不去完全的管它。以前我们有预算外资金,现在我们把全部部门预算都纳入盘子,那也要在预算里留出足够的弹性。说白了财政现在还仅仅是个出纳,它不是掌柜的,没那么大的权限。在这种机制下运行大数据,弹性一下就会变成0,部门还不翻了天。于理它说得过去,于情财政没法管这事,会触动太多人的利益。 《新理财》:那打个比方,如果真实行了大数据改革,这些数据的管理和整理者应该是谁? 答:应该是政府。只有把数据交给政府,部门之间才没有问题。但我们知道,政府的数据,很大一部分是财政数据。是不是还要成立一个数据处理部门?还是要授权给财政部门做这件事?人员编制怎么安排?这些事,在实际落地的过程中都无法避免,不是说说就能实行的了的。 疑问之三:谁监督? 《新理财》:现在有些部门也说,我们也按时报给你数据了啊,就按照我们报的做预算,然后执行就可以了。 答:这涉及到两个问题,是数据来源和数据责任的问题。我先说第一个,大数据的来源是自然生成的,以网络化为基础,政府资金一动,就会自然生成一组数据。但现在我们得到的数据是人为生成的,经过了很多部门的修饰,甚至是篡改。去年有一个新闻说公开某部门的招待费一年几千块钱,这不是天方夜谭么,但他们给出的数据就是这样。 《新理财》:那么这些虚假的数据就没有责任? 答:很遗憾,我们现在对于这种数据改动是没有问责机制的。比如政府采购一项办公用品,报价就报十万,实际就值一千,他说一千那个我没看见,或者说一千那个没有十万的质量好,用上有可能马上报废,你毫无办法。每年财政部门因为这些东西要和部门周旋几个月,骗人又没有责任,最多查出来撤销这笔预算而已。本身就是假的,他们的成本几乎等于零。 《新理财》:那么就必须有一个监督的机制存在。 答:监督机制和管理机制是相辅相成的,一个机构有管理权,它就应该有监督权。我们不能妄言财政就有这个能力,但这是一种可选方案。 《新理财》:最后一个问题,您搞了这么多年信息工作,如果用百分比来衡量我们距离"大数据时代"有多远,您能不能给出一个直观的判断? 答:用我们的"完成度"概念来说,我认为,现在我们的大数据系统,完成最多20%。