感谢社科院城环所邀请我来做智慧城市方面的一个报告,今天的题目跟我的一个课题有关系,之前我承担了国家质检总局关于国家基础信息资源库的研究工作,即如何采取一种有效的方法,使信息为全国的各个业务部门共享。在这个过程中我们提出了数据管理的概念,国家法人库对基础信息资源库的建设有了一个方法,国土部的基础信息以及其他相关信息都可以使用这种方法进行利用。
由于时间的限制,我主要介绍四方面的内容。
第一,介绍一下主数据的来源和背景;第二,介绍一下主数据的含义和主数据的管理;第三,介绍一下国家主数据在电子政务方面的作用;第四,举一些例子。
主数据怎么来?主数据来源于我们对国家在应用基础信息资源库的过程中的搜寻和思索,来源于解决技术难题的方法。关于基础信息资源库,我们知道国家在2002年提了四大数据库,但是这些基础数据如何为部门所共享、所使用,数据如何采集,对数据库如何进行维护和运营,那些问题一直没有得到合理的解决。我做了一个对比,就是将一些重大文件里对基础数据的基本论述以及各种论述之间的不足做了一个比较,结果发现三大文件是我们在做电子政务的研究工作时通常要用到的。一个是2002年的17号文件,另一个是2006年的总体框架,这两个文件的起草工作我都参与过,后面的一些信息化文件我也都参与了起草。关于如何处理主数据和电子政务资源库的想法,也是源于我在相关工作过程中的思考。
在这个过程中主要面临这么几个问题:一是基础数据库的建设应该采取什么样的组织管理模式,二是基础数据、业务数据和元数据的关系,三是基础数据管理部门与其他业务部门之间的关系,四是在国家层面如何实现电子政务的发展目标。数据有很多,但是怎么使用?数据管理是实现信息共享的一种方法。我们在研究过程中发现,数据在很多行业中得到了大量应用,而且有成熟的主数据应用方法和管理方法。也就是说,能够把基本的理念和方法应用到电子政务中,使其他行业部门可以用大数据管理的理念去构建资源的管理。
我们简要地谈谈主数据的思维。我举三个例子,一个是在税务行业,第二个是在新产品研发行业,第三个是在公安或民政部门,这三个领域都存在一些公用信息和关于对象的不同活动,涉及业务管理的具体信息。这些信息的案例有一个共同的特点,即这个具体对象的属性信息是不变的,也就是说,关于这个属性的那些共性的信息是不变的。比如说某一个人到某一个部门去办某一件事情,形成了这个政府部门的记录。从数据的稳定性来讲,这个信息分成两块,有一块是不变的,有一块是变化的,也就是说每次办的这个业务的具体内容是变化的,但是有一个数据是不变的,比如个人的身份信息,或所代表的企业法人的信息,这些信息是不变的。所以我们在工作当中,不应该把变的信息和不变的信息作为一类东西完整地放在一个地方,而应该把这两类信息分开。我们后面还要谈到这个问题,比如说一些大型的机械产品,包括飞机,在整个研发过程中涉及特别多的模型以及不同的批次,如何在这个变化过程中找到那些基本的“框框”?
在介绍完主数据存在的普遍性后,我们可以对它的定义做一个概括。主数据是指满足业务协同需要的、反映核心业务实体状态属性的企业或组织机构的基础信息。当然,我们主要还是从自然人或法人的角度进行概括。这里有几点需要注意,一是关于实体状态属性,所谓属性就是指某一个对象在相当长的时间里不变的那些基本反应。它不是完全地变化,同时它也是为其他各个部门所共享的,也就是说,它是所有部门数据的最小公约数,它的特质是跨越部门、跨越流程、跨越组织。主数据和主题数据不是一回事,主数据是客户能用够使用的,在云计算的状态下,主数据可以发挥它的价值。其实主数据也是最近这几年才受到重视。
现在主要是一些大型公司比如IBM有数据管理系统,为银行或航空公司提供定制化服务。不同的行业或不同的领域所使用的系统会有很大的不同,但是基本理念是一样的。在对各个行业、各个部门的数据进行分解和处理的时候,都是以主数据管理系统为核心的。
原来做电子政务或基础数据库时,每一个部门都有自己的数据,而且觉得很重要,所以都把它们并列为基础数据。但是很多业务其实不是很基础,一些部门之所以会把数据库说成基础数据库,是为政府财政投资提供一些说法。按照我们刚才讲的数据管理的概念,这些数据库并不是基础数据库,而是把主数据和一般的业务流程数据放在一起。
有国家主数据的概念,国家的主数据满足国家跨部门的电子政务的业务需要,反映业务实体法定属性的状态变化的基础信息,基于法人的过程依法办事。
我说一下国家主数据在法人库方面的应用,法人主数据是在统筹质检、工商、编制以及民政等部门有关各类法人和非法人组织机构的法定基础信息的基础上建立起来的。有了这个概念以后,我们再来回顾一下原来国信办在2005~2007年建的企业基础信息共享工程。这个工程很大,但是有了关于主数据管理的概念以后,我们会发现我们的做法其实存在很多的问题。这个工作之所以没做好,跟我们没有科学的认识有关系,与没有从主数据管理的角度去提炼基础信息有关系。我们原来在四个部门做基础信息共享的时候,列了一个共享清单,原来国信办做过统筹。这个方面做得比较乱,既有相同的信息,又有各个部门的具体业务信息,把业务主数据信息和日常的业务信息捆绑在一起。
编制法人主数据需要满足一些基本的要求,只有这样才能构建真正的主数据管理系统。法人主数据分三个方面,第一是基本信息,第二是身份管理信息,第三是管理服务信息。第一个是关于企业法人的,第二个是关于社保法人的。关于法人主数据模型的意义,因为内容很多,所以我就不详细阐述了。如果按照主数据管理的理念做法人库的标准化工作,那么就可以理清很多原来很模糊的概念,让我们的工作做得更加有条理。主数据管理思维已经在银行的很多部门使用,我们完全可以把这个思维方法用到电子政务的资源库建设中,这样有利于节省成本。以法人为核心,将各个部门相关的业务点连起来,形成流程。
建立法人主数据管理系统面临很多技术问题以及其他障碍。主数据和大数据有什么关系?主数据强调数据基本的属性,而大数据强调数据不断变化的价值,强调在变化中发现它的实时价值。主数据的核心是对复杂数据的结构化的一种作用。大数据里有很多非结构数据,如果通过主数据的思维去编列这些数据,则可以减少非结构化的现象,主数据管理是减少大数据非结构化现象的一种有效方法。