当前位置:首页 >> 免费论文 >> 其他论文
浅谈电子数据质量问题及解决方法[2]
作者: 李斐 审计署 发布时间:2010-01-26 点击数:7251  正文:【 放大 】【 缩小
简介:  随着社会信息化程度的提高,许多的单位和组织都建立了与之相适应的计算机信息系统,并且系统功能不断完善,存储了大量电子数据。由于被审计单位软硬件平台的异构性以及人为隐瞒信息等原因,造成审计部门与被审计单位之间的信息不对称,审计人员所获取的电子数据存在不同程度的 ...

  2 数据整理:审计人员在获得电子数据后,首先应处理电子数据本身存在的缺陷,为下一步的数据分析提供保证。该阶段常遇到以下三种情况:

  (1)数据缺失:在一些记录的字段属性上没有值,如资金金额、客户名称为NULL。这可能是由于采集时值不确定、误操作或采用缺省值等原因而引起的。

  (2)属性异常:数据表中某些记录的属性值在数据迁移过程中发生变化,例如数据被采集到审计人员的审计软件后某数据文件的“日期”字段显示的属性为数字类型。

  (3)冗余冲突:既有可能是同一数据在不同数据源里的简单重复,如数据集中有多条记录表示同一个实体,也有可能重复的数据之间还存在冲突。

  3、数据分析:需要审计人员充分理解数据库中各个数据文件的格式,文件中各字段代表的具体含义,及其各个文件中的相互关联等情况,运用各种分析方法对电子数据进行深层次的挖掘工作,发现隐藏其中的问题,分析中遇到的问题主要是:

  (1)数据命名无规则:底层数据库中的文件名或文件中的字段名大多使用英文字母或特殊符号,有些被审单位使用某些软件公司开发的应用软件,文件或属性命名规则性较差,相关联的数据文件名称没有明显的区分,造成审计人员花大量的时间分析文件内容和相互关联关系,影响审计效率,同时,审计人员也有容易忽略某些具有特殊含义的字段,造成审计风险。

  (2)数据模式冲突:是与数据模式相关的不一致,主要有命名冲突和结构冲突。命名冲突表现为同一名称表示不同的实体/属性或不同名称表示同一实体/属性。如一个数据源中用“借方”来表示科目表中“借方”属性名,而在另一个数据源中用“Db”这一英文缩写来表示。结构冲突通常表现为同一对象在不同的数据源中用不同的表示形式,如对于借贷方余额的存储,在一个数据源中用“借方余额”和“贷方余额”两个属性来表示,而在另一个数据源中用“借贷方余额”和“借贷方向”来表示。

  (3)数据语义冲突:是与实例相关的不一致,产生的原因主要是不同的设计者在对客观对象进行阐释时采用了不同的描述方法。如在一个数据源中用“借”或“贷”来表示“借贷方向”,而在另一个数据源中用“Dr”或“Cr”来表示同一属性的取值。

  (4)数据值异常:即数据集中存在孤立点,它们不符合数据的一般模型或规律。造成孤立点的原因很多,可能是数据进行迁移时产生的错误,也可能是程序对缺失属性值自动生成的替代值,同时,孤立点也可能正好反映了数据中蕴含的某种审计线索,审计人员不能简单将它删除。

  四、处理电子数据质量问题的基本方法

  出现电子数据质量问题将直接影响审计结果的准确性,审计人员应予以高度重视。解决这些电子数据质量问题对于提高审计的质量与效率都至关重要,对于不同的问题应该“对症下药”,采用不同的解决方法:

  1.对于被审计单位的信息系统没有实现数据接口或实现了的数据接口不能满足审计的要求的问题,审计人员应充分与被审单位信息系统管理人员进行沟通,了解电子数据格式,利用被审单位信息管理软件平台将数据导出转换为符合审计要求的数据格式,或者通过ODBC等数据库访问接口,直接访问被审计信息系统的数据库,获取电子数据,必要时联系软件系统开发企业的有关技术人员帮助解决。

  2.命名规则性较差的电子数据文档,通常不符合一般数据库、表、字段等名称的命名格式,一方面需要审计人员阅读有关的应用软件开发或系统数据库维护文档,获取数据表文件及包含属性的含义,另一方面,在无法获取文档帮助的情况下,需要审计人员通过文件中具有明显特征数据内容找出重要的帐表文件,推导出部分属性含义,再根据这些属性找出其他关联文件。

  3. 数据缺失的处理根据不同的情况,有以下解决方法:

  (1)对于那些包含大量空值的列的电子数据,不仅不能给审计人员足够的信息,反而会影响审计效率和执行的效果。解决这一问题的方法之一就是删除那些包含大量空值的列。

Total:3123

责任编辑:

参与评论

验证码: 看不清楚么?点我刷新认证码 用户名