大数据技术在企业审计中的初步应用
随着我国国有企业的改革的不断推进,信息化的快速发展,电子数据逐渐成为信息存储的主流。因此相对传统的就账查账、单一数据的分析,依靠经验发现问题的审计方式已经无法适应现代企业审计工作的需要。这就要为适应大数据时代的来临,拓宽审计工作思路,加强审计技术手段,更新审计方法,才能紧跟社会发展趋势。对企业财务软件数据与业务相关数据、行业数据与外围数据以及跨行业、跨领域数据的综合比对和关联分析,审计业务工作可极大提升审计效率,审计的深度、广度和精度得以实现大的突破,促进审计工作迈向大数据审计时代。本文从大数据的概念及对企业审计的影响入手,通过大数据关联分析技术,尝试利用大数据技术在国有企业审计中运用进行初步探索。
一、大数据的概念及对企业审计的影响
(一)大数据的概念
所谓大数据,常规定义是指大小指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的资讯。大数据呈现5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。
(二)大数据对企业审计的影响
企业审计中大数据是指被审计单位信息系统的财务、业务数据和相关辅助资料,也包括其他部门、互联网的交互数据;既包括结构化数据,又包括文档、音频、视频、图像等半结构化和非结构化数据。随着社会经济的不断发展,企业集团化、跨行业等因素,大数据的范围在不断拓展,大数据对企业审计的影响也越来越深远。
1.实现企业审计全覆盖。传统的企业审计工作主要是以企业基本状况、财政财务收支、资产负债损益为审计工作内容,查找企业内部管理漏洞、企业生产经营方面的违纪违规行为为主要工作内容。由于审计手段和审计人员自身专业素质的限制,无法更进一步对企业深层次的业务经营指标变化和内部风险控制等方面进行审查,而运用大数据审计技术,可以动态掌握企业的生产经营指标、内外风险点、趋势预测等整体情况,通过对企业各项数据的采集和初步处理,形成对审计有用的相关信息,可对企业实现实时监测、各项指标分析,对企业生产经营管理形成全过程监督,实现对企业审计的全覆盖。
2.提高审计效率与质量。一般的企业审计,审计人员基本是通过现场手工翻阅纸质凭证、会计报表等资料,查看招投标文件及工程资料,找出审批环节、资金使用环节的疑点后,通过审计座谈或实地踏勘后得出结论。这种传统的审计工作方式,耗费大量的人力物力、在信息不对称的前提下,可能最后一无所获,效率低而且发现的问题层次不高。大数据技术能将企业的所有财务数据、工程信息、业务资料等所有内容通过数据采集整理后储存于审计系统数据库中,审计人员能够通过调取查看审计基础数据库中的资料全面了解整个审计项目情况,掌握企业各项基本信息,运用SQL语言、可视化分析软件等计算机技术将自己所需的信息分离抽取,形成审计专项分析资料,明确审计重点和关注的内容后,即可有的放矢,大大提升审计效率,全面提高审计发现问题的准确性。
3.审计方式的优化转变。审计组在现场审计中,往往遇到许多困难和问题,比如企业分、子公司分散,甚至省外还有分子公司,审计人员往往在往返路途上耗费大量时间,或者受疫情影响审计人员难以集中开展审计工作的问题。大数据审计将远程审计与现场审计相结合,实现审计工作方式的优化组合。审计人员利用审计专线连接被审计企业服务器后,可以开展计算机远程联网审计,采集企业的财务软件备份资料、业务数据、工程资料等数据后,通过数据预处理、数据分析进行计算机辅助审计,发现疑点和相关线索后,确认审计调查方向和重点关注对象。通过前期的审计分析,审计人员可以有针对性的开展审计实地调查,抽取相关资料,进一步排查、验证形成审计的疑点。这样就大大压缩了审计现场时间,降低审计业务成本,提高审计效率与质量,也减少了被审计单位正常生产经营的影响。
二、大数据审计分析内容
(一)关联分析
关联分析是一种简单、实用的分析技术,就是发现存在于大量数据集中的关联性或相关性,从而描述了一个事物中某些属性同时出现的规律和模式。审计数据关联分析是指通过审计与审计基础数据的对比,运用大数据的关联分析技术,寻找不同数据源、同一数据源不同数据层级之间的相似点和不同点,通过人工认定形成审计疑点的方法。一般审计基础数据库中包含财政、单位财务、非税收支、扶贫、社保、车辆、工商等数据,做好关联分析是要有相同的信息因素作为关联点,关联点有可能是人员信息(姓名、身份证号)、工商登记号、工程名称信息、银行账号等。
(二)结构分析
结构分析亦称"比重分析"。计算某项经济指标各项组成部分占总体的比重,分析其内容构成的变化,从结构分析中,掌握事物的特点和变化趋势的统计分析方法。如按构成流动资金的各个项目占流动资金的总额的比重确定流动资金的结构,然后将不同时期的资金结构相比较,观察构成变化。
(三)趋势分析
趋势分析是指将实际达到的结果,与不同时期财务报表中同类指标的历史数据进行比较 ,从而确定财务状况,经营成果和现金流量的变化趋势和变化规律的一种分析方法。审计趋势分析是审计人员利用被审计单位数据按照时间顺序后所呈现的特征,按照审计需要寻找异常变化形成疑点,或对多年数据进行统计分析预测。
(四)数据挖掘
数据挖掘是指从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘通常与计算机科学有关,并通过统计、在线分析处理、情报检索、机器学习、专家系统(依靠过去的经验法则)和模式识别等诸多方法来实现上述目标。审计人员使用离群点挖掘、孤立点检测、异常点对比、聚类分析和关联规则等方式确定审计疑点。
三、大数据审计的步骤
(一)数据采集
审计人员应在审计前期列出审计电子需求清单,签署电子数据保密协议,在审计调查阶段对被审计单位业务范围和具体流程、信息管理系统充分了解基础上进行数据采集,采集内容包含信息系统的财务、业务数据和相关辅助资料,也包括其他部门、互联网的交互数据;既包括结构化数据,又包括文档、音频、视频、图像等半结构化和非结构化数据。为实现审计实时监督和长期监管,可实行定期报送和联网实时采集等方式进行。
(二)数据储存
由于采集的企业数据容量大、类型多、范围广等特点,审计机关应建立专门的存储服务器和冗余磁盘阵列,派专人进行管理,保证数据的安全和稳定,并对不同数据进行分类存储,优化数据访问程序,形成高效、快速、安全、稳定的存储环境。
(三)数据清洗
获取被审计单位数据后,审计人员应检查电子数据的记录数与被审计单位信息系统中的记录数是否一致、凭证数是否和采集电子数据记录数一致、财务数据与纸质报表数是否一致。然后对数据进行重新审查和校验,对数据文件中可识别的错误进行校对和更正,包括处理无效值和缺失值,删除重复信息、纠正存在常规性错误,删除不符合要求的数据,根据审计项目需求提取有价值的相关字段并形成审计标准表。
(四)数据分析
1.建立审计数据分析模型。根据审计需求,结合对相关的政策法律法规的把握,对被审计业务的认知,以及积累的审计经验,对将要分析的问题做出概括、抽象的表达,建立可通过数据化审计软件或计算机语言实现的检索、计算、统计等条件,建立多个分析模型,再从中选择最优的分析模型。
2.分析审计数据模型。
主要是指根据建立的分析模型,借助数据字典、数据库说明等技术资料和对被审计单位业务、业务流程的理解、认知情况,选择待用的基础表,确定为实现分析模型所需要的具体数据,并对具体数据进行研究,掌握被审计数据的特点,确定各字段、代码和业务数据具体内容代表的含义等。
3.建立分析性“中间表”。利用被审计单位数据库中的数据来实现审计分析,要对清理、转换后的基础数据按审计目的进行“再加工”,从基础数据中选择出所需要的数据,生成能完成审计分析的数据表。为了实现最终的分析,在数据分析的过程中往往需要构建多个数据表,这就是分析性“中间表”。建立审计分析性“中间表”一般是通过对选定的基本表进行“投影”“联接”等操作来实现。
4. 完成审计模型分析。按照分析模型,采用一定的方式、方法,对数据进行具体的分析,得出结果,完成分析。审计的数据分析可分为三个层次:第一个层次为数据分析人员通过sql、oracle 等语言来交互式地描述查询要求,对数据库中的记录进行访问和查询,实现查询型分析;第二个层次为数据分析人员先提出自己的假设,然后利用各种工具和方法进行反复递归的检索查询发现问题,实现验证型分析;第三个层次为数据分析人员通过趋势分析和行为分析,挖掘出大数据中可能被忽略的信息,为审计人员作出前瞻性的决策提供帮助,实现挖掘型分析。
(五)疑点核实
目前数据分析结果不能直接作为审计结论,必须要通过查证延伸,才能获取被审计单位的认可。审计人员应将数据分析和疑点核查始终贯穿于现场审计全过程,对疑点数据进行逐一核实。同时为区分人员责任,审计组采取谈话调查方式,与被审计单位的领导、工作人员进行谈话并作谈话笔录,经被审计单位确认后得出审计结论。
四、大数据在企业审计中的初步运用案例--关联分析的应用
在审计工作中,关联审计具有点多、面广、线长、多维的特点,运用关联数据分析方法开展工作,特别是在大型企业审计项目中,可以扩大审计范围、充分利用外围数据锁定审计证据,对违纪违规问题的查处更准确,审计效率更高,实际应用中按照外部数据来源的分类,一般分为两种关联模式:横向关联模式、纵向关联模式。下面就构建横向关联模式和纵向关联模式,分类说明关联分析技术在企业审计中的应用。
(一)纵向关联分析应用
纵向关联分析是指通过对来自同一对象不同层级之间数据的关联比对,实现对数据的多维度审查。可通过下沉,从高层级逐步下移到底层级,确定最终去向;可通过上浮,从下层级追溯至上层级,确定最初来源。
1.对企业管理层人员的关联分析。对企业管理层人员进行多维度立体分析,分析人与人的关系、人与公司的关系、人与事件的关系、人与工程的关系。一是个人身份定位。通过户籍、人员编制信息、财政供养人员信息、交纳社保信息等关联,定义人员身份,甚至可以分析家庭成员、直系亲属和其他社会关系。二是财产和参与工程项目和政府采购情况。主要包括房产、车辆、投资入股、承接工程和政府采购项目情况。三是将企业管理人员与工商登记信息比对分析,可发现管理人员经商办企业的问题,通过将企业领导干部与个人所得税信息进行比对分析,发现领导干部兼职取酬的问题。四是个人征信情况。查询个人有无车辆违章、治安处罚、职务犯罪、经济纠纷或“老赖”等情况。
2.对被审计企业的分析。国有企业经过不断改革发展,转型升级后,亟需摸清被审计对象底数。一是建立被审计单位审计台账,对市属国有企业包括市国资委监管企业和其他单位代管的国有企业,对近三年与国有企业相关的资产负债损益审计、政府投资建设项目审计、经济责任审计对象实行分类管理,对近三年来已审单位、未审单位进行分类汇总。二是从业务经营范围入手,全面分析企业的经营管理及承担社会责任情况。利用国资委三定方案、政策法规、财务报表、工作总结、会议记录、日常监督情况、网络负面舆论等信息,对企业经营和管理情况进行趋势分析,对财务报表进行异常数据分析、资金往来分析、对企业社会声誉进行评价等。
3.对政府投资项目的分析。一是将企业工程项目招投标数据与社保、工商等数据对比分析,发现政府投资建设项目在招标、投标、围标、陪标、串标、非法转包、社会招标代理公司违规与暗箱操作等方面违法违规行为。二是关联住建部门“建设项目数字化平台”的有关技术数据与影像资料,获取政府投资项目的现场监控视频及参与政府投资建设项目相关管理人员考勤信息,将现场考勤人员数据和招投标数据中的人员数据进行对比分析,筛选施工企业投标时承诺的“五大员”身份是否真实。三是将重点政府投资建设项目的现场画面中核心控制性工程,特别是容易产生质量缺陷的部位现场施工画面进行复制和截图保存,形成完整真实的历史监控视频资料,为今后监督管理需要提供第一手原始数据。四是对参与政府投资建设项目的造价和招投标等公司进行大数据分析,比对并分析相关中介机构在提供中介服务过程中人员配备、专业资格、跟踪效果、执业水平、去现场次数、结算环节造价编制、为政府建设项目提出管理性建议条目等数据参数,作为对机构评价的依据。
4.对国家重大政策落实情况的分析。通过在网上查询政府各类与国企相关的政策法规资料,开展针对性的数据挖掘分析。从财务往来款项入手,开展拖欠民营企业中小企业账款清理,促进优化营商环境。通过对财务、与行政事业单位往来等数据进行分析,对各行政事业单位和国有企业银行存款、往来资金专户、应付类账款进行摸底,与往年情况进行对比和账龄分析,关注资金量大、应付账款常年未清理的单位,关注项目早已完工验收、拖欠时间较长、拖欠金额较大等情况,可以查出拖欠工程款和未及时清理清退各项保证金的问题。
(二)横向关联分析应用
横向关联分析是指通过使用关联数据的关键字段对来自同一企业不同业务系统之间或者不同企业相同业务系统之间数据关联比对,实现不同企业数据的同类整合展示,发现审计疑点线索。其中关联字段比较常用的有身份证号码、统一社会信用代码、工商登记号、纳税号、银行账号等。
1.同一企业不同账务系统数据分析。利用企业财务收支数据,查看分、子公司财务数据及关联企业账务情况,重点关注企业各项收入、成本费用是否真实发生,是否通过循环签订购销协议、虚构贸易业务、人为增加购销环节、采取融资性贸易等方式虚增企业收入和成本;有无为完成薪酬考核指标而利用关联交易、往来款项等方式人为调节利润;部分房租收入列入单位工会而未做企业财务收入;部分资金,如接受捐赠、变卖资产等,长期体外循环,企业不列收列支的情况等。
2.不同企业业务系统间数据分析。不同企业间数据关联比对往往以被审计企业数据为主,其他企业同类业务数据起到佐证作用,通常可以包含财务数据和业务数据,也可以包含多个业务数据和行业数据,比如属于不同公司的房地产开发企业,审计人员收集了同区域分属不同企业的房地产开发公司房屋销售价格、销售代理佣金、销售前期费用等方面的数据后,可以就不同企业间销售代理佣金进行对比,发现佣金较高的企业,进行后期调查,审查是否存在销售代理公司与企业管理人员存在利益输送等违法行为。
3.外部数据关联分析。部分业务数据作为外部数据被广泛应用于各类审计项目中,如与企业相关的工商登记、税务信息、财政收支、银行账号信息等。例如通过企业与财政局的收支数据进行关联比对,可以发现该企业是否按规定将国有资本经营收益及时、足额上缴,是否存在少缴国有资本经营收益问题;与国资委的考核数据、纳税报表数据及计算企业领导人薪酬数据比对,可发现企业有无少计利润造成国家税收损失及为多领取薪酬虚增企业利润等问题。
用户登录
还没有账号?
立即注册