您现在的位置:首页
税收宣传工作动态
丹阳地税构建“本地化数据仓库”提升管税效能

发布时间:2017年12月19日
信息来源:镇江市丹阳地税局
袁松涛
字 体:【
访问次数:

  今年,丹阳地税充分运用大数据理念、互联网思维和集成思路,依托信息化手段构建“数据仓库”,对分散在各个应用系统中的内部数据,以及第三方、互联网等外部数据高度集成、整合和统一管理,实现数据资源本级集中和共享,通过筛选挖掘,开展“微观、宏观”多维分析,辅助科学高效的应用决策,从而促进税收服务和治理方式的根本转变,保障和支撑税收治理现代化顺利实现。
  一是以“海量存储”为根基,解决数据集中常态化问题。针对税收征管系统经历多次变革,登记申报、税源管理等信息零星散落,互联网和第三方涉税数据重即时利用轻后期增值,基层没有形成仓储式管理等问题,委托软件公司,成功开发本地化数据仓库系统,将分散在各个不同系统、不同业务模块中的内外部数据按照“一户式”的要求进行整理、筛选、归并,不仅保存完整的历史数据,还实现增量数据的全天候自动抽取、定时更新,形成集成的纳税人“一户式”数据源。截至10月底,共享土地房产、建筑项目竣工备案、国有土地使用权转让等第三方信息29534条;储存大集中税款征收和财务报表、金三征收和财务报表,以及契税、耕地占用税等8957507条内部信息;抽取法院淘宝拍卖、上市公司公告、土地挂牌成交、政府采购成交等互联网涉税信息2370条。
  二是以“深度加工”为关键,解决数据统一标准化问题。面对解决未经加工的各种来源的内外数据无法用于正常数据分析的问题,运用元数据管理工具,通过数据抽取、清洗、转换、匹配、聚合等加工功能,将数据加工进入数据仓库,实现内外部各种形式数据源的标准化、格式化,成为数据分析的可用资源,实现数据的动态管理,形成“数据字典”,服务各层级的分析应用。其中,第三方数据已实现智能模糊匹配,通过组织机构代码、工商执照号码、国地税联合办证税务登记证号码、自然人身份证号码等关键信息,目前已完全匹配 26092条, 匹配率达88.4%,模糊匹配 2586条,匹配率达 8.7%。
  三是以“精准问诊”为核心,解决数据多层面需求问题。针对原来数据分析主要靠业务人员写需求,技术人员取数开发这种衔接不对称的问题,通过提供充分的数据项,配备先进的分析工具,实现基于平台自主选取数据项、灵活开展数据分析。一方面能通过“全景一户式分析”功能,给具体纳税人的涉税行为、习惯“精准画像”。如通过“数据仓库”中增值税、消费税等征收数据分析纳税人缴纳相关的城建税是否正确;通过“数据仓库”永续盘存的房、土两税税源管理模块,分析纳税人房、土两税税源登记是否与实际一致。另一方面能通过“快捷分析”功能,实现统计数据、直接查询、验证数据的“一键秒杀”,应用于行业税收分析或按行业建设税收风险模型提供数据。以对全国最大规模的丹阳眼镜产业经济税收分析为例。原来收集丹阳市该行业2000多家企业的税收申报征收、财务报表数据以及国税、外贸等第三方数据,通过人工计算,比对分析,总共需要3、4天时间才能得出成果;而运用“数据仓库”的储存数据和分析工具后,不到半天时间,就将该行业经济税收发展的总体态势、存在“短板”等形成多个图表和税收风险点列出。
  四是以“增值利用”为目标,解决成果全方位转化的问题。针对以往数据应用形式单一、成果转化少的问题,丹阳地税将各类分析结果进行推送和展示,实现各层级的情报交换、数据管理各环节的情报转化和增值利用,将分析结果等以表格、图形等方式进行多样化展示,广泛应用于行业化税收分析、个性化税收服务、风险信息预警、稽查选案工作等。如风险信息预警提示为风险监控部门精准推送风险任务提供依据。精准推送房、土登记差异风险和股权转让风险196户次,入库税款3189万,为组织税收收入提供有力支撑。


打印此页】 【关闭窗口
 
     
 
Produced By 大汉网络 大汉版通发布系统