一些数据分析模型
• 更好地监控大企业的经济活动和税收的匹配度 • 为产业税收优惠政策的制定提供科学依据
• 分析模型包括:统计模型、计量经济模型、数据挖 掘和可视化
全国税收抽样调查分析
• 分为企业调查和企业集团调查两项任务 • 税收调查的调查对象分为两类:
• 企业。企业调查对象主要由抽样调查企业和重点调查企业组成, 均为独立缴纳增值税或营业税的企业,不包括个体工商户。在 企业调查对象中,有一部分企业属于重点调查企业。重点调查 企业由财政部和国家税务总局根据税制改革、政策调整和税收 管理的需要确定,主要包括各地重点税源监控企业、“营改增” 企业、加工贸易企业等 • 企业集团。企业集团调查对象包括:中央企业集团、国务院批 准试点的企业集团、国务院主管部门及升级人民政府批准的企 业集团,2014年度营业收入5亿以上、年纳税额合计1000万元 以上或下属单位5个以上(含5个)的其他各类企业集团。上市 公司(含境内外上市公司)也属于企业集团调查对象
• 分析的指标
• 地方税收入和结构 • 税收以及非税收入比重 • 转移支付(一般和专项)占地方财政收入占 比 • 中央和地方财政收支平衡情况
• 地方规模(按照城市人口数目划分的大中小 城市) • 地方发展程度(发达地区,发展地区,落后 地区)
• 分析的维度
消费税改革的税收影响分析
• 分析的指标
• • • • 社会消费情况(生活必需品消费和奢侈品消费情况) 消费税收入情况 不同收入阶层消费税纳税情况 富裕阶层的消之间的流动情况, 并 得出行业之间的依赖关系 • 华北五省跨省发票流动情况, 并得出地区经济之间的 依赖关系 • 华北五省跨省发票各行业之间的流动情况, 并得出跨 地区行业之间的依赖关系
• 分析目标是找到发票的重点流向, 所使用的分析 方法是占比分析
环保节能投资对出口的影响分析
工商领域的分析
• 产业结构相似度分析 • 波士顿矩阵分析 • 企业存活率分析 • 企业活跃度分析
食品安全风险分析
• 数据采集
• 生产环节:原材料及来源、生产日期和保质期、生产 日期和保质期 • 流通环节:流通企业、路线、区域和交易价格、销售 给最终消费者的时间、过期报废食品的处理 • 其它:国家标准、社会舆论 • • • • 保质期分析 变质风险预警 价格异常预警 食品安全舆论监测
交通流量统计分析
• 流量统计指标:设计交通量、平均日交通量、平 均工作日交通量、交通流密度、车道空间占有率、 车道时间占有率 • 流量统计时间窗口:5分钟、15分钟、1小时、 天、月份、季度、年 • 利用地图展示各条道路的流量统计指标,根据统 计指标的数值区间采用5色热图(绿、黄、橙、 红、紫)给道路涂色
• 环保节能投资的税收减免对出口率的影响分析 • 出口率: 出口货物劳务销售额同一般货物劳务销 售额之比 • 主要分析内容包括:
• • • • • 地区的出口率统计分析 出口率地区差异分析 注册登记类型对出口率影响分析 投资抵免对出口影响分析 新技术研发和员工培训以及利润对出口影响分析
地税改革的税收影响研究
• 各项信息归一化之后进行加权得到涉税风险评分
增值税发票识别
• 从扫描的增值税发票或者增值税发票照片中提取 发票内容,包括:销售方、购买方、购买物品、 发票金额、增值税、密码区等 • 利用图像处理技术从图片中提取发票的打印内容, 采用深度学习的神经网络模型识别发票的各项信 息项 • 提取的发票信息进行校验并保存到数据库中
改善司法运行 1. 《案件质量评估体系技术标准》的再现和分析扩展 2. 对案件的审理结果进行对比分析,发现可能存在公正 性的案件类别 3. 分析一定时期内的案件总体情况以及案件积压情况 4. 利用案件在审理各阶段的持续时间进行审理效率分析
提供司法资源 1. 分析法院庭室的利用率和法官的案件审理效率 2. 对司法资源的利用情况进行分析
交通拥堵和高峰时段分析
• 交通拥堵分析
• 根据交通运行指数(TPI)监测道路的拥堵情况,并且在 地图上对道路进行涂色展示拥堵状况 • 按照15分钟、1小时时间窗口分析长期拥堵道路的拥堵时 段 • 按照15分钟时间窗口对所有道路的拥堵情况进行异常分 析,如果发现该道路有异于寻常的拥堵状况,则进行突发 事件预警 • 对每条道路统计高峰小时交通量、第30位高峰小时交通 量 • 对每条道路的高峰小时时段按15分钟事件窗口进行统计, 统计该条道路的高峰小时系数 • 统计道路的高峰小时时段的方向分布系数,即主要方向交 通量/各方向交通量之和
交通安全评估和分析
• 交通事故统计:
• 事故的绝对数字(事故次数、死亡人数、受伤人数、直接经济损 失数额) • 万台车事故死亡(致伤)率 • 10万人口事故死亡(致伤)率 • 亿车公里事故死亡率 • 百万车公里行车肇事死亡率
• 分析交通事故统计数据的长期演化趋势 • 交通事故主要原因的帕累托分析 • 根据交通事故发生的道路、节假日、时段、交通设施、 车辆、事故原因,建立交通事故预测模型,找到道路交 通隐患因素并进行持续改进
资源税改革的税收影响分析
• 分析的指标 • 分析的内容
• 企业的资源税税负 • 政府的资源税收入 • 资源类型(水,煤炭,石油,天然气,矿石,木材等 等) • 地区(资源丰富地区,资源一般地区以及资源贫瘠地 区) • 企业所在行业(资源密集型,其它类型) • 企业规模(规模以上,规模以下)
环境费改税的税收影响分析
大企业税收数据挖掘和分析
• 企业对经济和产业的影响可以体现在很多方面,包 括:
• • • • 对宏观经济总量的影响(用增加值衡量) 对公共财政的影响(用税收总额衡量) 对经济活跃度的影响(用企业的主营业务收入和支出衡量) 对产业的影响(用企业同上下游企业的业务往来衡量)
• 从发票的角度来进行分析,分析和量化每个大型企 业对中国宏观经济以及产业的影响力,并以此分析 结果:
审判质效分析
• 一级指标: 公正、效率、效果 • 二级指标—公正 • 二级指标—效率
• 立案变更率、一审案件陪审率、上诉改判率、上诉发回重审率、生 效案件改判率、生效案件发回重审率、二审开庭审理率、执行中止 终结指数、违法审判率、违法执行率、裁判文书评分
• 法定期限内立案率、法院年人均结案数、法官年人均结案数、结案 率、结案均衡度、一审简易程序适用率、当庭裁判率、平均审理时 间与审限比、平均执行时间与执行期限比、平均未审结持续时间与 审限比、平均未执结持续时间与执行期限比 • 上诉率、申诉率、调解率、撤诉率、信访投诉率、重复投诉率、实 际执行率、执行标的到位率、裁判自动履行率、一审裁判息诉率、 公众满意度
• 分析的指标 • 分析的维度
• 企业的环境税成本 • 地方政府环保成本 • 地区(华东,华北,华中,华南等等) • 企业所在行业(环境敏感性行业,其它行业)
税收质量评估方法
• 构建税收质量评估指标体系
• 一级指标(税收完成指标,税收准确指标,税收匹配 指标,税收风险指标) • 二级指标(每个一级指标类下细分为若干个二级指标)
• 高峰时段分析
道路交通组织决策分析
• 道路开口评估:对于交通流量大的区域,对可能的 道路开口进行分析,评估对开口周边道路交通量的 影响 • 信号灯控制评估:对交叉路口不同方向、车道的拥 堵状况进行分析(TPI指数、排队长度),对差异性 较大的交叉路由进行信号灯时间优化 • 单行交通评估:对现有的单行道路的拥堵状况进行 评估,结合道路的设计交通流量,判定单行道路改 造为双向通行道路的潜力;对现有双向通行上下行 方向的交通流量差异进行分析,判定进行车道优化 或者单行道路优化的潜力 • 区域禁限评估:根据道路的车道数、拥堵状况评估 道路是否能够承载路边临时停车、分时段路边停车
• 基础数据:企业基本情况、经营状况、纳税情况和 宏观经济数据 • 评估方法:
• 基本的评估流程采用行业标准的数据挖掘流程 • 对政策效应直接影响的指标(政策效应指标)采用处理效 应模型进行评估
税收风险预警
• 风险预警的核心方法是统计学方法 • 通过方差, 标准差等统计量来确定数据指标的合 理波动范围, 将指标分布区间分为正常区间和异 常区间 • 根据宏观经济状况动态确定税收增长指标的合理 波动区间, 实时进行税收风险预警提示
• 抽样方法:先后按照行业、企业规模、地区进行分层, 然后进行比例抽样
纳税人个税涉税风险评估
• 利用CRS交换的数据评估个人所得税纳税风险 • 分析的数据包括
• 个人基本信息:年龄、性别、出生地 • 价值因素信息:账户金额、利息金额、股息金额 • 收入来源构成信息:典型避税地资金比重、典型避税 地账户数 • 国家治理情况:来源地税收治理情况加权比重、来源 地税收治理情况加权账户数量比重 • 收入要素构成:非银行金融机构的余额占比 • 收入账户动态指标:账户余额变化幅度、年末计息率
热点道路分析
• 热点道路的判定
• 交通流量大的道路 • 交通流量达到或者超过设计交通量的道路 • 上下行方向的车流量差异较大的道路
• 热点区域:周边存在多条热点道路的区域 • 分工作日、节假日,按15分钟时间窗口统计流 量数据,找到热点道路和热点区域
交通运行指数
• 交通运行指数(Traffic Performance Index, TPI)反映道路畅通状况 • TPI的取值范围为0至10,每2个数一等级,分别 对应“畅通”、“基本畅通”、“轻度拥堵”、 “中度拥堵”、“严重拥堵”五个级别,数值越 高,表明交通拥堵状况越严重 • 根据道路等级、道路最高限速以及实时平均车速 计算TPI
一些数据分析模型
财政收入预测分析
• 对全国财政收入(主要是税收收入)进行分析和 预测 • 考虑的影响因素包括各种社会、经济因素,比如: 人口、利率水平、就业情况、货运量、发电量等 等 • 采用了回归分析、时间序列分析、支持向量机和 神经网络等预测模型
华北五省发票行业流向分析
• 通过分析华北五省及各行业的发票流动情况, 找 到各省上下游行业之间的依赖关系 • 分析的主要内容: