银行流水指什么?
答:在银行活期账户(包括活期存折和银行卡)的存取款交易记录。根据账户性质不同可以分为个人流水和对公流水。普通上班族的是个人流水,中小企业主、个体户是对公流水。
个人流水(私人账户流水)指的是客户自己本人名下的银行卡(借记卡)或者银行活期存折,在一段时间内与银行发生存取款业务交易清单明细。
工资、奖金、报销、兼职收入、劳务费、房租、个人收款、支付宝微信提现、转账等等,只要是你银行卡上的钱有变动,都会有“痕迹”,也就是交易记录,这一条条的交易记录这就是银行流水。
对公账户流水对公流水也称公司流水、企业流水,是银行客户《公司客户》(开设基本对公账户)其对公银行帐户上一段时间与银行发生存取款业务清单。
赚钱的收入、采购、发钱给员工、交办公大楼水电煤和房租等,只要的以企业账户名义的银行卡在付钱、收钱,这里面的交易记录就是对公流水。
在这里我想说一下,尤其对于中小企业而言,其实银行流水很重要。
如果说财务报表是企业记录经济活动的方式,那么银行流水就是银行为企业记录交易的语言。
作为不需财务人员“处理”的外部凭证,银行流水数据更具有真实性,交易产生便会生成不可逆的记录,还会记录交易时间,对手方名称及账号,交易金额及余额等信息,具有极高的信息含量和全面性。
此外,对比以月为单位,需要财务人员人工出具的财务报表,银行流水即时可以通过网银下载,具有更强的实时性和便捷性,便于掌握企业最新情况。可以说,银行流水是了解企业真实的经营情况的最好抓手和“数据金矿”。
如此高效的银行流水数据,在以往的风控审核过程中却没有发挥出其应有的价值。因为银行流水的处理分析有以下几大难点:
1多银行数据格式不统一
我国共有 4000多家银行,每家的数据格式都不统一。靠人工方式手动汇总,不仅耗费大量时间,更重要的是容易产生数据贴错,贴重,贴漏等错误,导致流水数据本身的质量降低。
2数据真实性与完整性
客户经理很难判断其他银行数据的真实性与完整性。据融资租赁行业数据,10-15%的公司存在删改银行流水的情况,而还有更多的企业存在交易账户未提交和账户数据不全的情况。
3关联方与可疑交易鉴别
关联交易层出不穷,更有大量隐藏起来的可疑交易需要鉴别发现,过去人工方式只能挑选出大额交易,或采取“抽凭”的方式分析,关键交易有所遗漏在所难免。
4数据量大难分析
如果忙季短时间内有多个项目,或碰到了交易频繁,账户量大的公司,大量的流水数据的全面处理分析难以在有限时间内完成。
针对以上几大难点,见知数据作为专注于通过系统化方式汇总处理分析多银行流水数据的金融科技企业,浅谈几点银行流水分析的框架及方法论:
1多银行流水数据汇总
银行流水作为一种半结构化数据,未经过清洗难以进行分析。因而分析银行流水的第一步便是要通过系统化方式识别,汇总并结构化数据。这个步骤并没有太多的捷径可走,需要日拱一卒,通过对各银行各时间点对公对私模板的积累及数据结构化梳理,逐渐形成自动化银行流水处理的流程,实现一键输入各银行原始流水数据,输出标准化结构化数据的效果。
部分银行存在比如利息发放交易的交易时间上下不连续,或存在冲正等特殊交易标记错误的情况。这些情况虽然少见,但都需要在建设系统的时候进行对该模板的调整适配。
2鉴别数据真假完整性
通过对银行流水模板的积累与字段机构化的工作经营,首先可以通过模板判断输入数据是否存在关键信息缺失,及其是否属于目标银行模板。
此后可以通过流水数据的交易后余额连续性,利息校验检查等方式判断该流水数据是否存在逻辑问题,更可以通过流水字段内的信息抓取缺失同名账户及账号等信息做统计展示。
如果数据本身存在缺失或遗漏,后续的分析也就失去了基础。最常见到的缺失情况是缺失账户(有账户未提交)和账户数据缺失(未提交足够数据,连续数据中存在缺失)。
3多维度发现关联方与可疑交易
流水交易必然包含本方与对手方的完整名称信息,因而可以通过接入工商数据的方式进行关联方的自动发现,并结合流水展示关联方的交易情况。
通过系统化方式接入工商数据,查询每条流水交易的本方与对手方进行比对,可以发现关联方并打标签,统计关联方的交易情况。比如法人,股东,董监高和兄弟公司的资金往来,都可以结合关联情况统一展示,替代手工查询工商信息的步骤。
针对可疑交易,不同机构的关注点,尺度与指标各不相同,可以通过比如大额个人交易发现,收支重合判断,关键字段信息创建符合机构风控规则,并通过实际项目分析结果进一步调优及对规则进行增补调整。
4全面分析资金波动,收支结构与上下游交易
在导入了流水,确认了真假,判断了关联交易之后,信贷机构最需要快速了解清楚的就是目标企业究竟“有多少钱,挣多少花多少,从哪里挣钱花去哪里”。而这些可以通过对汇总后余额波动的分析,收支盈亏的金额与结构,以及上下游客户供应商的交易情况的方式展示出来。
企业有多少钱和资金余额的变化是重要的关注点。通过汇总各账户流水余额,可以自动统计出期末与日均余额并按时间进行可视化呈现。另外,除了现金外,还可以纳入类现金部分比如保证金,贷款与理财等金额,展示企业相对完整的资金情况与变化。
5文本语义理解与智能标签分类
在积累了大量银行流水交易数据之后,可以更进一步,通过分词和语义理解及机器学习的方式根据流水字段对每条流水进行打标签做分类,可以据此实现剔除非经营性交易,快速生成针对特定行业的分析指标,抓取关键交易的效果。
比如制造业的几个关键的分析指标包含水电能源,人力成本和税费缴纳等,均与业务开展情况相关(开工就会有人力和水电等支出);而医药连锁行业的医保类回款,也应该与其总经营收入规模相匹配。这些指标都可以从另一个维度判断企业的实际经营情况。
更多关于银行流水和现金流的知识,欢迎关注公众号:见知数据