分析大致据征信体系的数据来源、特征、发展现状和存在的问题,从多个方面提出关于提升信用大数据价值的策略及建议<关键词:新型倍用体系大数据技术资源配置评估风险【中图分类号】F832.29
【文献标识码】A 【文章编号]1007-841X-2019(4)-0051-06—、大数据征信体系概述动社会信用体系的健康发展和普惠金融的实现都仃着 重要意义。大数据征信是指利用大数据分析技术和模型,围绕 授信者周围与授信者高相关的用户行为数据,对授信者
上游数据生产者,中游征信机构 下游信息使用者的还款能力、还款意愿和欺诈风险等进行更全面详细的 风险评佔,利用数据实施科学的风险防控。大数据征信 体系通过收集和积累获得上游数据生产者产生的海吊:、
信用交易数据1数据收集整理数据清洗加工数据挖掘分析 实时数据处理 数据分析技术数据智决策商品和服务交易 消费者行为数据政府公开和公共 服务信息基础产品个人征信报告企业征信报告企业评 分 信征-.
增值服务 大数据征信平台 大数据临测预警 大数据风险排查多样化的、多维度的信用数据,由中游征信机构处理和 加工征信大数据,形成具有利用价值的结构化数据,下
其他领域的数据游信息使用者对信用数据判断、评价、分析后,评估可能 发生的风险隐患,形成最终决策,大数据征信体系如图1
数据输入-:-资源整合
f ;\"数据挖掘产品输出所示。犬数据技术使征信数据规模越来越人,应用范围 越来越广,从以银行业为信息主体向P2P网贷、电商平
二、信用大数据的主要来源及特征台、日常生活、便捷出行等方面拓展,从应用模式上催牛. 出了市场征信机构等信用行业新业态,实现与政府监管
(一)信用大数据的主要来源部门的资源共享和监管协同,弥补了传统征信体系中存 在的不足,使得传统数据缺失情况下的信用评分成为可
犬数据征信在传统征信仅仅采用银行部门数据即 用户身份信息、职业情况、银行卡消费等信息的基础h,
能。人数据征信的发展对于金融风险的防范和化解,推 通过技术手段从用户日常行为中获取、积累涉及范围更2019.4
51为全面的数据信息,不仅包括来自法院、税务局、社会保 险、公积金管理中心等政府公开信息,来自运营商、物业 公司、医院等第三方服务机构的数据,也包括來自互联 网企业、电商平台从用户的商品服务交易行为活动中获 取到的数据(见表1)=1. 金融机构产生的信用数据。产生信用数据的金融
机构可以划分为涵盖商业银行、证券公司、保险公司的
金融机构,以小额贷款公司、融资租赁公司等金融派生 机构组成的类金融机构和随着互联网金融的发展正在
占有重要位置的互联网金融机构。以商业银行为代表的
金融机构在开展业务的过程中积累了包括客户个人信
息、资产负债情况、资金交易记录等多年的信用数据,形 成了比较完善的信用信息数据库,这些数据规范性强、
特征明显、可利用价值高,是判断授信者信用情况的主 要数据来源。2. 公共单位部门产生的信用数据。这一部分信用数
据主要包括各级政府部门、公共事业单位掌握的工商注
册信息、执法纳税情况、公积金缴纳信息、车辆违章信息 等。这些数据同样具有较强的挖掘分析价值,但由于数
据来源较为分散,私密性较强,信用数据不能大量地被 征信体系获取,其使用价值未能被充分利用。3. 第三方服务机构产生的信用数据。以水电公司、物
业公司、电信运营商、医院等为主的第三方服务机构在 提供服务的同时,利用自身的网络系统和数据平台积累
了大量的客户收缴费记录和行为信息,这一类机构Z间 常常伴有竞争关系,具有较强的垄断性,因而这类信息
数据也大多仅能为第三方服务机构提供自身服务。4. 互联网平台产生的信用数据。随着互联网技术在
电子商务、网络社交等领域的广泛应用,很多用户开始 选择网上理财、网上购物、网上交友,由此也产生了大量
的用户信用信息。互联网平台产生的数据主要包括系统
内部产生的用户信息数据,如天猫、京东系统中存有大 量的用户购物行为信息,蚂蚁金服、京东白条掌握用户■■ 52 扌修<血 2019.4大量资金信息,以及外部合作平台共享数据,如支付宝 平台通过代缴代收水电费、电话费等获取用户在公共服
务机构产生的信用数据。除此Z外,互联网平台还能通
过用户的行为及社交圈获得其IP地址、终端设备信息、 地理位置、亲友信息等,部分互联网公司利用自身拥有 的大量信息数据开始涉足征信领域。表1信用大数据的主要来源数据类别数据来源具体内容年龄、性别、婚姻状况、文化程度、教 身份信息育背景、住房状况、现住址居住时间、 户籍职业情况职业、工龄、单位性质、在现职年限、 传统数据职务、职称、年收入银行交易账户情况、存款情况、贷款历史(房 记录贷、车贷、信用卡贷款)、持有信用卡 情况、还款记录刷卡消费 信用卡消费记录、分期付款情况、借
记录记卡消费记录公共事业
法院判决记录、税务记录、公积金缴
记录纳记录、水电气付费记录、车辆违章
信息电信数据电信付费数据、业务开通时间、通话 时长、通话频率、电话的位置信息电子商务 IP地址、终端设备信息、交易记录、支 创新数据数据付记录、搜索记录、地理位置信息社交网络朋友圈人数、朋友圈信用等级、社交数据 活跃度其他第三 物业费缴纳记录、医疗欠费记录、个方数据 人保险信息问卷调査等问卷调査、心理测验(二)征信大数据的特征1.多维度的数据来源。征信就是将分散在不同领域、
碎片化的信用信息收集利用,成为有价值的全局信息,
从而有效防范信贷风险。传统的征信体系过于依赖消费
者的银行卡历史消费记录,信用数据来源比较单一,涉
及范围较小,大数据征信通过更多平台及技术手段使获 得的信用数据来源更加全面,维度更加丰富,覆盖的领
域更加广泛,用多维度的信息来刻画授信者。相比已经 相对成熟被各大金融机构所使用的传统信用数据,在大 数据征信中占有更大比例的创新数据才处于起步阶段,具有更广阔的研究前景。2. 具有较强的时效性。传统的征信体系倾向于通过
获取能够清晰反映客户还款能力的强相关数据,来判断
客户的信用情况,收集的信用数据大多是客户至少六个 月以上的银行卡消费情况和信贷记录,这些数据不能及 时反映授信者的当前信用情况,信用数据存在」定的滞 后性。犬数据征信则通过建立实时风险监控模型,重视 对信用主体实时、动态、交互信息的分析计算,尽可能覆
盖如消费偏好、资金动态、人际交往等与授信者信用相 关的各类动态数据,这些通过互联网和大数据技术实时 获取评估的信息保证了信用数据的新鲜度,使对授信者
的信用评价不再是一成不变的,在持续更新中保障征信
评价体系的时效性和准确性。3. 强大的数据处理能力。相比传统征信体系数据覆
盖范围小、数据分析技术相对滞后,信用数据体系的建
立仍然需要采用抽样分析等保守方式,大数据征信运用 大数据技术,在综合传统建模技术的基础上采用机器学
习建模技术,注重对创新数据的分析应用,利用网络爬 虫技术采集、清洗用户数据,利用ha 间的关联性并加以利用,通过形成的结构化信息数据, 对客户进行包含个人信息、文化程度、收入水平、信贷情 况、消费能力、风险厌恶等方面的多维画像,对用户的行 为进行预测,及时发现异常及风险情况,有效提高了信 用评估效率。4. 丰富的信息服务产品。传统的征信体系仅用于银 行等金融机构根据信用评价情况发放贷款等特定领域。 大数据征信体系打破数据界限,通过对客户信息的关联 分析,将应用范围扩大到涉及房屋中介、旅游、求职、婚 恋、保险办理等日常生活的方方面面,以阿里巴巴为主 的互联网公司结合蚂蚁金服信用评分体系,充分发展个 人信用消费、信用酒店、信用用车业务,覆盖了交通、通 网路金商虫信、生活缴费等多个需要信用履约的生活场景,在营销 支持、反欺诈、贷后风险监测与预警和账款催收等方面 具有良好的应用表现。三、存在的问题我国征信体系经过探索阶段、起步阶段、规范阶段 和市场化发展阶段等二十余年的发展,形成了以央行征 信中心为主导,政府+市场双轮驱动,传统征信系统持续 发展、新兴大数据征信系统呼之欲出的行业格局。征信 体系的覆盖信息逐年增加,截至目前,我国征信系统已 收录9.6亿自然人和2500多万家法人机构的信用信息, 信息覆盖范围进一步拓宽,采集的信息不再是仅仅涵盖 个人贷款、信用卡、担保等信贷信息,还包含工商、社保、 法院、税务、质检、电信等17类非银行数据。除此之外, 在互联网金融的推动下,基于电商和小微企业平台的征 信业务也得到快速发展,丰富的产品种类正在被越来越 多的群体所接受。同时,我国出台了《社会信用体系建设 规划纲要》《关于促进互联网金融健康发展的指导意见》 等一系列政策,全面推进政府数据公开化,推动产业创 新,鼓励有条件的机构依法申请执业牌照,为大数据征 信体系的建立和积极发展创造了有利的环境。然而,由 于我国征信体系本身起步晩,发展不成熟,犬数据在征 信行业的广泛应用,为征信业发展带來机遇的同时,也 存在着风险-j挑战。(一)征信大数据的质量有待提高一是数据采集维度不够完整。从传统征信系统来看, 央行征信中心信息数据库覆盖的范围有限,P2P网贷平台 等未持牌机构产生的信贷数据不能被央行征信中心所收 录。从互联网征信平台来看,能够被采集到大量互联网行 为数据的用户群体也同样是央行征信信息数据库中的主 要主体,对于与金融机构长期存在信息不对称问题的农 民等群体,互联网征信平台也很难获取其信用数据,农村 2019.4 榜班 53征信数据的采集仍然是现有征信体系中的一大缺口。: 是数据范围突破“金融属性”。区别于传统征信体系数据 来源于政府部门、银行业机构等较为权威部门,与征信评 价具有强相关性,征信大数据有很大…部分信息来源于 网络,主要是用户在电商交易、社交中产生的行为数据, 虽然较传统征信数据覆盖领域更为全面,但是很多数据 对于征信评价并没有产生实际作用。三是数据准确性难 以保障。大数据征信是从多个来源的海量数据中筛选出 有效的信息,然而来源于互联网中的信息本身存在被伪 造的可能,用户为保护个人信息不被泄露而提供虚假信 息、商家恶意刷单、账户被盗用的现象时有发生,违背了 征信行业公平正义的原则。互联网平台对信用信息的积 累时间较短,信用评价的真实性有待考量。(二) 信息不共享导致的信息孤岛问题严重传统征信体系对于信用评价的主要依据一方面来 自授信者的信贷记录、消费情况,另一方面则来自于税 务、法院、社保、工商等方面的信用情况,虽然近年来国 家大力推动政府数据公开化,促进各机构部门之间的数 据共享,但由于各部门信息系统在建设Z初,缺乏统… 的标准规范,后期乂各自为政,缺少相应的统筹协调机 制,真正实现信息数据的互联互通还有■ -定的难度。近年 來,互联网征信、P2P网贷平台等行业也得到快速发展,然 而市场化征信机构之间没有统一的征信标准和格式,各 机构Z间的业务交叉和竞争关系导致数据共享存在障 碍。同时,金融机构对互联网征信平台收集的数据真实性 持怀疑态度,使互联网征信平台与央行征信系统不能很 好对接,互联网征信数据不能得到有效的利用。(三) 信息共享与隐私保护之间的冲突难以平衡犬数据环境下,征信信息的采集已经覆盖到个人信 息、经济状况、人际交往等各个层面,为进•步提升客户 数量、拓展业务种类、增强行业竞争力,网贷平台、电商 平台等互联网公司利用各种手段收集获取消费者信息 数据来构建自身的信息数据库,消费者信息的非法获取 和隐私保护问题H益凸显,个人隐私泄露、信息买卖、网 络欺诈等问题时有发生。我国对互联网信息使用管理及 个人隐私的侵犯和滥用缺乏有效的监管措施,隐私信息 保护和防范网络欺诈还是以社会公众预防为导致消 费者为保障个人隐私不被泄露不愿提供个人信息,征信 机构获取客户信息更加困难的恶性循环局面。(四)现行监管机制与大数据征信体系不匹配为规范我国征信市场,相关部门11.1台了《征信管理 条例》《征信机构管理办法》《关于促进互联网金融健康 发展的指导意见》《个人信用信息基础数据库管理暂行 办法》等相关措施,然而,大数据征信作为•种新兴技 术,监管对象从商业银行等金融机构扩大到数以百计的 第三方机构,且监管对象更具多样化,与传统征信体系 在信息来源、评估方式、数据应用等方面的不同都给监 管工作带来困难。同时,现行监管制度对大数据征信信 息采集和使用范围等方面没有明确的规定,对于敏感信 息的使用缺乏自力的监管手段。大数据征信技术日新月 异的发展,更是对监管人员的技术能力提出了较高的要 求。四、提升信用大数据价值的策略及建议(一)提升数据质量,优化资源配置海量的征借犬数据來源质量参差不齐,监管缺乏统 -的标准及法律制约,征信数据的真实性验证工作较为 艰巨,都是导致虚假信息泛滥、征信数据价值得不到保 证的原因。对此,•是要从立法监管方面规范信息数据 的提供与使用,鼓励征倍主体合理合法使用信息平台, 上传真实、有效的数据信息,并对恶意发布虚假信息的 企业和个人进行警告与惩罚,确保信用数据的规范性和 准确性。:是充分利用技术手段,对征信主体的身份进 行唯•的识别认证,建立信用信息档案,并通过数据清 洗和交互处理等技术手段进行数据的筛选,增强信用数 据的真实性和完整性。三是根据数据来源优化资源配 置。征信机构要进一步扩大对信用风险强相关的征倍数 据的采集和分析应用,如交易记录、经济状况等,加强对 社交信息等来源于网络的非结构化数据的分析和研究, 改进分析评估算法,尽可能过滤与征信评价关联性较小 的数据,加强信用数据的有效性和可利用性。(二) 鼓励资源共享,发挥合力优势受制于政府信息系统之间缺乏统-的标准规范、政 府部门数据公开化程度较低、不同征信机构之间的相互 竞争、缺乏统筹协调机制等原因,实现征信数据之间的 互联互通还存在一定的难度。为提升信用大数据的价 值,-是要以开放的态度促进市场化征信机构在自身专 项领域的数据采集中取得成效,逐步形成征信市场竞争 互补的发展格局。二是要完善政府部门数据共享机制。 相关部门应建立有效的数据共享统筹协调机制,从技术 层面解决公权机关信息系统之间不能共享数据的技术 障碍,同时,大力推动其公共信息数据公开化,促进各机 构部门之间的数据共享。三是推动市场征信数据库与央 行统一征信平台对接。央行征信系统作为统啲信用信 息服务平台,应逐步开通与较为成熟的P2P平台、小额 贷款公司和互联网征倍平台等市场化征信行业的数据 对接,加快数据共享与融合,进•步扩大我国征信体系 信用数据的覆盖面。四是探索挖掘隐性信用数据。通过 共享农民群体等“信用隐形人”在水电物业、通信机构、 租房用车等方面的行为信息,帮助其建立完善信用档 案,弥补征信系统对这一部分数据的缺失,使农民群体 信用贷款变得容易,有效促进普惠金融发展。(三) 建立与大数据征信体系相配套的监管机制为保障大数据征信体系健康发展,监管部门与征信 机构Z间需积极配合,建立与大数据征信体系相配套的 切实有效的监管机制。一是制定针对征信机构合法履职 的规章制度。通过建立对征信机构的监管制度,明确征 信牌照发放要求,规定大数据征信行业的准入原则和流 网络至咼』程规范,构建保障人数据征信体系信息安全的制度框架 及惩戒措施。:要强化征信机构的信息数据保护责任O 制定针对个人隐私信息保护的相关制度,对征信大数据 采集边界作出明确的界定,加强对征信信息主体的权益 维护,切实保障信息主体的信息采集使用同意权、知情 权等应有的权利不被侵犯,明确隐私受到侵犯时的投 诉、异议处理办法,制定侵犯隐私追究条款,建立切实仃 效的外部监管与内部控制相结合的信用数据保护机制。 三是积极探索有效的大数据征信监管模式。对于来源范 围更广的征信大数据,仅仅依靠传统的监管方式达不到 监管全覆盖的要求,监管部门应从数据采集、挖掘、分 析、利用等环节入手,充分利用技术手段加强对大数据 征信体系的监控管理,创新监管模式,根据征信机构自 身特点、存在的风险情况进行分类,开展有针对性的监 管工作。四是要提升监管人员的业务能力。随着大数据 征信新兴技术的发展,具备征信业务和大数据技术知识 的复合型人才较为稀缺,监管机构应在完善监管机制的 同时,重视对具备专业技能人才的引进,并举办相关内 容的学习培训讲座,完善监管人员知识结构,提升监管 人员业务水平。(四)推动大数据征信创新应用-•是深度探索信用大数据在更多领域的创新运 用。从政府部门的角度,深化信用大数据在金融财政、 工商税务、质检监测、环境保护、发展改革等政府部门 之间的整合应用,帮助政府部门对监管主体进行全方 位的信用画像,有效提升政府部门分析决策能力。从商 业应用的角度,将信用大数据应用与智能决策相结合, 引导培育出更多的信用领域新产品,为中小微企业的 发展带来更多机会,为我国信用体系的发展创造更多 商业价值。从利民角度,可依托公安、社保、物业、教育 等领域的数据,逐步实现对我国所有人口信用数据的 全覆盖,并为社会公众提供统一的信用查询服务,帮助 公众了解自身信用情况的同时,进-步加强公众对信2019.4 榜斑 55用重要性的认识,有利于构建诚信和谐社会。二是挖掘 信用大数据在风险防控方面的潜力。大数据征信体系 信用风险的多元化致使信用风险的防控难度也进一步 加大,积极探索区块链等新技术在大数据征信风险防 控中的应用,制定有效的评分模型和信用状况分析追 踪方案,推出反欺诈和历史违约率等新产品,构建更全 面的信用风险管理全景视图,切实提高信用风险防控 能力。三是创新征信大数据特色服务。充分利用云计 算、分布式数据存储与处理等新兴技术,紧密结合大数 据征信市场需求,深度挖掘信用数据价值,基于大数据 ■■ 56 榜 *隘 2019.4分析基础针对不同的客户群体分类提供信用风险解决 方案、营销方案和消费者消费方案等服务,将个人征信 产品应用于商品租用免定金、购物先使用后付款等业 务,增强客户的消费体验,满足社会各界对信用产品和 服务的多层次需求。作者简介:李崔卉(1991 — ),*,甘肃酒泉人,天学本科,助理工程师,现供职 于中国人民漿彳亍嘉峪关审中心支行。责任编辑:樊纪相 校 对:FJX 因篇幅问题不能全部显示,请点此查看更多更全内容