StartDT AI实验室|视觉智能引擎——从脸ID说起,浅析顾客数字化 - 行业资讯

"顾客就是上帝”,这句西谚揭示了顾客占据着商业活动中心地位这一客观规律。为了能更好地服务顾客,优化商家自身的服务与产品,对顾客的分析与需求调研一直是商业经营分析中的重中之重。

在商业互联网化、社会数字化的今天,这一规律越发明显。从总量剧增时×××始,饼干就被发明出来,用以对“顾客”进行数字化描述和建档并归一化其互联网下的数字行为。

其后的Web2.0时代,随着移动互联网的发展,个人生活中的屏——人机交互端口变多了,原先用饼干对“顾客”进行数字化的方式已无法完成对个人全渠道全平台跨屏的行为归一化,为了解决这一问题,设备ID, SuperID应运而生。

当前,正全面互联、客体如火如荼地发展中,渠道,平台,终端,屏幕随着物联网的发展,通过云端赋能,下沉雾化,对“顾客”进行数字化描述的方式又迎来了更复杂更严峻的挑战。有鉴于此,奇点云与众多有志于此的友商,在多年前就开始了对于新形态”顾客ID”的预研。目前基本达成的共识有两点:

物联网时代来临,原来的线下物理社会逐步数字化上的线,对于这一开放的数字化环境,已经难以通过唯一有限的媒介数字设备对顾客及行为数字化。这就需要从自然人身上直接数字化并抽取。
这一新形态数字标识需要能够较为高效和准确地拉通原先总量剧增和Web2.0时代的既有数字化信息。
在经历了一段时间摸索后,以人脸生物特征为基础的脸ID方案逐渐显露出优势,而面对ID也成为了当前奇点云商业智能化方案中对于顾客数字化描述的主要技术方案。基于此,StartDT AI实验室在人脸数字化方向上做了充分且深入的技术沉淀。下面就为大家展示几点:

人脸数字化的核心自然是人脸识别,其包含了人脸生物特征的数字化和准确比对。作为视觉智能引擎中不可或缺的一部分,StartDT人工智能实验室的人脸识别技术可以解决复杂场景下的人脸识别问题。

比如动态视频监控场景下的人脸识别,相较于约束场景下的人脸验证所需的人脸识别技术,其一大挑战是对无约束人脸的识别,难度在于进行人脸识别的人脸图一般会存在模糊,遮挡,低分辨率,面部光照及表情变化巨大等,这些因素都会在一定程度上对人脸识别造成影响,甚至大幅降低人脸识别的准确率。而StartDT AI实验室对这种场景下的人脸识别准确率进行专项课题攻坚,主要研发采用了下面一些技术手段:

<强> 01数据增强

当训练数据面临样本量过少,质量分布不均衡或者训练集与实际场景分布差异较大时,模型的泛化能力会严重下降,此时数据增强就很有意义;StartDT AI实验室通过GAN网络同时结合传统图像处理技术,进行样本合成增强。

<强> 02图像处理

在无约束场景下,一般获取的图像质量较差,例如对人脸而言,一般分辨率较差,模糊,遮挡,低光等,StartDT AI实验室通过结合传统方法和深度学习方法,对人脸图像进行去噪,去模糊,超分辨等处理,从而获得更高质量的人脸图片,提升实际场景模型准确性。

<强> 03大规模分布式并行训练

采用多机多卡的训练方式,StartDT AI实验室目前支持上百万个ID、上亿张照片规模的训练数据集。

正所谓有矛就有盾,有攻就有防。自从有了数字ID,就有了对应的* * *技术来破解盗用数字ID,这一问题到了脸ID时代依然存在,并且因为ID所面临在的是开放性数字场景,* * *手段更是丰富简便了起来。

比如仅仅使用一个手机上的照片或者使用换脸的应用就盗用了别人的人脸从而被认证,这样就非常容易被犯罪分子利用,人脸识别的应用范围就大打折扣了,因此,我们需要在人脸识别进行前增加活体检测加以应对。目前,人脸识别的主要* * *方法包括照片与视频回放* * *以及立体面具* * *。

我们在产品中针对不同的应用场景开发了多种活体检测方法,针对无人零售场景,需要配合交互验证的方式对用户不友好,同时需要控制成本,因此我们开发了基于单目RGB的静默活体检测方法。主要通过深度学习方式提取特征以及基于多特征融合的方法达到了目前场景下99.98%拒绝率,99.8%的通过率。目前算法已用在我们的多种场景下,时刻为我们的人脸识别系统保驾护航。