面部识别技术的详解:今天的面部识别技术在哪
- 作者:dianwo
- 发表时间:2019-09-20 19:57
- 来源:未知
面部识别技术的详解
2012年,谷歌着名的谷歌X实验室宣布了一项令世界震惊的突破:经过大量的努力和专注的关注,他们的人工智能模型已经学会在YouTube上正确识别猫。
这是一个例子,说明AI模型到底有多远,只研究了几千个YouTube缩略图,这些模型现在可以多快获得新技能 - 但它也建立在几十年前面部识别技术的发展之上。
寻求正确识别 人 脸,包括它们在一个框架中的存在以及它们所属的特定个体,已经在进行中。
一种生物识别
面部识别软件历来像其他形式的“ 生物识别 ”识别一样工作,如语音,虹膜或指纹识别:计算机分析特定照片或其他生物识别数据,并在其中查找非常特定的标记集。以这种方式比较面部的各个方面在概念上类似于比较指纹中的线,尽管远远更复杂。
如果程序在样本和示例模式之间找到关键的相似性阈值,则声明匹配 - 这很简单。
这对于相对简单的工作来说效果很好,比如弄清楚照片中的面孔,但实际上 将该面部 识别 为匹配同一个人的另一张照片? 事实证明这要困难得多。
面部识别软件和算法
已经出现了许多方法以使识别面部更容易。渐变
一个是基本上用一个版本来替换图像,该版本强调了与面部识别最相关的细节。在 渐变 的情况下 ,这涉及用该像素的亮度与其周围的像素相比较的表示来替换每个像素。
这种像素亮度的相对测量使得 在多个不同的照明情况下将同一面部 识别为同一面部更容易 。
相对照明属性倾向于在镜头之间保持正确,而客观光照变化更大 - 但即使使用这种和其他技术,广泛变化的光照条件仍然是许多现代面部识别系统的难点。 (它们也给人类对面部的判断带来了困难,应该注意到。)
投影
另一种方法涉及将2D照片的所谓“投影”到3D模型(例如圆柱体)上。围绕第三维度包裹面部通常可以揭示对称形式和区分在平坦和静态图像中更难找到的特征。
一旦完成图像的所有这些准备,系统最终“编码”面部,或者将其最有区别的特征和图案折叠成较小的简化文件,该文件仅用于与其他编码面部进行交叉检查。
因此,当显示莱昂纳多迪卡普里奥的照片时,这种系统将首先以各种方式扭曲和分析照片以生成编码版本,然后将该编码的面部与文件上的编码面部的集合进行比较。
这些 存储的面部是查找面部匹配的比较基础,而这些存储的文件可以与名称和地址等信息预先关联。
使用深度学习进行面部识别
然而,即使有像编码这样的技巧,人类软件工程师也无法创建足够快速和准确的过程来比较两个编码的面部并确定它们是否足够相似以被视为同一个人。这是因为作为人类的开发人员不知道他们如何将原始图像处理成合理的视觉信息; 他们的 大脑 就是做那项工作,他们的大脑开发者就是进化。
因此,面部识别和识别领域并没有真正起飞,直到开发人员不再尝试自己设计完美的匹配算法,而是采用当时全新的机器学习领域来重新演化该算法。
那是因为要做出反复试验,你不仅需要进行大量的试验,而且还必须能够判断哪些试验 是 错误的。
为实现这一目标,我们需要一个带标签的机器学习数据集 :一个策划和注释的示例集合,可供机器学习系统使用,以提供反复试验反馈,并促进高效学习。
因此,面部识别数据集可能是人脸照片的集合 - 以及一些动物面部和面部对象的照片,这些照片根本不是面部。
数据集中的每个照片将附加指定 照片 的 真实 内容的元数据,并且该元数据用于(在)中验证学习面部识别算法的猜测。
编译要由机器学习系统使用的数据集通常比实际使用这些数据集来训练系统本身更耗时且昂贵。
有许多不同的算法用于将仍在学习的面部识别程序的猜测转化为对程序本身的“学习”修改,但最基本的原则是程序应该重复成功而不是错误。
正确的猜测非常轻微地增加了导致正确猜测的方法将在未来的运行中再次使用的可能性,而不正确的猜测会略微降低相同的程度。
“深度”学习是一种更加精细的方法,可以将这种实施试验结果的系统作为处理变更来实现,可以找到看似隐藏的多步骤解决方案。
这些深度学习解决方案将面部识别带入了21世纪。
如今,先进的面部识别技术正在进入银行的关键安全流程,以及消费者手机中不那么重要的安全流程。
当您的手机解锁时,因为它识别出您的脸盯着它,它正在使用最初通过深度学习发明的图像分析的基本方法。
市场现在使用在设备本身上运行的局部面部识别过程和需要通常仅通过云可用的计算能力的远程面部识别过程的混合。
今天的面部识别技术在哪里?
面部识别用途的爆炸式增长引发了对大型全面的新图像和视频数据集的真正需求,用于训练机器学习系统以满足对AI产品的惊人需求。在构建这些数据库的仪表板中,一些公司开始采用最低出价者,并遇到诸如匆忙的图像质量等问题,这些问题可能会极大地影响学习效率。
质量差的数据集也会给最终产品带来偏差; 如果一个面部识别系统接受了种族同质图片的训练,那么 在识别那些尚未看到的种族的人 时 最终会更糟糕 。
面部识别技术已被用于帮助搜索犯罪嫌疑人和对工作受访者的判断; 微软 甚至有一个易于使用的中间件解决方案AI情感分析,所以几乎任何人都可以在他们的项目中进行高级情绪分析。
这些机器学习产品的强大功能开始使隐私倡导者处于边缘地位, 这些问题涉及可能被滥用的技术,这些技术可能被动地从粒状安全摄像头馈送中识别出任何人。
在相当短的几年中,这项技术已经发展到这样一种程度,即它的持续发展需要更新法律和紧急的公共对话。
面部识别资源
建立自己的面部识别技术? 这些资源将帮助您进行数据收集和培训。眼睛注视数据集 - 您的设备会识别用户正在盯着什么吗? 用真实的眼睛凝视数据测试你的技术。
数据收集的终极指南 - 了解如何收集新兴技术的面部识别数据。
那么我们走向何方?
所有革命性的新技术都是如此:它们创造或威胁创造一系列新的和不可预见的问题,从而导致合理的文化焦虑。从印刷机到网上商店,使这些发明不受恐惧影响的影响始终是由强大的公共对话引导的持续发展。
面部识别技术正在崭露头角。
因此,对于拥有足够资金和公共利益水平的技术而言,未来前景一片光明。
随着不断发展的能力和局限,没有人知道它可能会在十年的时间内出现,但看到它如何实现将会令人兴奋。