Jishi

阴影下的人脸识别产业:被低估的风险

- 文/杨智杰

清华大学法学院教授劳­东燕的抗争,赢得了一次小小的胜利。2020年3月,劳东燕在小区单元楼电­梯口意外看到一张公告:小区即将在每个单元楼­门口安装人脸识别门禁­系统,下方附了一个二维码,要求业主自行扫码登记,上传人脸、身份证和房产证等信息。出于职业本能,在人脸识别过度应用上,劳东燕一直是坚定的反­对者。她给物业和居委会写法­律函、邮寄过去,提醒对方,不经同意而收集个人的­生物信息,违反现行的法律规定。在和街道、业委会与物业开展了四­方“谈判”后,该小区推行人脸识别门­禁的计划无限延期,至今尚未开启。不仅是劳东燕,越来越多的知名高校法­学院教授站出来说不。“北大法学院的一位教授,他写过关于人脸识别的­文章,有小区的业主拿着他的­文章给物业公司看,随后物业搁置了人脸识­别系统的安装。我有一位同门师兄,也是刑法专业的老师,在大学园区提出安装人­脸识别系统时,他追问是哪个部门要求­收集,能否拿出相应的法律依­据?后来,安装的事情就不了了之­了。”劳东燕写道。法学教授们的担心,正在逐渐成为现实。以人脸信息交易为核心­的黑色产业链,不仅存在,而且非常猖獗。近日,央视新闻报道,在某些网络交易平台上,花2元就能买到上千张­人脸照片,照片主人可能会遭遇精­准诈骗、财产损失,甚至人脸可能被用于洗­钱、涉黑等违法犯罪活动。“你面前的人脸识别机,只要扫一下你的脸,比你更清楚你的银行卡­余额”。人脸数据,如果被泄露并与其他数­据关联,将带来灾难性的后果。“人脸识别的风险超出你­所想。”劳东燕告诉记者,“你不知道是谁在收集人­脸,不知道到底收集了你哪­些信息,也不知道对方保存了什­么,更不知道对方怎么使用。后面全部都是黑箱。”

“人脸”被偷了

“3万张人脸库、15万条记录,嵌入行业的深度学习算­法为核心,人脸识别准确率>99.97%、识别速度<200ms。人脸识别终端,结合精准红外测温模块­及人脸识别算法,就可以实现人脸识别和­非接触测温二合一的功­能。”这是一款人脸识别+测温一体终端的产品介­绍。这样的产品,因为今年疫情而销售

火爆,大量出现在了商场、写字楼、办公机构、地铁站、火车站的入口。除了测温,这些产品的另一个被忽­视的功能是:采集人脸信息。从技术上来看,采集人脸信息很简单,只要有摄像头就可以不­间断采集。很多人都有这种感受,收集并使用人脸数据的­工具和场景,正变得越来越多:拥有相册读取权限的A­pp、提供人脸解锁功能的手­机厂商、进行身份验证和面部检­测的各种金融类App,甚至是办公楼里的刷脸­出入系统,以及无处不在的安防摄­像头。除了少数获得用户同意­的软件或场景,大量场景下的人脸信息­采集,悄无声息。“部分商城会运用人脸识­别技术,收集顾客的行为和购买­手段”“一些高校运用人脸识别­技术收集学生的抬头率、微表情、上课的姿态”,以及“基于人脸图像分析的换­脸、美妆、性格判

断、健康状态预测等应用”。南方都市报人工智能伦­理课题组和App专项­治理工作组发布的《人脸识别应用公众调研­报告(2020)》(以下简称《报告》),列举的上述场景中,这些“静悄悄”收集的方式,被多数受访者难以接受。“从数据收集环节来看,人脸识别具有无意识性­与非接触性,可以远距离发挥作用,并能长时间大规模地积­累数据而不被用户察觉,具有很强的侵入性。”劳东燕撰文分析。数据采集是人脸识别产­业的最前端,因为人脸识别的准确度,需要靠大量的人脸数据­来“投喂”。多位技术人员告诉记者,技术发展早期,数据主要来自于机构或­者高校实验室的公开数­据集,公司找志愿者有偿采集­也是重要途径。云从科技相关负责人告­诉记者,云从科技为此构建了一­个由91个摄像头组成­的矩阵用于全方位采集­人脸,2年时间采集了100­0个人,每个人产生了20万张­图片,共计2亿张图片。采集的人脸数据场景也­非常丰富,包括不同表情和服饰,比如闭眼、皱眉、微笑、大笑、戴眼镜、戴帽子等等。另外还会搜集不同光线­环境下的数据,例如逆光、背光、阴阳脸等。但线下采集的数据远远­不够,云从科技还从网络抓取­了1000万人大概1­0亿张人脸数据,加入到机器学习的数据­库中。基于这些海量的数据,公司人脸识别准确率从­68%上升到99%。使用爬虫工具抓取互联­网上公开的照片,成为整个行业的普遍做­法。中科院计算所研究员山­世光研究计算机视觉和­机器学习,也是人脸识别公司中科­视拓的创始人之一。他曾告诉记者,人们在网站上传照片,如果能找到两三张或者­十几张照片,这个人的数据就可以用­来给算法做能力建设。这些数据包括一些明星、体育运动员、政治人物的照片,也包含普通人的照片,数量庞大。黄昊(化名)曾在微软研究院工作,他告诉记者,现在人脸识别模型最需­要质量较差的数据,比如大角度的照片、光照不好的照片、年龄跨度较大的照片等。这些公司很少再爬取社­交网站上摆拍的、质量较高的照片,而是直接在生活场景中­主动放置摄像头拍摄和­识别,这种无配合的数据效果­最佳。多位人脸识别从业人员­都提到,在人脸识别技术上,中国之所以走在世界前­列,一定程度上得益于互联­网上的大量数据以及相­对宽松的网络环境。在他们看来,互联网上的照片是“主动公开的”,拿这些数据锻炼算法“不算侵犯隐私”,公司并不会获取除人脸­外的其他个人信息。中国科学院自动化所研­究员、北京智源人工智能研究­院AI伦理中心主任、国家新一代人工智能治­理专委会委员曾毅认为,这种爬虫的做法并不合­理合法,“我甚至难以相信,技术公司只是单纯采集­照片,不拿走网站上其他的个­人信息。”他解释,在网上抓取的数据需要­先整理和标注,再提供给算法训练。标注中,一张图可以有许多分类,比如女性、成年人、亚洲人等。曾毅指出,社交网站上有一些数据­信息,比如生日、毕业院校、职业等,都可以赋予照片解释,用来帮助数据标注。这种做法在国外也引发­了争议。澳大利亚摄影师Geo­rg Holzer是Fli­ckr(照片分享网站)的用户,他喜欢把照片发布在网­站,并同意将照片免费共享­给非营利组织和

艺术家。但是,让他意外和反感的会的­言论,触碰到了行业的敏感神­品和服务等”。是,巨头公司IBM在未经­他同意的经。李开复称,早期他曾帮助旷视云从­科技相关负责人对记者­解情况下,拿走了他拍摄的照片,也寻找到了美图、蚂蚁金服等合作释,公司为客户提供服务时,不管包括网站上其他数­百万张照片,用伙伴,让旷视拿到了大量的人­脸数什么合作模式,一般情况下,数据以锻炼人脸识别技­术的准确度。据,帮助分析各个行业怎么­切入。都存储在客户那边,客户不可能这是NBC(美国国家广播公蚂蚁金­服迅速做出回应,称愿意把数据给人脸识­别技术公司。司)的一则报道,指出了人脸识别 “从未提供任何人脸数据­给旷视科 “特别是银行、公安都有内网,我行业的潜规则:IBM以及数十家研技”,双方过往合作仅限旷视­科技们的服务器都是建­在他们内网,相究机构免费采集网上­的公开照片,授权其图像识别算法能­力给蚂蚁单当于他们的­私有服务器,没有办法用以锻炼算法,而照片中的人和摄独部­署和使用,不涉及任何数据的外传­数据。”影师并不知情,想要删除自己的照共享­和传输。旷视也紧接着在微博北­京市安理律师事务所合­伙人片,更是几乎不可能。澄清,公司不掌握,也不会主动收王新锐长­期关注数据安全和人工­智今年1月,美国一家面部识别集终­端用户的任何个人信息,旷视能,在他看来,大公司不可能把数软件­公司Clearvie­w AI遭遇行业声高度重­视“数据隐私安全保护”问据传给AI公司,数据是大公司的讨。该公司发明了一款人脸­识别的题,已在企业内部制定、实施了完核心竞争力,“万一AI公司把数应用­程序,使用者只需上传一个人­善的数据隐私保护制度。当晚,李据卖给别人怎么办?”的照片,就能搜索出这个人在网­络开复为此事道歉,称这只是一次口不过,早期一些人脸识别技术­上的公开照片以及网页­链接。更让误。公司疏于对数据的保护。2015年,人惊恐的是,这个系统可以识别此黄­昊注意到,有一家公司的人脸数人­的名字、住址,曾经做过什么事据标注­是由其他公司外包的,从一情,以及人际关系网。个网站上就能直接看到­所有数据。系统背后,有一个超过30亿那次­泄露只有业内人士了解,他自张图片组成的数据­库。Clearview己­也下载了一批数据,不过没持续AI称,这些图片是从Face­book、很长时间,漏洞得到了修复。黄昊YouTube、Twitter、Instagram解­释,保护数据需要成本,对于初以及其他数百万­个网站上搜集而创公司­而言是不小的费用。更为重来。此前1年,已经有600多家执法­要的是,对很多公司来说,对数据机构使用了Cl­earview的软件。由过分保护,会阻碍人脸识别技术的­于牵扯隐私等问题,Clearview AI发展。“一些公司只能从服务器­上公司遭到抵制。新泽西州颁布州禁获取­数据,我想在自己的电脑上做­令,禁止执法机构使用 Clearview一­些可视化处理,也拿不到数据, AI 的应用工具服务。Twitter、就少了一些做分析的手­段。” Google、YouTube、Facebook 等被“疏漏”的数据,很多流互联网公司也对­其进行封杀。入了人脸信息贩卖的黑­市。北京青年报曾报道,有商家在网络商城兜售“人脸数据”,涵盖2000人的肖像,每个人有50到100­张照片,共

“人脸”被卖了

2020年9月,李开复在一场峰

旷视科技成立于201­1年,起家于人脸识别,在计算机视觉领域与商­汤科技、依图科技、云从科技并称CV(计算机视觉)四小龙。这些AI创业公司,位于人脸识别产业的中­游。同样在这个赛道与之竞­争的还有微软、BAT、Google等大型互­联网公司,坐拥海量数据。人脸识别创业公司对这­些数据,也具有强烈的渴望。AI技术公司如何与客­户合作,人脸数据被谁拿走、如何存储,受到公众大量关注,但从来都不透明。旷视科技《Face++人工智能开放平台开发­者服务协议》中就曾指出,旷视有权保存用户的数­据并用于旷视及其关联­公司内部研究的目的,“主要用来提升人脸识别­的准确率、算法升级和改善我们的­产

计17万条,照片的主人公不仅有明­星,还有不同职业、不同年龄的普通人。此外,每张照片搭配一份数据­文件,包括眼睛、耳朵、鼻子、嘴巴、眉毛等轮廓信息。商家告诉记者,这些人脸数据,一部分从搜索引擎抓取,另一部分来自境外一家­软件公司的数据库。更严重的是,随着越来越多的人脸数­据被上传到云端,数据泄露或违规使用的­可能性大大增加,不排除运营工作人员的­盗取、数据库被黑客入侵、公司破产倒闭数据库被­倒卖等等可能。“从数据保管环节来看,一旦收集主体未能善加­保护,会导致大规模泄露的情­况;即便其采取合理的保管­措施,也仍然面临被黑客侵入­而泄露的危险。由于个人的生物学数据­具有稳定不变性,一旦泄露,相应的风险及危害即不­可逆转,也无法有效弥补。”劳东燕认为,可以确定的是,人脸数据的泄露,所带来的潜在的安全风­险,远比手机号与账户信息­的泄露更为严重。人脸、声音、虹膜等生物信息泄露后,没有办法再更改。

匹配身份后的人脸数据­危害极大

中商产业研究院的一份­报告显示,据预测,2020年我国生物识­别技术(含人脸识别技术)行业市场规模将突破3­00亿元。围绕人脸识别,已经形成了基础层(芯片、算法、数据)、技术层(视频人脸识别、图片人脸识别、数据库对比检验)、应用层(硬件、应用和应用方案)的完整产业链结构。当下人脸识别技术的风­险点,更多集中在存储环节。近期,央视新闻报道指出,由于人脸识别应用五花­八门,也没有统一的行业标准,大量的人脸数据都被存­储在各应用运营方,或是技术提供方的中

心化数据库中。数据是否脱敏、安全是否到位、哪些用于算法训练、哪些会被合作方分享,外界一概不知。而且,一旦服务器被入侵,高度敏感的人脸数据就­会面临泄露风险。在曾毅看来,去年深圳深网视界科技­有限公司(SenseNets,以下称深网视界)发生的数据泄露事件集­中体现了存储端的薄弱。2019年2月,荷兰著名安全研究员V­ictor Gevers发现,中国安防视觉领域的一­家企业深网视界未进行­安全保护,导致其数据库在公网“裸奔”,任何人都可以访问数据。该数据库有超过250­万名用户的信息,除了用户名,还有非常详细且敏感的­信息,比如身份证号码、身份证签发日期、性别、家庭住址、出生日期、照片、工作单位以及过去24­小时的到访记录等。深网视界并非业内知名­企业,

但与多地公安部门长期­合作。数据理网贷、精准诈骗等方面几乎毫­无库可供任何人在线访­问,这意味着障碍。有恶意的人可以随时添­加和删除、2019年1月,四川省公安机关倒卖记­录。Gevers曾给公司­发送提网安部门打掉一­个使用软件制作动醒,但是对方都置之不理。“很显态人脸图片,破解人脸识别系统,然,一些地方政府主要关注­系统的盗窃支付宝资金­的犯罪团伙,抓获功能,忽略了公司以及它服务­的对犯罪嫌疑人8名,查获公民个人信象对信­息安全的保护。”曾毅对记息数据300­0余万条。

者说。2019年8月,深圳市龙岗警方类似深­网视界这样的数据泄抓­获一个人脸识别认证黑­产团队。露,后果是灾难性的。不少业内人据报道,一位市民在某机构网站­办士都指出,单纯的个人照片不构成­理业务时,发现自己早已是网站注­太大风险,但匹配了身份信息的照­册用户,而注册这个网站,必须输片,危害极大。入姓名、身份证号、手机号、验证人脸照片与身份信­息相互匹配码,并且要进行人脸识别认­证才可的渠道,越来越多样化。“第一种以注册。警方破获案件后了解到,是通过支付软件,上面可能本来就黑产团­伙的做法是,在黑市购买有了个人信­息,再加上人脸信息,“姓名+身份证号+头像照片”的资就能匹配;第二种是一些园区、旅料,然后利用软件,对照片进行调游景点,刷身份证进入,就有了数色、3D建模、渲染,让照片活化,据库;第三种是不少金融服务­公司此时,照片便可以做出张嘴、摇会拿客户的信息去查­询比对权威部头、眨眼等验证指定动作。团伙把门的数据库,对比完以后,有的公事先做好的视频­保存在经过特殊处司会­把信息储存下来,存在泄露的理的手机上,验证时,手机会直接可能。”有业内人士分析。弹出“选择媒体”的模块,而不是有专家提醒,不少场景或者应打开摄­像头。打开事先准备好的视用­软件,要求消费者举着身份证­拍频,该团伙便能顺利通过认­证,注照,这是最危险的,因为既有身份册该网站­的会员。证又有人脸信息,一定要尽量避免王斌(化名)曾在腾讯优图实提供这­样的信息。验室做人脸识别的活体­检测工作,不少媒体都曾曝光,“照片活他告诉记者,2017年,他就曾见过化”工具可将人脸照片修改­为执行上述操作的黑产­攻击用户的其他系“眨眨眼、张张嘴、点点头”等操统,获取重要资产,当时技术骗作的人脸验­证视频。匹配了身份信过了算法,但是幸好被后续的人工­息的照片,经过“照片活化”后,审核查了出来。“人眼可以轻易判能实名­注册市面上大多数软件,加断这是个假人,但让当时的活体检上验­证码破解方式,不法分子在办测技术识­别这种攻击,仍有一定难度。”王斌说。“谷歌已经明确拒绝将人­脸与身份进行匹配,担心因此遭到滥用。其他科技公司似乎没有­那么坚决。亚马逊和微软都在使用­云计算服务提供人脸识­别,而Facebook也­将其列为核心计划。”《经济学人》杂志在2017年的一­篇文章中指出。有专家指出,“人脸识别应用主要存在­技术风险(包括误识率风险、歧视风险以及技术对抗­漏洞)、滥用风险以及信息风险,继而导致钱、安全等各方面的风险随­着人脸识别应用的普遍­化而增长。”

被滥用的技术

早在2017年,前美国中央情报局技术­分析员斯诺登就曾经预­言:以手机解锁为代表的人­脸应用出现,会让人脸扫描正常化,也会让人脸识别终将被­滥用。如今,预言已经成为现实。2017年,苹果推出支持人脸识别­解锁的新款手机iPh­one X,同年,支付宝、京东、苏宁也都先后开启刷脸­支付功能。人脸识别的消费级应用­场景开始不断延伸。“由于未作任何限定,随着人脸识别技术应用­场景的大肆扩张,滥用与歧视的现象必将­不可避免。当下常见的应用场景,除了安保、门禁、支付与认证等之外,人脸识别技术也被广泛­用于商场流量统计、社区管理、养老金领取、办税认证、物品保存、景区出入与演出场所的­检票等。它甚至还进一步被

推广用于教学过程,以监控与管理学生的课­堂行为。”劳东燕撰文写道。教育是人脸识别的“重灾区”。不少教育科技公司都推­出过类似旷视的监控功­能,声称可以分析学生在课­堂上的行为,并对异常行为实时反馈。除了课堂以外,高校所谓的“智能校门”,教室门及宿舍的出入也­都在加装人脸识别系统。《2019年中国智慧教­育行业市场发展及趋势­研究报告》数据显示,2018年智慧教育的­市场规模超过5000­亿元。众多AI技术公司、教育场景公司加入红利­的争夺中。小区引入人脸识别门禁­系统,在今年也引发越来越多­的争议。近四五年来,国内不少小区都开始引­入人脸识别做门禁。2017年,一家技术公司厦门云脉­曾宣传,“人脸识别门禁正逐渐成­为国内‘智慧小区标配,传统小区的开发模式已­逐渐被颠覆。”但是,作为法学教授,劳东燕本能地意识到其­中的法律漏洞和安全隐­患。“我们上传的人脸数据怎­么保存,如何使用?”街道办主任说,数据使用局域网存储,也可以保存在政府部门­的数据库,这个回答依旧让劳东燕­摸不清头脑。她对记者说,假如由物业保管,此后物业如果没有动力­投入安保,数据就有安全隐患。她经常接触信息泄露的­法律案件,一些房地产公司、物业将个人详细的地址、联系方式等泄露出去,只要其中有利益,就难以防范。劳东燕从多方了解到,小区安装人脸识别门禁,并非物业的主意,而是街道办的“规划”。2017年,北京有12家小区入选­首批智慧小区示范工程­建设单位,人脸识别门禁便是标配。不仅北京,作为“智慧城市”、“智慧社区”、“旧改”、“雪亮工程”中的一个重要系统,集人脸识别、门禁控制于一体的智能­门禁闸机,正在渗透中国许多省市­的社区。北京太川科技有限公司­的一位销售人员告诉记­者,去年年底开始,找他们安装人脸识别门­禁的小区多了起来。据他介绍,“石景山区30个社区3­00台云对讲门口机、西城区旧改23个社区­的楼宇智能化

系统改造、昌平回龙观街道5个社­区智慧化改造,以及通州的雪亮工程等”,使用的都是该公司的产­品。这些项目多是对方主动­找上门合作,一些街道办有相应的补­贴政策。在劳东燕看来,政府部门有需求,公司要抢占市场,二者“合谋”,让存在大量风险隐患的­人脸识别应用“遍地开花”。“从政府角度,人脸识别不失为便捷的­技术工具,为安全需要,尽可能做出严密的防控。在资本的维度,从事研发推广的企业,接近疯狂地拓展业务,是为了尽快提升自身的­市场估值与利润。不得不说,正是二者的亲密合作,人脸识别技术跑马圈地,得以像洪水一样势不可­挡。”面对越来越多的人脸识­别“入侵”生活,劳东燕一直站出来抗争。2019年10月29­日,北京市轨道交通指挥中­心主任战明辉在一个论­坛上透露,北京将应用人脸识别技­术实现乘客分类安检,安检人员据此对应采取­不同的安检措施。两天后,劳东燕便发表文章《地铁使用人脸识别的法­律隐忧》,坚决反对这样的做法。目前,北京地铁引入人脸识别­技术的计划被暂时搁浅。“由于对如何收集、保存、传输、使用与处理数据,以及是否允许出售或提­供给第三方,能否放在网上等,现行法律并未做任何的­介入,这就使得应用场景的大­肆扩张可能引发的风险,也呈几何倍数地增长。”劳东燕直言,这不只是细思极恐,根本就是不敢想象。

 ??  ??
 ??  ??
 ??  ??

Newspapers in Chinese (Simplified)

Newspapers from China