-
생체인식 기술과 인종 편견정보기술 2020. 5. 30. 06:29
제한된 데이터셋을 사용하여 얼굴 인식 기술을 구축하고, 사회 전체를 나타내지 않는 이미지를 만드는 것은 그들의 진화에 대한 윤리적 논쟁을 불러일으켰습니다.
초당 수십억 개의 지문을 매칭 할 수 있는 기술, 적외선으로 망막을 스캔하여 혈관의 고유한 DNA 패턴을 기록하고 수백만 개의 데이터베이스가 있는 얼굴을 교차 검사할 수 있는 기술로, 생체 인식 윤리는 점점 더 중요한 영역이 되었습니다.
다양한 이유로 생물학적 및 행동적 특성에 기초하여 개인을 식별하는 생체 인식 기술을 채택하게 되며, 특히 COVID-19 전염병의 맥락에서, 직접 확인이 불가능할 수 있습니다.
그러나 이 개척 분야는 사생활, 인권, 그리고 체계적 편견을 둘러싼 우려에 빠져 있는데, 일부 생체 인식 기술은 무고한 사람들이 감옥에 가거나 필수적인 복지 혜택을 거부하는 것을 볼 수 있는 인종적이고 윤리적 편견을 양산하는 것으로 나타났습니다.
인공지능(AI)과 데이터 윤리를 감시하는 독립 연구기관인 에이다 러브레이스 연구소의 칼리 킨드 소장은 이는 주로 기업들이 사용하는 데이터셋에 결함이 있거나 제한적인 것으로 분석된다고 말합니다.
대부분의 훈련 데이터 집합은 유명인사의 사진만을 사용합니다. 왜냐하면 그것들은 찾기 쉽기 때문입니다. 하지만 이것들은 세계를 대표하는 것은 아닙니다.
킨드는 "시스템에 정보를 주는 데이터의 편향으로 귀결된다"라고 말합니다. "이것은 비 현상 데이터 집합에서 비롯되며 이는 기술 개발자가 인종, 성별 또는 사회적 계층을 적절하게 표현하지 못했기 때문일 수 있습니다."
경험적 증거가 극명합니다. 미국 국립 표준 기술 연구소가 발표한 획기적인 연구에서는 99개 개발자(업계 대다수)의 소프트웨어 알고리즘 189개를 분석한 결과 백인 이미지에 비해 아시아계 및 아프리카계 미국인 얼굴에서 부정확도가 10배에서 100배 정도 높게 나타났습니다.
MIT 미디어랩이 2018년 미국 매사추세츠공대(MIT) 연구소에서 실시한 연구에 따르면, 마이크로소프트, IBM, 중국의 메그비이의 얼굴 인식 시스템은 백인 남성의 이미지에 사용될 때는 0.8%의 오류율을 보였지만, 피부색이 검은 여성의 이미지에 실험했을 때는 34.7%의 오류율을 보였습니다.
왜 소수 민족들은 편견을 갖게 되는가?
MIT 연구진은 조사 결과 남성 77%와 백인 83%를 성과 격차의 원인으로 꼽았습니다.
킨드는 "완벽하게 대표적이고 편견이 없는 완전히 객관적인 데이터 집합이 있는 지점에 도달하는 것은 매우 어렵다"라고 말합니다. "하지만 극적으로 줄일 수 있다."
그러나 유럽 최대 규모인 독일 국립 응용 사이버 보안 연구 센터의 파웰 드로즈도스키 연구원은 생물학적 윤리에는 더 복잡한 이유가 있을 가능성이 있다고 보고 있습니다.
그는 "훈련 데이터가 많아지면 편견을 근절할 수 있고 어느 정도 사실이긴 하지만 완전히는 아니다"라고 말했습니다. "왜냐하면 편향의 실제 근원을 분리하는 것은 매우 어려운 일이기 때문입니다."
드로즈도스키에 따르면 행동 단서와 조명, 안면 인식 센서와의 거리, 화장 여부 등 변수가 생체 인식의 효능에 심각한 영향을 미칠 수 있습니다.
그는 "이러한 시스템은 종종 여성보다 평균적으로 키가 큰 남성들을 위해 만들어진다"라고 설명합니다. "따라서, 카메라의 위치가 그들에게 최적화되지 않고, 기술의 더 나쁜 성능으로 이어집니다."
기업이 이용할 수 있는 균형 잡힌 데이터의 부족도 생체 인식 윤리를 개선하는 데 걸림돌이 되고 있습니다. 유럽연합의 일반 데이터 보호 규정과 같은 데이터 보호 법률은 여론의 물결에 의해 지지되고 있으며 개인정보에 대한 접근과 취급이 제한되어 있습니다.생체 인식의 차별 또는 전신적 편향 방지
영국에 본사를 둔 생물 측정학 회사 온피도가 생물 측정학 윤리를 향상하기 위한 한 가지 접근법은 신원 사기로부터 보호하는 알고리즘을 만들 때 고객의 동의와 함께 제공된 데이터만을 사용하는 것이었습니다.
"우리는 어떤 데이터도 구입하지 않고, 어떤 데이터도 인터넷을 긁어내지 않으며, 데이터를 생성하기 위해 사람들에게 돈을 지불하지도 않습니다, "라고 이 회사의 제품 책임자인 Susana Lopes는 말합니다. "우리는 고객이 우리와 공유하기로 동의하는 모든 것에 얽매여 있기 때문에, 이는 우리의 데이터 베이스가 우리의 고객 기반을 대표한다는 것을 의미합니다."
온피도는 AI 기반 기술을 활용해 공식 정부 발급 ID가 진품인지 사기성인지 평가한 뒤 사용자의 얼굴 생체인식과 비교하는 것으로, 이론적으로 신원과 신체 존재 여부를 검증하는 개념입니다.
로페스는 온피도의 서비스에 대한 수요가 최근 몇 주 동안 4배로 증가했다고 말합니다. 그러나 이러한 성장에도 불구하고 그녀는 "필요한 만큼 균형 잡힌 데이터셋을 획득하는 데 시간이 더 걸릴 것"이라고 인정합니다.
다양한 이미지로 생체 인식 윤리의 우선순위 지정다른 회사들은 생체인식 시스템의 체계적 편견을 줄이고 예방하기 위해 더 혁신적이고 비용이 많이 드는 경로를 택했습니다.
캘리포니아에 본사를 둔 영상 분석 회사인 빈트라의 브렌트 보에케슈타인은 자사의 맞춤형 훈련 데이터베이스가 잠재적인 편견을 완화하기 위해 "원점에서" 만들어졌다고 말합니다.
인터넷에서 모은 천만 개의 얼굴 이미지 데이터 집합체인 MS 셀럽에 대해 보에스테인은 "대부분의 훈련 데이터 집합은 유명인사의 사진만을 더 쉽게 찾을 수 있기 때문에 사용한다"라고 말합니다. "하지만 이것들은 세상을 대표하지 않고 아름다운 경향이 있습니다. 그들은 광대뼈가 높고 더 젊어지는 경향이 있습니다."
대신 빈트라의 데이터셋은 아프리카 퍼스트레이디 등 세계 각국의 공인들을 다양하게 선별해 구축해 보안이나 프라이버시 우려를 피했습니다. 76개국에서 빼앗긴 2만여 명의 신원이 담겨 있어 인종 간 균형이 균등하게 잡혀 있습니다. 보에케스타인은 "시간이 오래 걸리고 돈이 많이 들었지만, 우리는 사회에 대한 보다 총체적인 시각을 구축했다"라고 말합니다.
2018년부터는 종족에 대한 가장 많은(카우카시아)과 가장 적은(아프리카)의 정확한 성과의 격차를 11.9%에서 3.5%로 줄였고, 평균 정확도는 현재 89.2%로 마이크로소프트와 아마존의 업계 최고 경쟁률을 넘어섰습니다.
생체 데이터의 미래이러한 개선에도 불구하고, 인권 운동가들은 생물 측정 윤리의 문제 때문에 이 기술에 반대하고 있습니다. 리버티 정책 및 캠페인 담당자인 한나 카우치맨은 " 부정확한 생체 인식 감시는 명백한 위험을 나타내지만, 보다 정확한 버전의 안면 인식은 우리의 기본권에 심각한 위험을 야기한다"라고 말했습니다.
그러나 생체인식이 우리 삶에서 더 큰 부분이 되는 것은 시간문제인 것 같습니다. 인도의 12억 5천만 인구 중 거의 모든 인구가 이미 세계에서 가장 큰 생체 인식 시스템인 국민 ID 시스템의 일부분입니다.연구원 Drozdowski는 실종 아동 찾기 또는 적극적인 범죄자 확인과 같은 기술의 잠재력 이 보호 수단과 균형을 이루어야 한다고 생각합니다. "감독은 생체 인식과 자동화된 의사 결정의 큰 부분입니다"라고 그는 말합니다.
에이다 러블레이스 연구소의 종류는 이러한 시스템 한계에 대한 지속적인 위험 평가 및 인식의 필요성을 시사합니다.
“바이오 메트릭 기술은 긍정적인 목적으로 절대적으로 사용될 수 있습니다. "그러나 그것은 실질적인 사회적, 윤리적 문제를 야기할 것이며, 거래되는 것과 얻는 것을 이해하기 위해 근로자와 고용주와 협력해야 합니다."
'정보기술' 카테고리의 다른 글
오픈소스 기술의 혁신 (0) 2020.06.01 5G 의 실제 위험 정도 (0) 2020.05.31 로봇이 호텔을 경영한다 (0) 2020.05.29 외로움을 달래주는 로봇 (0) 2020.05.28 IT시대, 프로그래머의 삶의 하루 (0) 2020.05.27