ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 머신러닝과 딥러닝의 차이는?
    정보기술 2020. 5. 2. 21:05

    인공지능은 미래지향적인 신기술이면서도 그 역사가 길다.   1956년 스탠퍼드대 컴퓨터 과학자 존 매카시가 처음 개념을 만들었다.   인공지능을 지능적인 기회에 지능적 컴퓨터 프로그램을 만드는 기술로 정했다.  인공지능은 인간의 생각과 유사한 능력을 구현할 목적으로 만들어졌고  초기 기술은 사전적인 프로그래밍으로 추측하고 추론하는 엑스퍼트 시스템, 전문가 시스템 플랫폼 형태로 개발됐다.   당시 응용 프로그램은 많지 않았다.

       

    1980년대에는 미국 정부의 연구 자금이 좀 줄어들면서 기술발전도 주춤했다.  그러다가 1990년대 IBM 왓슨이 딥블루를 개발했는데  러시아 체스 마스터 가리카스파로프를  이기면서 주목을 받기 시작했다.

    그러면서 인공지능은 다시 발전의 기류를 타기 시작했다.

     

    2016년 구글 딥마인드 알파고가 이세돌 구단과의 바둑 대결에서 승리하면서 인공지능은 또다시 세상을 놀라게 했다.

    머신러닝, 딥러닝의 잠재성에 대해 기업 그리고 국가의 관심을 굉장히 커졌고 다양한 분야에서 이 기술을 적용하여 되었다.  인공지능은 인간을 위해서 명시적으로 프로그래밍되지 않아도 컴퓨터가 지능적으로 작동하도록 하는 기술이다. 

     

    과거의 컴퓨팅은 핵심 명령어를 토대로 정해진 조건과 규칙에 따라서 빠르게 연산을 해내고 또 정확한 답을 내놓는 방식이다. 하지만 인공지능은 인지컴퓨팅인데 쉽게 말하면 사람이 설정해 놓은 규칙 범위 내에서만 작동하는 게 아니고 컴퓨터가 스스로 필요한 정보를 인지하고 습득해서 의사 결정을 스스로 하는 것이다.

    사람이 생각하고 행동하는 방식을 이제는 컴퓨터가 따라 하기 시작했다는 것이다. 

     

    지금 시대에서 가장 주목받는 인공지능 기술은 머신 러닝이다.  그중에서도 딥러닝은 놀라운 잠재성을 보여주고 있다.   용어에 대한 혼동을 막기 위해서 설명을 좀 부연하면 인공지능이 광의의 개념으로이고 그 안에 머신러닝 있고 딥러닝은 그 안에 하위 기술 개념이다.   머신러닝은 기계(Machine)와 학습(Learning )의 합성어이고 다시 말하면은 기계가 특정 논리에 맞춰서 방대한 데이터를 학습한 다음에 이를 기반으로 알고리즘을 찾아내서 변화를 예측하고 컴퓨팅을 하는 것이다.

     

    컴퓨터 공학자 아서 세뮤얼이 머신러닝을 이렇게 정의했다.  "사람이 일일이 프로그래밍하지 않아도 학습과 처리가 가능한 기능이다".  의사 결정을 도와주는 대부분의 인공지능 서비스는 요즘 나와있는 서비스는 대부분 머신러닝 기반이다.   쉽게 얘기하면 사람이 생각하는 방식을 컴퓨터에 그대로 옮겨 놓은 것이다.

     

    백화점에서 문을 여는 간단한 행동을 할 때도 사람들은 눈앞에 보이는 사물과 환경을 관찰하고  이해한다.  만약 문 앞에 폭탄이 있다고 가정했을 때 우리는 이것을  위험한 상황으로 파악하고 들어가면 안 되겠다는 결론을 나름대로 내린다.  짧은 시간이지만 이런 과정을 거치면서 생각을 하게 된다.

     

    이것을 조금 더 기술적으로 풀어서 이야기를 해 보면 이렇다.  먼저 현상을 관찰하고 사실과 상황을 파악한다.   그리고 기존에 있었던 경험과 지식을 바탕으로 새로운 사실을 패턴화 해서 기억을 한다.  문 앞에 폭탄이 있는 것은 기존 경험에 비추어 볼 때 그 패턴이 전혀 다른 상황이다.   새로운 상황에 대해서 가설을 세운다.   눈앞에 있는 것은 위험한 물질이다.  그런데 저기 모양은  폭탄 일 것이다. 그리고 기존에 TV에서 봤던 뉴스 사진으로 보았던 폭탄 모양을 기억해서 같은 종류인지 추론을 해본다.  폭탄이 터지면 수많은 사람들이 다친다는 사실을 떠올리면서 상황을 더욱 심각하게  인식을 하게 되는 것이다.   그리고 물체를 한 번 더 자세히 살피면서 폭탄이 맞는지 평가를 한다. 그리고 도망가야 하는지 신고를 먼저 해야 하는지 이런 최적의 행동에 대해서 결정을 내리게 된다.  이렇게 관찰하고 이해하고 또 평가하고 결정하는 생각의 기술이 바로 머신러닝이라고 보면 된다.

     

    딥러닝은 머신러닝을 구현하는 기술 중에서 하위 하위 개념인데 인간이 사물을 구분하듯이  데이터 속에서 패턴을 발견하고 이를 통해서 예측을 한다. 고양이 이미지를 인식하는 걸 예를 들어보자. 

    딥러닝 알고리즘은 기존의 축적된 수많은 동식물 이미지 패턴과  비교하면서 같은 이미지인지  확인하는 방식으로 고양이라는 정답을 찾아간다.   

    딥러닝은 이처럼 패턴인식을 통해서 가장 좋은 길을 찾아가는 기술이다.  인공신경망을 기반으로 하는데 인공신경망은 말대로 인간의 신경을 흉내 내서 만든 기법이다.  사람의 뇌에서 일어나는 정보 처리 과정을 살펴보면 눈이나 귀 같은 감각기관에서 받아들인 정보가 뉴런을 통해서 뇌로 전달이 되고 뇌는 이 정보를 토대로 판단을 해서 무엇을 할지 각 기관에 명령을 내린다.  뇌에는 여러 개의 뉴런이 연결되어 있는데 올바른 뉴런을 찾아가는 방식으로 복잡한 연산을 수행하게 된다.  이렇게 두뇌가 하는 활동을 모방한 것이  인공신경망이다. 

     

    딥러닝에서 딥의 의미는 사람의 뇌세포를 모방한 인공신경망이 여러 개의 층으로 구성되어 있다는 의미이다.   이 두뇌 작용의 프로세스를 본떠서 기계가 스스로 데이터를 분석하고 답을 낸다.  기존에는 주로 전문가들이 데이터 속에 존재하는 특징을 추출한 다음에 머신러닝을 통해서 판단을 하는 식이였다면 딥러닝에서는 데이터만 넣어주면 깊은 망을 통해서 스스로 데이터 특징을 자기 나름대로 찾아낸 다음에 분류하고 판단까지 수행한다.

     

    머신러닝과 딥러닝 차이를 학습 방법에서 찾기도 한다.  머신러닝은 대체로 지도 학습 슈퍼바이저 러닝을 통해서 작동을 한다.  간단히 말하면 지도하는 선생님이 따로 있는 것이다.   컴퓨터가 학습할 데이터를 선별하는 것에서부터 원하는 결괏값이 나올 수 있도록 데이터 알고리즘을 조정하는 선생 역할을 사람이 하게 된다.  이미지를 판별하는 경우를 보면 이미지별 특징을 컴퓨터에 학습시키고 새로운 동물 이미지를 입력하면 이미 정해진 결괏값과 비교해서 답을 내렸다.

    반면 딥러닝은 다는 아니지만 비지도 학습 언슈퍼바이저 러닝을 통해 수행되는 경우가 많다.  비지도 학습은 자율학습이다.  선생이 하던 작업이 생략이 되는 것이다.  바탕이 되는 데이터를 그대로 주고 딥러닝 알고리즘이 신경 인공신경망을 이용해서 스스로 분석한 후에 답을 내는 방식이다.

    대표적인 예로 구글의 텐서 플로우가 딥러닝 기반 이미지 인식 기능을 구현한 게 있는데 딥러닝에는 사전 정보가 필요 없고 입력에 대한 목표 결과 값도 주어지지 않는다.  스스로 수집된 데이터 사이에 유사성을 찾아서 입력 데이터를 스스로 파악을 해야 된다.  선생의 지도 없이 컴퓨터가 스스로 학습에서 결론을 내는 것이다.

    그러다 보니 자율적인 방식이 비지도 학습인데 딥러닝을 이용한 많은 시스템이 이런 비지도 학습을 따른다.

     

     

    머신러닝과 딥러닝은 성능에서도 차이가 있다. 인공지능은 사람의 개입이 적은 상태에서 그 기능을 수행할 때 더 성능이 우수하고 볼 수 있다. 

    예를 들어서 빨래 바구니에 여러 옷이 겹쳐있을 때 머신러닝은 미리 정의된 특징을 분석해서 이를 예측의 기반으로 삼기 때문에 옷 하나하나를 인식하기가 어렵다. 하지만 딥러닝은 사물이 서로 겹쳐져 있는 복잡한 사진을 그 나름대로 특징을 추출해서 이해를 한다.  대상을 인식하는 역할을 하는 거를 우리가 노드라고 하는데 이 노드가  따로 떨어짐 계층의 배열되어 있고 또 각 노드는 사진 속에 개별 요소 다시 말하면 빨래  한 장 한 장을 검토 한 다음에 이를 완전히 이해하기 위해 연선을 한다. 연선 결과로 생성된 신호가 다른 노드로 전달되고 그 후에 계층 내 모든 신호를 전체적으로 평가에서 사진 속에 있는 옷이 각각 정확히 무엇인지를 최종적으로 판단하고 예측을 하는 것이다.

     

    단체사진에서 사람의 얼굴을 식별할 때 머신러닝을 예로 이용한다면 코나 눈동자 같은 각 부위에 대한 특징을 사람이 제공해줘야 한다.  하지만 딥러닝은 여러 장의 사진 데이터를 제공하면 일을 검토해서 여러 특징을 스스로 이해함으로써 사진에 내용을 독자적으로 예측을 한다.

     

    딥러닝은 10여 년 전부터 막강한 성능을 뽐내기 시작했다. 물론 딥러닝도 그 나름대로 뿌리가 깊다.

    1957년 미국의 심리학자 프랭크 로젠블랫이 퍼셉션, 지각이라는 명칭으로 정의된 두뇌의 상호 연결성을 흉내 내는 알고리즘을 개발했다.  그때 알고리즘이 너무 복잡해서 실용성이 떨어졌고 한동안 사라졌다가  1986년에 '역전파 오류에 의한 학습 표현'이라는 논문이 발표되면서 다시 주목을 받게 시작했다. 인공신경망의 뛰어난 학습 효율성이 부각되면서 연구자들의 주목을 받았다.

     

    90년대에는 서포트 벡터 머신이라고 하는 비교적 간단하지만 성능이 뛰어난 기법이 등장하면서 관심을 받았다.  이 기법은 데이터를 효과적으로 분류해서 수집과 학습을 원활하게 해 준다.

     

    2000년대 들어서는 연산과정에 클라우드 기술이 적용되면서 새로운 국면을 맞이하게 된다.  클라우드 기술을 이용해서 대규모 연산을 한꺼번에 할 수 있게  되니까 딥러닝에 숨겨진 힘이 세상에 나오게 된 것이다.

    2011년 앤드류 교수가 구글과 함께 수행한 구글 브레인 프로젝트 세상에 발표하면서 딥러닝 위력이 널리 알려지게 되었다.  컴퓨터 16,000대를 연결해서 유튜브에 올라온 천만 개의 이미지 중에서 어떤 것이 고양이인지  찾아내는데 성공을 하게 된 것이다.  프로젝트 내용 간단했지만 그 방식은 아주 센세이션을 일으켰다. 사전에 고양이에 대한 정보를 입력하거나 이미지 경계를 찾아서 구분하는 작업을 전혀 하지 않은 상태에서 수행했기 때문이다.  스스로 데이터의 핵심 내용을 추출하고 판단을 내리는 자율학습을 한 것이다.  딥러닝에 정보를 처리하는 기능을 수행할 때 사람의 역할이 없었다고 하지만 처리할 정보를 입력하는 일만은 사람이 했다.  그런데 구글 브레인의 딥러닝은 입력 마저 기계가 스스로 했다.   바로 강화 학습의 형태이다. 강화 학습은 스스로 학습을 하는 방법만으로 문제를 해결하는 알고리즘이다.

     

    2016년에 이세돌을 이길 기존 알파고는 바둑 선수 수천 명과 대결을 하고 전문가가 제공하는 수많은 기보를 통해서 바둑을 학습했는데  이와 달리 강화 학습 기반의 업그레이드 버전 알파고 제로는 기본적인 바둑 규칙을 배우는 거 외에는 인간에게 도움을 전혀 받지 않았다.  알파고 제로는 이 방식으로 3일 동안 500만 회 정도의 대국을 스스로 치르고 기존 알파고와 대결해서 백전백승을 기록했다.

    스스로 학습하는 과정에서 인간이 시도하지 않은 방법도 개발했다는 점에서 세상을 놀라게 했다.   인간의 도움 없이 스스로 바둑을 학습한 알파고 제로는 오히려 인간 지식의 한계에 제약을 받지 않기 때문에 잠재성이 굉장히 크다.  알파고 제로는 인간의 데이터를 전혀 사용하지 않아도 인공 지능이 얼마나 많은 발전을 이룰 수 있는지를 보여주고 있다.

     

    그렇다면 딥러닝은 어떤 조건과 목적으로 사용을 해야 효과적일까?

    딥러닝을 실행하려면 기존 머신러닝에 비해서 엄청나게 큰 연선 능력이 필요하다. 이것 때문에 하드웨어적인 기반이 갖추어졌을 때 딥러닝 알고리즘을 활용하는 것이 적절하다. 대량의 연산을 병렬적으로 수행하기 때문에 적합한 GPU가 주로 사용된다.

    구글이 2016년 공개한 딥 러닝 패키지 텐서 플로 소프트웨어 패키지가 이 주류에서 급속도로 채택이 되고 이용될 수 있었던 원동력이 됐다.  텐서 플로우 덕분에 딥러닝에 수요가 최근 5년 동안 폭발적으로 증가했다. 무료 소프트웨어를 통해서 딥러닝을 대중화되도록 변환시키는 일등공신이라고 볼 수 있으며 따라서 고성능에 하드웨어와  방대한 데이터가 확보되어 있다면 딥러닝을 활용하는 게 적절하다고 볼 수 있다.

     

    학습과정에서 등급분류를 많이 해야 하거나 최적의 답을 빠르게 도출한 게 목적이라면  머신러닝이 적절할 수 있다.  막강한 능력을 보유한 딥러닝은 분류와 예측능력을 필요한 많은 기업의 새로운 대안으로 떠오르고 있다. 구글이 딥러닝을 이용해서 자사 데이터센터 온도를 99.6% 정확도로 조절하고 있고 그동안  구글 엔지니어들이 더 이상 줄이지 못한 전기사용량을 딥러닝을 통해서 줄였다.  딥러닝으로 넓은 공간 안에 설치된 여러 대의 에어컨 사용량을 최적화한 것이다.

    번역에도 딥러닝 알고리즘이 사용된다.  구글의 알파고는 5,000개 단어를 5초 이내에 번역해 버린다.

    그 정확도가 2년 전에 비해서 월등히 향상되었다는 건 써 본 사람들이라면 아는 사실이다.  국내 네이버 파파고도 딥러닝 기반의 서비스다.

    오늘 점심에 어떤 음식을 먹을까라는 문장을 번역 서비스 창에 입력을 한다.  딥러닝 번역 알고리즘은 이 문장을 통째로 코드화 한다.  그 후에 코드를 푸는 과정에서 영어 문장을 생성을 한다.  생성한 문장을 정답과 비교하면서 정답과 차이를 측정한다. 그 결과를 다시 처음으로 보내면 알고리즘은 번역이 퀄리티를 개선하기 위해서 업그레이드된 버전을 결과를 생성한다. 이렇게 차이를 줄여나가는 방식이다.  문법을 일이 가르쳐 줄 필요가 없다. 알고리즘이 스스로 학습해서 점점 더 정확한 문장을 만들어 가는 것이다. 

    알고리즘의 정확성을 높이는 데 있어서 업텐션 메커니즘이 굉장히 중요하다.  문제를 알고리즘에 통째로 집어넣을 때 알고리즘은 단어와 단어, 어절과 어절의  관계까지 파악해야 번역이 가능한데 모든 거를 다 파악하면 너무 어렵다. 어느 대목에 집중해야 하는지에 따라서 이후 프로세스의 정확도가 달라진다.  공부 잘하는 학생이 전체 챕터에서 어느 부분이 중요한지를 파악한 다음에 이 부분을 중심으로 효율적으로 공부하는 것과 유사하다. 

     

    자율 주행에도 딥러닝이 활용된다.  사람이 운전을 하면 자동차는 주행 법을 스스로 깨친다.

    딥러닝 기반 인공지능을 탑재한 자동차를 사람이 운전을 하면 자동차가 서서히 운전을 하는 방법을 깨치고 종국에는 이 자율주행이 가능한 자동차로 발전을 하는 것이다.  자율주행차 스타트업인 콤마 닷 에이아이는 2016년 3월에 자율주행 학습이 가능한 인공지능을 만들어서 자동차의 탑재했다.   이 차는 약 10시간 동안 학습으로 기본적인 자율주행 기능에 성공을 했다. 기존에는 고가의 특화 센스를 자동차에 장착하는 접근법을 사용했는데  완성차업계 종사자들이 중심이 돼서 개발했다.  전문가들은 다양한 센서 정보 주행 규칙을 모델링해서 자율주행기능 구현했습니다. 지금까지 자율주행 기술은 거대 정보통신기술 혹은 소수의 완성차업계 전 인물이었다. 레이저나 라이다를 통해서 사물과의 거리를 측정하고 또 대상을 감지하는 센서 비용도 굉장히 고가기 때문에 쉽게 만들기가 어렵다.  하지만 점점 기술이 범용화 되면서 산업 내에서 자율주행에 대한 학습 효과가 나타나고 점차 많은 기업들이 자율주행 모빌리티 시장에 진입하고 있다.

    딥러닝을 활용해서 자율주행 기술 구하는 기업이 굉장히 많이 생겼다.  전문가들은 자율 주행 기술의 핵심은 이미 딥러닝으로 이동하기 시작했으며 고가의 특화 센서를 저가의 범용 센서로 만들어서 빠르게 대체해나가고 있다고 이야기를 하고 있다.  자율 주행 기술의 패러다임이 딥러닝으로 전환되는 가운데 미래차 시장 경쟁에 핵심은 인공지능 분야 역량, 특히 주행에 필요한 데이터의 확보가 될 전망이다.   완성도도 결국 다양한 상황에 데이터 확보 의해서 좌우가 될 것이기 때문이다.   최근에 테슬라 이런 기업이 수억 킬로미터에 달하는 주행 데이터를 수집하는 이유가 바로 여기에 있다.  과거 자율주행 기술 핵심이 자본이었다면 지금부터는 데이터 와의 시간에 싸움이라고 봐도 무방하다. 자율주행 시장 초기부터 데이터를 확보한 기업과 그렇지 못한 기업의 격차가 매우 클 것으로 예상이 된다.  어쩌면 과거의 자본에 의한 격차 보다도 더 높은 진입 장벽이 될 수도 있겠다.

    '정보기술' 카테고리의 다른 글

    2020년 IT 트렌드  (0) 2020.05.04
    첨단 IT 기술과 음악이 만나다  (0) 2020.05.03
    IT기술과 언어번역기  (0) 2020.05.02
    교통사고를 막는 IT 기술  (0) 2020.05.01
    1인 가구를 위한 IT기술  (0) 2020.05.01

    댓글

Designed by Tistory.