Machine learning
글로벌 시장조사업체인 가트너(Gartner)가 ‘주목해야 할 2015년의 기술 분야’로 선정한 머신러닝(Machine learning). 최근 세계적으로 경영의 화두로 떠오르고 있지만, 아직 이에 대해 무엇을 말하고 의미하는지에 대한 의문이 많다. 왜 이런 개념이 등장했는지도 정확하지 않다. 물론 이 머신러닝 덕분에 포털 사이트의 자동검색기능이 생겨나고 범죄 예측도 가능해졌지만, 어떤 기술이 접목되어 이를 구현했는지는 잘 모른다. 확실한 부분은 머신러닝이 IT 생태계의 패권을 쥐려는 공룡기업들 간의 격전지로 부상하고 있는 것이다.
새로운 디지털 경험에 다가서다
인공지능의 한 갈래인 머신러닝(Machine Learning: 기계학습). 최근 이 머신러닝 생태계의 변화가 심상치 않다. 기업 간 투자와 인수합병, 전략적 제휴 소식이 끊이지 않고 있다. 또 이를 활용한 새로운 서비스도 어렵지 않게 찾아볼 수 있다. 사용자들은 과거와 다른 새로운 디지털 경험에 한 걸음 더 가까워진 것이다.
미국 경제전문 학술지 하버드비즈니스리뷰는 머신러닝을 몇 가지 키워드로 나누어 설명한다. 최근 몇 년간 IT 업계의 뜨거운 감자였던 ‘빅 데이터(Big Data)’를 바탕으로 방대한 데이터의 홍수 속에서 사용자에게 유의미한 정보를 사용 가능한 형태로 가공해준다. 기업은 이 기술을 이용해 고객의 구매내역, 인터넷 방문 흔적, 댓글 등 보유 중인 엄청난 양의 정보를 마케팅 전략으로 활용할 수 있다. 고객의 과거 정보를 토대로 그가 어떤 상품을 얼마나 사들일지를 머신러닝이 예측해주기 때문이다. 단순 통계학적으로 충분히 가능한 일이지만, 머신러닝이 각광 받는 이유는 다른 것에 있다. 통계와 달리 선후관계를 따지지 않는 것. 그리고 학습능력이 바로 그것이다. 이는 머신러닝이 딥러닝(Deep learning)으로도 불리는 이유이기도 한데, 머신러닝은 전에 내렸던 결정이 맞았는지를 스스로 체크해 그 결과를 다음번 예측 결정에 반영하기도 한다. 예지력을 갖췄다는 의미다. 가령 고객이 예측대로 움직였는지, 추천했던 아이템을 클릭했는지, 예측했던 상품을 정말로 샀는지, 신용 정도는 어떤지 등을 파악해 데이터베이스에 저장한다. 이 밖에도 특성 추출(Feature Extraction)이 적용된 얼굴인식 기능도 갖추며 제약(Regularization)에 대한 개념을 새롭게 정의하고 있다.
서울대학교 노영균 교수는 “머신러닝을 구현하는 데 있어 100여 년 전에 만들어진 수학 알고리즘을 사용하기도 하지만, 완전히 새로운 개념을 이용하기도 한다”라며 “2000년에 접어들면서 선형 최적화(Linear Optimization)로는 풀 수 없었던 문제를 볼록 최적화(Convex Optimization)로 처리하게 됨에 따라 머신러닝의 성능을 높이는 계기를 마련했다”고 전했다.
IT 공룡들, 머신러닝에 집중
최근 본격적인 대중화를 선언한 머신러닝은 기술이 발전할수록 사람의 뇌가 할 일을 컴퓨터가 대신하는 풍경을 연출하고 있다. 고개를 갸웃거릴 이들이 많겠지만, 이미 대중들의 일상 깊숙이 파고들어 있다.
지난 2012년, 컴퓨터가 유튜브에서 스스로 고양이 이미지를 찾아내도록 하는 프로젝트를 공개해 화제를 모았던 구글. 고양이라고 할 만한 어떠한 표시·장치도 없던 상황에서 영상 속 고양이를 알아맞힌 것이다. 바로 머신러닝의 힘이다. 구글 검색의 기본 원칙인 페이지랭크도 텍스트마이닝이라는 일종의 머신러닝 기술에 기반하며, 구글나우 및 유튜브에서 영상을 추천하는 알고리즘에도 쓰인다. 요즘은 ‘구글 = 검색’이 아니라 ‘머신러닝’ 기업이라는 얘기가 나올 정도다. 지난 5월, 구글이 개최한 I/O 개발자 콘퍼런스에서 선보인 구글포토도 머신러닝의 진수를 보여주는 서비스다. 구글포토는 고화질 이미지와 동영상을 무제한으로, 그것도 무료로 저장할 수 있는 클라우드 기반 서비스다. 머신러닝 기술을 활용해 콘텐츠를 자동으로 분류해준다는 것을 골자로 한다.
세계 최대 소셜 네트워크 서비스(SNS)인 페이스북도 머신러닝 기술을 다양한 분야에 적용하고 있다. 페이스북은 ‘팬더’(Project PANDA)라고 불리는 프로젝트를 통해 사진에서 정확하게 성별, 헤어스타일, 옷 스타일, 얼굴 표정을 식별하는 방법을 연구하고 있으며, 세계 최대 비디오 스트리밍 업체 넷플릭스는 사용자 구매 이력을 바탕으로 영화를 추천해 주는 서비스에 머신러닝을 적용하고 있다. 또한, 전자상거래 거인 아마존도 최근 자사 서비스의 핵심이라고 할 수 있는 고객 리뷰 시스템을 머신러닝 기반으로 개편하기로 했을 정도다.
IT 업계의 한 전문가는 “사람들의 활동으로 발생하는 디지털 데이터는 빠르게 늘고 있다는 것은 머신러닝이 할 수 있는 일이 그만큼 늘고 있다는 얘기”라며 “구글, 애플, 아마존 등 굴지의 IT 회사들이 머신러닝을 전진 배치했고, 사용자들은 점점 머신러닝에 익숙해져 가고 있다. 사람이 아닌 컴퓨터의 판단에 기반하는 디지털 서비스의 확산은 IT 업계 판세와 사용자들에게 어떤 변화를 몰고 올지 많은 전문가들의 관심이 집중되고 있다”고 전했다.
꾸준한 관심과 평정심 필요
이미 1980년대 한차례 붐을 일으켰던 머신러닝. 좁게는 딥러닝으로 각광받았던 당시 인공지능 기술로 당장 터미네이터와 같은 로봇을 만들 수 있을 것처럼 환상을 일으켰다. 하지만 결과는 대중들을 만족시키기엔 역부족이었고, 그들은 머신러닝 자체에서 시선을 돌려버렸다. 김정희 네이버랩스 수석연구원은 “과거가 되풀이되지 않기를 바랍니다”라며 “꾸준한 관심과 평정심이 필요합니다. 적절한 수준에서 기대를 갖고 지켜봐 줬으면 좋겠어요”라고 전했다.
마이크로소프트(MS) 본사 머신러닝 마케팅을 총괄하는 이시영 수석은 “몇 년 안에 특정 시간이나 장소에서 누군가 범행을 저지를 가능성을 정확하게 맞힐 수 있게 될 겁니다. 영화 ‘마이너리티리포트’ 장면처럼 말이죠”라며 “과학적 예측을 통해 벌어질 일을 정확히 파악하는 것이 미래 사회 생존 역량이 될 것”이라고 피력했다.
머신러닝이 보다 대중들에게 깊숙이 다가가기 위해선 넘어야 할 난제들이 분명히 존재한다. 하지만 머신러닝은 계속 발전하고 있다. 앞으로 ICT 기업뿐만 아니라, 개인도 머신러닝을 이용해 필요한 결과를 만들어낼 수 있는 시대가 올 것이라 전문가들은 전망한다. 또한, 이 기술은 분명 우리 삶을 풍요롭게 만들어줄 것이다. 머신러닝이 몰고 올 IT 진화 시나리오가 궁금해진다.