본문 바로가기
💡 IT TECH & TREND

머신러닝(machine learning)- 머신러닝의 개념/머신러닝과 딥러닝 차이/머신러닝 사례

by devuna 2019. 12. 1.
728x90

머신러닝(machine learning)- 머신러닝의 개념/머신러닝과 딥러닝 차이/머신러닝 사례

출처 Thinkstock


머신러닝(machine learning)

‘머신러닝은 컴퓨터가 데이터를 통해 스스로 학습하는 것처럼 하는 기술이다.’

 

 

1. 머신러닝이란?

 

머신러닝을 우리말로 옮기면 '기계 학습'이라고 할 수 있는데 이것은 인공 지능을 가능하게 하는 방법 중 하나이다. 컴퓨터는 데이터를 분석하고 스스로 학습하는 과정을 거치고 나면 패턴을 인식할 수 있는 능력을 갖추게 된다. 이렇게 되면 입력하지 않은 정보에 대해서도 판단, 결정할 수 있게 되는 것이며, 이것이 바로 기계 학습이다. 다시 말해, 방대한 양의 데이터 가운데 비슷한 것끼리 묶어내고 서로 관계있는 것들의 상하구조를 인식하여 이것을 바탕으로 앞으로의 행동을 예측하는 기술인 것이다.

 

예를 들어, 컴퓨터에게 수많은 고양이 사진을 보여 주면서 ‘이것이 고양이 사진이다’라고 알려준다. 반복되는 고양이 사진 속에서 컴퓨터는 고양이가 가진 평균적인 모습에 대해 학습하게 된다. 기계 학습이 이뤄지고 난 이후에는 보여 주지도 않았던 고양이 사진도 고양이 사진으로 판별할 수 있게 되는 것이다.

 

2. 머신러닝과 딥러닝의 차이

 

 

인공지능(AI)/머신러닝/딥러닝 관계도

 

인공지능
인공지능(Artificial Intelligence)이란 기계 혹은 시스템에 의해 만들어진 지능을 의미한다. 세계적인 관심을 받은 알파고부터, 사진을 보고 사물을 판단하는 소프트웨어, 영화 AI에 나오는 로봇까지 모두 인공지능의 종류들이다. ‘인공지능’이라는 용어 그대로 인간이 지닌 지적 능력을 인공적으로 구현한 것들 모두 인공지능에 포함된다.

머신러닝

우리말로 “기계학습”인 머신러닝은 인공지능의 하위 분야다. 이는 기계가 직접 데이터를 학습(러닝)함으로써 그 속에 숨겨진 일련의 규칙성을 찾는다. 즉, 우리가 가지고 있는 사례 형식의 데이터를 컴퓨터가 학습해, 그를 기반으로 새 데이터를 평가, 예상하고 이를 우리가 활용할 수 있게 한다. 감기에 걸린 환자들의 체온과 건강한 사람들의 체온 데이터를 컴퓨터에게 학습 시킨 후 특정 체온을 제시했을 때 그 체온을 가진 사람이 감기에 걸렸는지의 여부를 판독하게 하는 것이 기계학습의 예시이다.

딥러닝


딥러닝(심층학습)이란 기계학습의 일부로 기계학습과 대부분의 것들이 매우 비슷하지만 일반적인 기계학습과 구별되는 두가지 큰 특징을 뽑으면 다음과 같다. 데이터의 특징을 사람이 추출하지 않는다. 주로 인공신경망 구조를 사용하여 학습한다.


두 가지 특징들을 하나씩 설명해 본다면, 첫번째 ‘데이터의 특징을 사람이 추출하지 않는다.’ 라는 것은 데이터에서 일부 특징들만 사람이 뽑아서 기계에게 전달해 학습시키는 것이 아니라, 데이터 자체를 컴퓨터에게 전달한다는 것이다.

예를 들면 컴퓨터에 개와 고양이 사진을 학습시켜 특정사진의 동물이 개인지 고양이인지 분류하도록 한다면, 일반적인 기계학습의 경우 개와 고양이의 구별되는 큰 특징들만 뽑아 컴퓨터에게 전달 시키지만 딥러닝은 개, 고양이 사진 자체를 컴퓨터가 학습하도록 하는 것이다.

 

3. 머신 러닝의 장점

 

- 더 빠른 의사 결정 : 머신 러닝 알고리즘은 의사 결정의 우선 순위를 지정하고 자동화한다.

- 적응성 : 인공 지능은 기존 데이터 뿐만 아니라 실시간으로 입력되는 데이터도 처리하고 의사 결정 시 반영할 수 있다.

- 알고리즘 활용 비즈니스 : 고급 머신 러닝 알고리즘을 사용하여 높은 수준의 자동화를 달성하고, 이를 통해 새로운 제품과 서비스를 개발하기 위한 기틀을 마련한다.

- 더 깊은 통찰력 : 머신 러닝은 스트리밍되는 대량의 복잡한 데이터를 분석하여 인간이 예측할 수 있는 범위 이상의 것을 예측하고, 이를 통찰력을 발휘할 수 있다.

- 효율성 : 대량의 데이터를 분석하여 정확한 결과를 예측하며, 이를 통해 작업을 자동화하여 비용을 줄이고 인적 오류를 제거할 수도 있다. 이는 더 나은 비즈니스 성과를 도출하는 것으로 연결된다.

 

 

4. 머신 러닝의 작동 기법

 

- 지도 학습 : 지도 학습 알고리즘은 목표 출력값을 알고 있는 입력값처럼 레이블이 지정된 데이터 정보를 사용해 트레이닝된다. 이 경우 실제 출력값과 정확한 출력값을 서로 비교하여 오류를 검출하면서 알고리즘 학습이 이루어진다. 그런 다음 학습 결과에 따라 모델을 수정한다. 지도 학습은 분류, 회귀분석, 예측 및 변화도 부스팅 등의 기법을 통해 발견한 패턴을 사용하여 추가로 레이블(=목표값)이 지정되지 않은 데이터의 레이블 값을 예측한다. 지난 데이터를 기반으로 앞으로 있을 이벤트를 예측하는 데 지도 학습이 가장 보편적으로 사용된다. 신용 카드 거래의 사기성이나 보험 가입자의 보험금 청구 가능성 여부 등을 예측하는 데 효과적이다.

- 비지도 학습 : 비지도 학습 알고리즘은 이전 레이블이 없는 데이터를 학습하는 데 사용된다. 비지도 학습 알고리즘에는 정답이 없기 때문에 알고리즘을 통해 현재 무엇이 출력되고 있는지 알 수 있어야 한다. 따라서 데이터를 탐색하여 내부 구조를 파악하는 것이 목적이다. 비지도 학습은 트랜잭션 데이터에서 특히 효과적이다. 예를 들어 유사한 속성의 고객 세그먼트를 식별한 후 그 유사성을 근거로 마케팅 캠페인에서 고객 세그먼트를 관리하거나 고객 세그먼트의 구분 기준이 되는 주요 속성을 찾을 수도 있다. 이러한 알고리즘은 텍스트 주제를 세분화하고 항목을 권장하며 데이터 이상점(Outlier)을 식별하는 데도 이용된다.

- 준지도 학습 : 준지도 학습이 활용되는 응용 분야는 지도 학습과 다르지 않다. 하지만 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 모두 사용해 트레이닝한다는 점에서 차이가 있다. 주로 레이블이 지정된 데이터는 용량이 작고, 레이블이 지정되지 않은 데이터는 용량이 크다. 그 이유는 레이블이 지정되지 않은 데이터의 경우 수집에 많은 노력이 필요하지 않아 비용이 저렴하기 때문이다. 또한 준지도 학습은 레이블 지정에 따른 비용이 너무 높아서 완전한 레이블 지정 트레이닝이 어려운 경우에도 유용하다. 이 학습 기법을 사용한 초기 사례로는 웹 캠을 이용한 안면 인식 기술이 있다.

- 강화 학습 : 강화학습은 로봇, 게임 및 내비게이션에 많이 이용된다. 강화 학습 알고리즘은 시행착오를 거쳐 보상을 극대화할 수 있는 행동을 찾아낸다. 이러한 유형의 학습은 기본적으로 에이전트(학습자 또는 의사결정권자), 환경(에이전트가 상호작용하는 모든 대상), 동작(에이전트 활동)이라는 세 가지 요소로 구성된다. 이 알고리즘의 목적은 에이전트가 일정한 시간 내에 예상되는 보상을 극대화할 수 있는 동작을 선택하도록 하는 데 있다. 에이전트는 유효한 정책을 따라 목표에 이르는 시간이 더욱 빨라진다. 따라서 강화 학습의 목표는 최선의 정책을 학습하는 것이라고 할 수 있다.

 

 

728x90

댓글