군더더기 없는 기계학습 백과사전

기계학습 입문자를 위한 수학적 배경의 필요성 본문

Artificial Intelligence/과거, 현재, 그리고 미래

기계학습 입문자를 위한 수학적 배경의 필요성

Jay김 2020. 6. 22. 07:05

해당 글은 현재 매사추세츠 앰허스트(애머스트) 대학에서 재직 중이신 Sridhar Mahadevan 교수님의 '수학과 통계학에 대한 기본적인 지식만으로 기계학습과 인공지능에 입문할 수 있을까요?' (Will a basic understanding of mathematics and statistics satisfy to get into machine learning and artificial intelligence?) 쿼라(Quora) 질문에 대한 답변을 번역한 글입니다. 해당 글에는 필자가 한국인 독자에게 적절하다고 생각하는 의역이 있을 수도 있음을 알려드립니다.

해당 글은 쿼라 콘텐츠 이용약관 3조 c(i)항을 따릅니다. https://www.quora.com/about/tos

원글: qr.ae/pNK4qy

 

Will a basic understanding of mathematics and statistics satisfy to get into machine learning and artificial intelligence?

Answer by Sridhar Mahadevan, PhD Computer Science, Rutgers University (1990)

www.quora.com

네. 수학 때문에 겁먹고 포기하지 마세요. 여러분의 생각만큼 어렵지 않습니다.

그렇다면 필수적으로 알아야 하는 지식은 무엇일까요?

여러분이 좇고자 하는 목표의 특성을 아는 것은 항상 도움이 됩니다. 기계학습의 경우엔 고차원의 데이터의 이해라는 목표가 있죠. 여러분의 뇌는 이것을 이해하기 위해 탄생했습니다. 이를 설명하는 이야기를 조금씩 풀어나가겠습니다.

일단 여러분은 우리가 다루고자 하는 고차원의 데이터라는 것이 통계학자들이 전통적으로 연구하던 보통 차원(dimension) 보다 관측 개체(observation)가 많은 저차원의 영역의 데이터와는 큰 차이가 있다는 것을 명심해야 합니다. 해당 저차원 데이터의 대표적 사례로는 온도가 있습니다. 한 개의 스칼라 수치, 그리고 몇 년에 걸친 데이터로 이루어져 있죠. 다른 예로는 부모에 대비한 아이의 신장, 그리고 동물의 무게 등이 있습니다. 전부 통계학자들이 사랑하고, 잉크가 떨어지기 전에 펜으로 써낼 수 있는 것들이죠.

기계학습은 고전 통계학을 완전히 뒤집고, 발길질을 날리고 비명을 지르는 통계학의 멱살을 잡은 뒤 21세기로 강제로 끌고 왔습니다. 이젠 한 개 한 개의 샘플이 큰 건입니다. 거대한 염기서열부터 사회 네트워크 구조까지 포함한 기계학습의 영역은 기존의 고전 통계학자들에게는 그저 악몽입니다. 여태까지의 삶은 단순했는데!

그러면 이 중 고전 통계학자들의 입장에선 몸서리 쳐지지만, 기계학습러들은 공부하기 좋아하는 이미지, 음악, 그리고 텍스트 파일 같은 것들을 다뤄볼까요? 전부 겉으로 고차원의 데이터라는 게 보이죠. 웹은 이런 데이터로 가득 차 있습니다.

차원(Dimensionality)의 의미는 무엇일까요? 직관적으로 차원은 자유도(degrees of freedom)를 의미합니다. 우리의 뇌가 인식하는 3차원처럼 어떤 공간이 그 공간에 갇힌 생물에게 어떻게 보이냐는 거죠.

우리는 항상 이미지, 음악, 글, 그리고 영상 같은 고차원 데이터에 둘러싸여 있습니다. 저도 지금 웅장하고 아름다운 합창 음악을 들으면서 이 글을 쓰고 있죠. (아, 여러분의 취향이 아니신가요? 그럼 핑크 플로이드든 랩이든 여러분의 마음에 드는 음악으로 대체하세요.)

웅장하고 아름다운 소리입니다. 오르간과 합쳐진 목소리들. 제 뇌는 이 고차원 데이터를 어떻게 이해하는 걸까요? 어떻게 오르간 소리와 목소리를 이해하고 구별해내는 걸까요? 이건 정말 대단한 뇌의 미스터리입니다.

최근에 유행하고 있는 사회 매체 틱톡(Tik Tok)은 30초짜리 영상에 대한 모든 것이죠. 그 짧은 영상에 많은 것을 담을 수 있다는 점은 참 대단합니다. 텔레비전 광고를 보세요. 매 5초마다 프레임이 바뀝니다. 우리가 매일 읽는 페이스북 글, 웹 자료, 뉴스 기사 같을 것들. 전부 기계학습 분야에서 분석하고자 하는 것들입니다.

그래서 기계학습 분야에 통달하기 위해서 배워야 하는 수학 과목들은 무엇일까요? 기계학습의 핵심은 이미지, 텍스트, 음악, 영상 같은 고차원 데이터를 이해하는 것입니다. 이건 세 살짜리 애도 별 힘 안 들이고 하지만 거대 데이터 센터는 힘들어하는 작업이죠.

각 데이터 개체는 기다란 실수 수열 혹은 벡터로 추상화할 수 있습니다. 다음 사진은 제가 며칠 전에 도나우 강을 내려가면서 아이폰으로 찍은 사진입니다. 당신의 뇌는 이 고차원 벡터를 바로 이해할 수 있습니다. (각 픽셀을 RGB 값을 나타내는 세 개의 수치로 생각하시면 됩니다.)

여러분은 픽셀 하나하나를 보지 않습니다. 여러분은 물체들을 보고 인식하죠. 크고 아름다운 성과 강 같은 것들 말이죠. 이 과정은 바로바로 일어납니다. 마법일까요? 도대체 어떤 원리로 벌이지는 걸까요? 핑크 플로이드 가사 "내 머릿속에 누군가가 있지만, 내가 아니야"가 떠오릅니다. 당신의 머릿 속에 있는 천억 개의 뉴런들이 이 이미지를 순식간에 분석하고 이해합니다. 어떻게 하는 걸까요?

한 가지 제시된 아이디어는 이건 사실 생각보다 단순한 데이터라는 겁니다. 픽셀 주변 픽셀 값들은 비슷하거나 높은 상관관계를 가질 겁니다. 이 점을 이용해 뇌는 이를 길거리의 화가나 만화가 마냥 더 낮은 차원의 스케치로 대략적으로 다시 그려낸다는 거죠.

고차원의 데이터는 흔히 행렬로 표현됩니다. 여기서 각 행은 이미지의 가로 방향 순의 픽셀 값들에 상응합니다. 각 행은 한 개의 벡터에 해당되죠. 이 행벡터들의 집합은 한 개의 행렬을 이룹니다. 이 벡터들이 기저(basis)를 이루어 생성(span)하는 공간은 뭘까요? 각 기저 벡터를 실수로 곱한다고 생각해 보시면 이해가 될 겁니다. 날씨는 항상 같지 않습니다. 어느 하루는 해가 떴냐, 구름이 꼈냐, 비가 오냐 눈이 오냐에 따라서 다른 하루보다 밝거나 어둡기도 하지요. 0과 1 사이의 수치로도 표현할 수 있는 현상이죠. 당신의 뇌는 이렇게 스칼라 수치로 표현할 수 있는 다양한 현상 혹은 데이터를 이해할 수 있어야만 합니다. 이게 실제로 된다는 사실은 기적과도 같다고 생각합니다.

따라서 여러분은 선형 대수학을 좀 배워야 한다는 결론에 다르게 될 겁니다. 이미지, 텍스트 문서, 음악, 그리고 영상 데이터는 결국엔 전부 행렬입니다. 행렬은 단순히 보면 수의 집합이지만 꼭 그렇지만은 않습니다. 이 수들은 서로 관계가 있죠. 위의 사진을 다시 볼까요? 한 개의 픽셀 주변의 픽셀들은 비슷한 픽셀 값들을 가집니다. 바로 이 구조를 뇌가 사용할 줄 알고 사진을 빠르게 이해하는 겁니다.

여러분은 기본 통계학 지식 또한 배워야 합니다. 가변성은 현실의 기본 특징이죠. 같은 성 주변으로 매일 도나우 강을 도하한다고 생각해보세요. 어느 날은 맑고, 어느 날은 비가 옵니다. 어느 날은 눈이 올지도 모르죠. 이 가변성을 뇌는 어떻게 받아들일까요? 이를 표현하는 통계학은 선형 대수학과 접점이 많습니다. 일일 온도 재기 같은 모든 통계학적 계산은 결국 선형 대수학으로 이어집니다.

마지막으로 이 모든 현상에는 목적이 있습니다. 동물은 음식을 섭취하고, 번식을 해야 하죠. 이런 것들은 목적 함수(objective function)로 표현할 수 있습니다. 수학적 최적화(optimization)는 이런 목적 함수를 최대화하거나, 반대로 비용 함수(cost function)를 최소화하는 최적화를 공부하는 학문입니다. 가장 간단한 실생활 사례는 돈 벌기죠. 저와 달리 제 애완견들은 돈에 대해 생각하지 않습니다. 지폐는 제 개들에게 아무런 의미를 가지지 않습니다. 밥이 훨씬 중요하죠. 이처럼 목적은 다른 현상들이 존재하지만, 근본적인 수단은 같습니다. 최대화하기거나 최소화하기죠.

짧게 말해서 기계학습은 결국 우리가 사는 공간을 이해하고자 하는 도형학, 그 공간의 가변성을 이해하는 통계학, 그리고 행복을 최대화하는 것 같은 목적 달성을 수치화하는 수학적 최적화가 상호 작용하는 복합 학문입니다. 이 학문들이 바로 기계학습과 인공지능을 관통하는 삼신기입니다. 기본 예들을 기억해 두세요. 기계학습을 공부하면서 만나게 되는 나머지를 이해하는데 도움이 될 겁니다.

이점 또한 기억해두시길 바랍니다. 바로 과학의 제일 뛰어난 통찰들은 생각보다 단순하다는 사실입니다. 뉴턴과 다윈은 물리와 생물학을 바꾸어 놓았습니다. 그러나 그들의 업적은 단순한 계산으로도 이해할 수 있죠. 기계학습은 이런 수준의 통찰이 필요합니다. 기계학습 분야는 다음 다윈이나 뉴턴을 찾고 있죠. 여러분이 기계학습 분야나 인공지능 분야를 바꾸기 위해선 기본적인 수학 지식만 알면 됩니다.

[Copyright ⓒ 블로그채널 무단전재 및 재배포 금지]

Comments