Artificial Intelligence/연구 매뉴얼

AI 연구를 시작하는 방법 (대학원생용) - MIT

Jay김 2020. 7. 15. 01:02

[작성중]

해당 글은 MIT AI 분야 대학원생들이 신입생들 및 AI 연구를 시작하고자 하는 다른 기관의 외부인이 참고하라고 만든 가이드에서 현재 시점에서 유용한 정보들을 모아서 요약한 글입니다. 원글은 다음 링크에서 읽어보실 수 있습니다. 저자들은 내용을 전부 읽을 필요는 없다고 안내하며 쓸만한 내용들을 훑어보길 권장합니다. 독자들은 후반부 내용이 장기적으로 더 흥미롭고 유용한 내용이었다고 합니다.

https://dspace.mit.edu/bitstream/handle/1721.1/41487/AI_WP_316.pdf?sequence=4&isAllowed=y

AI 논문 읽기

대부분의 연구자들은 본인의 시간 절반 이상을 읽는 데 사용한다. 여러분은 여러분 스스로 하는 것보다 남들의 작업에서 더 빠르게 지식을 얻을 수 있다. 

더보기

읽기 적합한 시간은 지금 당장이다. 여러분의 논문에 진지하게 몰두하기 시작하면 시간도 부족해지고 읽는 분야도 여러분의 주제와 관련된 분야에 한정될 것이다. 처음 2년 동안은 보통 강의 관련 과제나 AI 분야 전반에 걸친 내용을 따라잡는 데 사용될 것이다. 이를 위해선 교과서나 출판된 저널 논문으로도 충분하다 (나중에는 초안(draft)만 주로 읽게 될 수도 있다.) 

처음에 AI 분야에서 탄탄한 기반을 세우기 위해서 읽어야 하는 글의 양을 보고 겁을 먹게 될 수도 있다. 그러나 AI는 아직 작은 분야이기 때문에 몇 년 안에 제일 중요한 논문들 대부분을 읽을 수 있을 것이다. 제일 힘든 부분은 무엇을 읽어야 할지 알아내는 것이다. 이를 위해선 몇 가지 유용한 서지(bibliography)가 써져있는 문서들이 존재한다.

  • 대학원 수준 수업의 수업계획서
  • 다른 대학의 퀄 시험 추천 읽기 목록 (예시)

특정 세부 분야에 관심이 있다면 해당 분야 대학원 선배에게 해당 분야에서 가장한 중요한 논문 10개를 추려달라고 하자.

랩실 내부에서 출판하는 연구지, technical report 등이 존재한다면 찾아서 지난 몇 년간 나온 것들을 훑어보고 제일 흥미로운 것 몇 개를 골라서 읽어보도록 하자. 보통 중요한 작업들이 대부분이며 랩실에서 지금 무엇을 하고 있는지 파악하는 것도 중요하다.

수많은 AI 학회지가 존재하지만 읽어 볼만한 가치가 있는 것들을 몇 가지밖에 없다.[각주:1]

논문 읽기는 연습이 많이 필요한 기술이다. 여러분에게는 여러분에게 오는 모든 논문을 끝까지 읽을 수 있는 시간이 없다. 보통 논문 한 개를 읽는 것은 다음 세 단계를 거친다.

  1. 흥미로운 내용이 들어있는가? 논문에는 항상 초록(abstract)이 있다. 원래 초록에서 논문에 뭐가 들어있는지 요약을 해줘야 하지만 그렇지 않은 경우도 많이 존재한다. 따라서 저자가 무엇을 했는지 파악하려면 논문을 이리저리 훑어봐야 한다. 목차(table of contents)나 서문(introduction)도 좋은 시작점이다. 그마저도 안된다면 논문 전체를 훑어봐야 한다. 논문이 무엇에 관한 논문인지 그리고 저자가 기여한 점이 무엇인지 파악했다면 두 번째 단계로 넘어갈지 판단하자.
  2. 논문에서 핵심 내용이 담겨 있는 부분들을 파악하자. 대부분의 15 페이지 논문들은 한 페이지 논문으로 다시 써낼 수 있다. 제일 짜릿한 내용이 담겨있는 페이지를 여러분은 찾아내야만 한다. 이는 보통 예상치 못한 곳에 숨겨져 있다. 여러분이 흥미롭다고 여기는 부분은 저자가 흥미롭다고 여기는 부분과 다를 수도 있다.
  3. 다시 처음으로 돌아가서 논문 전체를 읽어본다.

항상 몇 가지 질문을 염두에 두면서 논문을 읽자.

  • "내가 이것을 어떻게 사용할 수 있을까?"
  • "해당 논문이 정말로 저자가 담고 있다고 주장하는 내용을 담고 있는가?"
  • "만약... 이러쿵저러쿵?"

어떠한 연구 결과가 논문에서 제시되었는지 파악하는 것은 논문 자체를 이해하는 것과는 다르다. 후자는 대부분 저자의 연구 동기, 저자의 선택들, 논문에서 세우는 가정(assumption)과 형식화가 현실적인가, 논문이 제시하는 연구 방향, 저자가 연구에서 계속 마주하는 어려움의 패턴, 논문이 만드는 정치적인 논점 등을 파악하는 데 있다.

보통 논문을 읽으면서 프로그래밍을 병행해보는 것은 권장된다. 한 분야에 관심이 생겨서 논문을 읽어보면서 배운 것들을 직접 간단하게 구현해보는 것은 곧 깊은 이해도로 이어진다. 

불행하게도 대부분의 랩은 폐쇄적이고, 연구실 멤버들은 보통 내부에서 출판된 연구 결과만 검토해본다. 다른 기관들은 문제에 대해 접근하는 방식이 다르며, 여러분이 이런 접근들의 문제점이 뭔지 알아도 이들은 읽어볼 만한 가치가 있다. 

보통 지인이 여러분에게 여태껏 출판된 것 중에 제일 뛰어나거나 여러분의 연구에 쓸만하다고 하면서 논문이나 책을 건네줄 것이다. 그리고 그걸 직접 읽어보면 뛰어나거나 정말로 여러분이 쓸만한 것은 딱히 없다는 것을 알게 되는 경우가 태반이다. 이런 경우 여러분은 본인이 뭔가 빼먹고 있거나 잘못 생각하고 있는 것은 아닐까 의심할 수도 있다. 그러나 진실은 보통 해당 논문이나 책을 읽으면서 해당 지인들이 여러분의 머릿 속에 이미 만들어진지 오래인 아이디어를 생각해내면서 여러분의 연구에 도움이 될만한 것들을 우연히 생각해냈을 경우가 많다는 것이다.

자신의 분야와 익숙해지기

대략 2년 정도 지나면 자신이 연구하고자 하는 세부 분야에 대해서 대략적으로 알게 될 것이다. 여기까지 왔다면 이제 자신의 분야의 따끈따끈한 최신 연구 정보를 빠르게 접하는 방법을 배워야한다.

더보기

학회지에 새로운 아이디어가 실리고 출판될 때까지 기다리는 것은 너무나 늦다! 그쯤되면 해당 분야의 왠만한 'Cool'한 스타 연구자들은 이미 해당 아이디어를 접해봤을 시점이다. 대신 다음과 같은 방법을 추천한다.

  • 본인의 관심 분야에 관한 정보를 주는 이메일 리스트를 구독 신청한다.
  • 보통 여러분의 관심 분야에 대해 아는 사람이랑 대화를 할 때 그들은 여러분의 아이디어에 대한 평가를 내리지 않을 것이다. 대신 "이거 읽어봤어?" 하면서 관련있는 문서를 추천해줄 것이다. 만약 읽어보지 않았다면 완전한 레퍼런스를 달라고 부탁하자.
  • 여러분을 들뜨게 하는 논문을 접하면 대략 5개의 복사본을 만들어 관심이 있을만한 사람들에게 배부해주자. 그들도 똑같이 해줄 것이다. 
  • 랩에서 매주 정기적으로 여는 다양한 세부 분야의 논문에 관해 토론을 하는 모임이 있다면 참가하라.
  • 몇몇 사람들은 본인의 책상에 놓인 것들을 여러분이 읽는 것에 크게 연연하지 않는다. 보통 그들의 책상에는 그들이 곧 읽을 논문들이 쌓여있고 이는 주기적으로 바뀔 것이다. 그중 흥미있는 것이 있다면 찾아서 읽어보도록 하자. 물론 일단 허락은 받고 시도하도록 하자.
  • 마찬가지로 이유로 다른 사람의 서랍장에 열람해볼만한 것들이 있다면 거기서 찾아봐도 된다. 보통 이런 서랍장들은 넓은 범위에 걸친 문서들이 들어있으며 여기서 문서들을 열람해보는 것은 학교 도서관에서 정보를 찾는 것보다 확실하고 빠를수도 있다.
  • 만약 본인이 뭔가를 작성했다면 그 초안을 다른 사람들에게 돌려보도록 하자. (인공지능 분야에서 표절 행위가 흔한 것은 아니지만 일어나기도 하니 주의하자. 신경쓰인다면 문서 첫 페이지에 꼭 복사금지 및 인용금지 요청을 써놓도록 하자.) 대부분의 사람들이 그 초안을 읽지 않을수도 있으니 겨우 몇 사람에게서만 코멘트가 돌아온다면 너무 낙담하지는 말자.
  • 논문을 다 썻다면 관심을 가질만한 사람들에게 복사본을 돌려보자. 사람들이 저널이나 프로시딩 과정에서 자발적으로 여러분의 논문을 읽어볼 것이라고 가정하지 말자. 내부 메모나 테크니컬 리포트는 특히나 더 안 읽는다.
  • 다양한 사람들과 인맥을 쌓을수록 좋다. 다른 AI 연구 그룹사이의 연결점이 되어보도록 하자. 여러분의 책상에 흥미로운 논문들이 쌓여있을 것이다.
  • 만약 논문이 뭔가 흥미로운 것을 레퍼런스하고 있다면 적어놓도록 하자. 항상 흥미로운 주제를 좇고 있을 때 레퍼런스 사이의 관계도를 작성해놓도록 하자. 나중에 합쳐서 보면 서로 접점이 없는 다른 대학의 두 그룹이 같은 주제에 대해 연구하는 것을 볼 수도 있고 아예 생각지도 못한 분야에 대해 배우고 있는 본인을 찾을 수도 있다. 보통 다양한 문제 접근법에 대해 알고 있는 것이 한가지 접근법에 대해 깊이 이해하는 것보다 유용하다.
  • 사람들과 어울리자. 너무나 수준 낮은 본인의 작업이 부끄러워도 본인이 뭐하고 있는지 이야기하면 보통 다음으로 해야될 작업에 대한 대화로 이어진다.
  • 학회같은 곳에서 외부인들과 자주 어울린다면 비즈니스 카드를 만들어놓자. 당신의 이름을 기억할 수 있도록 도와줄 것이다. 
  • 여러분이 학회를 나가기 시작하면 보통 학회에 나오는 논문들이 지루하거나 바보같은 것들이 대부분임을 깨닫게 될 것이다. 그럼 학회를 왜 나가는가? 네트워킹이 그 이유다. 학회에서 외부인들은 여러분의 연구에 대해 소문을 퍼트리거나, 새로운 사람을 소개시켜주거나, 여름 직장을 찾아줄수도 있다. 여러분이 흥미롭게 읽었던 논문의 저자에게 다가가서 대화를 시도해보도록 하자.
  • 여름동안 다른 연구실에서 직장을 구해보도록 하자. 이는 인맥을 쌓는 것은 물론 완전히 다른 학파에 속해있는 사람들과 그들의 이질적인 아이디어와 접촉할 수 있는 기회다. 보통 이는 연구실의 선배에게서 다른 랩에서 어떻게 일할 수 있는지 물어보면 된다.

 

 

 

  1. 해당 대학원에서 최신 정보 열람 바람 [본문으로]