일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- Neural Network
- 분산분석
- 심층학습
- 인공신경망
- 컴퓨터
- p-value
- 퍼셉트론
- 인공지능 겨울
- 컴퓨터 조립
- 통계
- AI
- Bayes Theorem
- 딥러닝
- 편향
- LeetCode
- 인공지능
- p 값
- AI Winter
- 조건부 확률
- 30 Day Challenge
- ANOVA
- knn
- 확률
- Bayes Rule
- Stack
- 베이즈 정리
- Today
- Total
목록전체 글 (51)
군더더기 없는 기계학습 백과사전

'천문학은 대학에서 가르치는데 왜 점성술은 안 가르치는가'라는 뜬금없는 의문이 든 적이 있는가? 답은 간단하다. 전혀 과학적이 않은 것을, 아니 유사과학을 별개의 학문으로서 가르칠 이유가 없기 때문이다. 그런데 그 내막을 아는 사람은 별로 없을 것이다. 해당 이미지는 네이쳐지 318호 페이지 419부터 425에 실린 1985년도에 발행된 논문이다. 논문의 제목은 '이중맹검법으로 시험해본 점성술'이다. 물리학자 리처드 뮬러(Richard Muller) 교수를 지도 교수로 두고 있었던 션 칼슨(Sean Carlson)이라는 대학원생에 의해서 아주 체계적이고 조심스럽게 진행된 이 실험은 미국 점성술의 사람의 생년월일시로 사람의 성격을 파악할 수 있다는 핵심 주장을 도마에 올렸다. 해당 실험은 자신들의 '학문'..

우리에게 다음과 같은 정보 집합(dataset)이 주어졌다고 해보자. 우리는 혈압, 혈중 콜레스테롤 수치, 혈당 같은 변수들과 기계학습 알고리즘을 이용해 환자가 심장질환이 있을 확률을 예측하고자 한다. 이를 위한 기계학습 알고리즘으로는 로지스틱 회귀분석, K 최근접 이웃, 랜덤 포레스트 같은 다양한 알고리즘을 선택할 수 있는 선택지가 있다. 그러나 이 중 제일 적절한 알고리즘을 어떻게 고를 수 있을까? 우리는 일단 데이터를 훈련 데이터와 시험 데이터로 나누어 훈련 데이터로 기계학습 모델을 훈련시킨 뒤 시험 데이터로 그 성능을 평가할 것이다. 평가를 위해 동원되는 방법 중 하나는 혼동행렬을 만들어보는 것이다. 일단 여기서 행은 알고리즘이 예측하는 클래스(class), 열은 관측의 실제 클래스라고 하자. 이..

만약 우리에게 다음과 같은 정보 집합(dataset)이 주어졌다고 해보자. 우리는 주어진 데이터를 이용해 혈압, 혈중 콜레스테롤 수치, 혈당 같은 변수를 이용해 환자 중 누군가가 심장질환을 가지고 있는지 예상하고자 할 것이며 이를 위해서 모델을 만들 것이다. 그 뒤 데이터에 없었던 새로운 환자가 나타나면 같은 변수들의 수치를 모델에 넣어 그 환자가 심장질환을 가지고 있는지 예상하고자 할 것이다. 그렇다면 이때 어떤 기계학습 알고리즘을 이용해야하는지 결정을 내릴 수 있는 방법은 무엇일까? 우리에게 주어진 선택지는 다양하다. 로지스틱 회귀분석 일수도 있고, K 최근접 이웃일수도 있고, SVM 아니면 그 외 다양한 기계학습 알고리즘이 존재한다. 교차검증은 이 다양한 알고리즘들의 성능을 비교하고 실전에서 실제 ..

일단 $u$축과 $v$축을 그린다. 그리고 임의의 곡선을 그려준다. 여기서 $u$는 $x$에 대한 함수 $f(x)$, 그리고 $v$는 $x$에 대한 함수 $g(x)$의 치환이다. 이제 곡선 아래 면적은 적분으로 구한다는 사실을 알고 있다면 각 면적은 각 축에 대하여 다음과 같이 구해진다는 사실을 알 수 있을 것이다. $$\mathit{Area} \, ▨ = \int^q_p v \, du$$ $$\mathit{Area} \, ▧ = \int^s_r u \, dv$$ 여기서 살짝 헷갈린다면 평소에 적분을 어떻게 하는지 떠올려보자. $y$축과 $x$축이 있고 $x$축의 $[a,b]$구간에 있는 곡선 $y = f(x)$ 아래의 면적은 $\int_a^b f(x) \, dx = \int_a^b y \, dx$로 구..

해당 문제는 1982년도 5월 SAT 시험에 출제된 30만 명의 미국인이 풀고 단 3명만 선택지가 없음을 증명해 맞춘 문제다. 물론 해당 문제를 낸 출제자 본인도 틀렸다. 해당 문제에선 반지름이 원 B의 3배인 원 A가 원 B를 주위를 회전하는 동안 자체적으로 회전하는 횟수를 구해야 한다. 통상적인 SAT 수학 문제를 풀어보던 여러분이라면 본능적으로 둘레가 2πr이라는 점을 이용해 B의 반지름이 A의 3배이기 때문에 바로 (b)를 선택했을 것이라고 생각한다. 그러나 (b)는 옳은 답이 아니다. 동전 자체가 회전하는 횟수는 별개의 문제이기 때문이다. 간단한 실험으로 둘레들의 비율은 다른 원 주위를 회전하는 동안 그 주위를 회전하는 원 자체가 회전하는 횟수를 나타내지 않는다는 사실을 알아낼 수 있다. 100..

항상 경제적인 위기가 찾아오면 금의 가치는 수요에 따라 오르기 마련이다. 그러나 실용적인 면에서 봤을 땐 전자기기 부품으로써 말고는 딱히 가치가 없어 보이는 금은 애초에 왜 화폐로써 사용되어 왔었던 것일까? 이에 대해 여러 가지 설명이 존재하지만 일단 화학적인 성질로 봤을 때 금은 적절한 화폐로써의 가치가 드러난다. 일단 주기율표를 꺼내서 보도록 하자. 주기율표 오른쪽부터 시작해볼까? 일단 할로젠 원소와 비활성 기체를 포함한 기체들은 긴 설명이 필요 없을 것이다. 무슨 바이알에 들고 다니기도 힘들고 색깔도 없으니 뭐가 뭔지 알 수 있나. 액체인 수은과 브로민 역시 들고 다니기 힘들뿐더러 이들은 인체에 독성이 있어 화폐로 쓰기엔 너무 치명적이다. 비슷한 이유로 비소와 같은 몇몇 원소들 역시 부적합하다. 이..

옛날부터 사람들은 물체가 땅으로 떨어짐을 관장하는 중력의 개념을 이해하고자 노력해왔다. 물체는 왜 땅으로 떨어지는가? 기록이 남아있는 가장 이른 체계적인 철학적인 접근 중 하나는 아리스토텔레스에 의해서 시도되었다. 아리스토텔레스는 모든 물체는 자연적으로 제일 친화적인 장소가 존재하며 지구에 존재하는 물체들은 지구라는 장소에 가장 친화적이고 무거운 물체에는 이것이 더욱 강하게 작용하기 때문에 더욱 빠르게 지구로 떨어진다고 주장했다. 이와 달리 갈릴레오 갈릴레이에게 '왜'는 비교적으로 중요한 문제가 아니었다. 그는 오히려 '어떻게'라는 원리에 대한 궁금증이 더 컸으며, 인생 전반에 걸쳐 갈릴레오는 우주의 언어인 수학을 이해함으로써 비로소 각종 과학 현상의 원리를 이해할 수 있다고 생각했다. 이런 철학에 의해..

최근 코닥사가 코로나 19 범유행 사태와 관련해 미국 정부에게서 항말라리아제 하이드록시클로로퀸 생산 계약을 따냈다. 사실 카메라 필름 하면 생각나는 기업에게 전혀 뜬금없는 전환은 아니다. 코닥은 애초에 사진 필름 대량 생산이 주력 사업이기도 했으며, 이는 정밀한 화학 공정이 필요한 작업이었다. 이는 코닥에 의약품 생산에 적합한 대량 정밀 화학 생산 공정, 외부 물질을 최대한 제거한 클린룸, 그리고 엄격한 품질 관리라는 생산 기반이 이미 갖춰져 있음을 의미하기도 한다. 사실 후지필름사도 이미 의약품을 만들고 있다. 차이점이라면 후지필름사는 Diosynth사를 인수한 뒤 의약품을 생산하기 시작했다는 것이다. https://www.kodak.com/en/advanced-materials/page/special..