일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- LeetCode
- ANOVA
- 인공지능
- knn
- 컴퓨터
- AI Winter
- p-value
- 심층학습
- Bayes Theorem
- p 값
- 확률
- Neural Network
- Bayes Rule
- 통계
- AI
- 퍼셉트론
- 30 Day Challenge
- 컴퓨터 조립
- 딥러닝
- 편향
- 베이즈 정리
- Stack
- 분산분석
- 인공지능 겨울
- 인공신경망
- 조건부 확률
- Today
- Total
목록전체 글 (51)
군더더기 없는 기계학습 백과사전
가장 최신 언어 관련 모델로는 심층 학습, 대량의 나열된 영어, 그리고 대량의 명령 주기 실행에 기반하는 GPT-3이 있다. 이 모델은 현재 문장을 깔끔하게 정돈하고 문장 내의 오류와 어색함을 찾아내고 고치는데 굉장히 능숙하다. 따라서 출력된 문장은 인간이 쓴듯한 자연스러운 깔끔한 영어 회화처럼 생겼고, 가끔 논리적으로 말이 안 되는 문장이 나오긴 하지만 문장 그 자체만 보면 사람이 알아들을 수 있는 의미가 있긴 하다. 이 모델은 그러나 문장의 전달하고자 하는 의미 자체, 화자가 전하고자 하는 말, 그리고 청자의 배경지식을 (예를 들어 "그는 파티에 오지 않을 거야"의 의미는 분명하지만 의미 전달의 기반으로 쓰는 맥락은 분명하지 않다.) 반영하지는 못한다. 따라서 이 정도 수준에서 뭔가를 고치려면 순수 ..

XGBoost는 초보자들도 대략 100,000개 이하의 관측 개체들만 주어진 상황에서 쓸 수 있는 강력하고 연산과정이 최적화된 경사 부스팅 트리에 해당되는 기계학습 알고리즘 중 하나다. 해당 글은 Telco Churn (고객 이탈) 데이터를 이용한 간단한 XGBoost를 사용한 이탈 고객 예측 튜토리얼이다. 데이터셋 자체는 바로 IBM 사이트 자체에서 구하기는 힘드므로 구할 수 있는 Github 주소를 올리도록 하겠다. 물론 그저 해당 글을 본인의 데이터를 위한 참고용으로만 봐도 된다. 목차(Ctrl + F로 임시 이동) 필요 모듈 데이터 가져오기 및 간단한 데이터 가공 누락값 (missing data) 찾기 및 교체 혹은 제거 독립 변수와 의존 변수로 나누기 원핫 인코딩 XGBoost 모델 기본 틀 만..
항상 그랬듯이 리크루터가 제1 순위 정보 출처다. 당신의 리크루터가 채용 과정에 있어 핵심 요소이며 그들은 당신이 고용되도록 일하고 있다. 당신이 필요하다고 생각되는 어떤 질문이든지 물어보도록 하자. 또한 지금 소프트웨어 엔지니어 인터뷰를 (정확히 말하자면 프런트 엔드 인터뷰) 어떻게 통과해야 하는지에 대한 정보가 많이 널려있다. 2020년 기준으로 구글에 관련된 것들만 콕 집으면... 모든 코딩 질문은 문제 은행에서 나온다. 유출된 문제들은 전부 표기가 되어 다시 출제되지 않는다. 사실상 당신이 알고 있는 질문을 만나는 것은 불가능이라고 보면 된다. 따라서 Leetcode 같은 곳에서 문제 암기하는 것은 할수록 점점 줄어드는 보상을 볼 수 있을 것이다. "이런 문제는 이렇게 푸는 거구나"라고 생각되는 ..

※해당 설명에서 사용되는 로지스틱 회귀 분석은 이해를 돕기 위한 단순 예시이다. 해당 개념은 다른 기계학습 분류 알고리즘에도 적용할 수 있다. ROC(Receiver Operating Characteristics) 곡선 여러분에게 다음과 같은 쥐의 몸무게 데이터가 주어졌다고 하자. 푸른색 점들은 비만인 쥐들이고 붉은색 점들은 정상 몸무게 쥐들이다. 그럼 이 관측들을 이용해 로지스틱 회귀 곡선을 그리자. 그럼 y 축은 이제 0과 1 사이의 값으로 표현되는 관측 개체가 비만일 확률이다. 여기서 한 가지 문제가 생길 것이다. 비만일 확률은 아는데 쥐들을 비만으로 분류는 어떻게 할까? 한 가지 방법은 0.5이라는 임계값을 설정해 그 이상인 관측 개체들을 비만으로 분류하고 그 이하는 정상 몸무게로 분류하는 것이다..
밀란코비치 순환 궤도 변동 이론은 대략 100,000년을 주기로 지구에 찾아오는 간빙기와 빙하기를 지구의 자전축과 공전 궤도 변화로 인한 현상으로 본다. 해당 상관 관계에 대한 이론은 물리학자 리처드 뮬러(Richard A. Muller)가 실제 온도 데이터의 스펙트럼 분석을 통해 반증한 지 오래이지만 여전히 대중적으로 정설로 받아들여지고 있다. 해당 데이터와 분석은 다음 서적을 통해 읽어볼 수 있다. 이 서적은 기후 변화 분석에 사용되는 모든 변수들을 분야의 초보자들을 위해 친절하게 분석해놓기도 했다. https://www.amazon.com/Ice-Ages-Astronomical-Causes-mechanisms/dp/3540437797 Ice Ages and Astronomical Causes: Da..
해당 문서는 Gnosis Data Analysis 사의 CEO Ioannis Tsamardinos 교수의 인터뷰를 토대로 작성되었다. Gnosis Data Analysis 사는 현재 자동화 기계학습 어플리케이션인 JAD(Just Add Data)BIO를 내놓은 상태이다. AutoML이란? 자동화된 기계학습(Automated Machine Learning)의 줄임말로써 기계학습 파이프라인을 처음부터 끝까지 자동화시키고자 하는 움직임이다. 이를 실제로 구현한 한 형태는 데이터를 입력한 뒤 버튼 하나 누르는 것으로 결과를 얻고 끝나는 과정이다. 당신이 데이터에서 원하는 것이 무엇인지 말하면 시스템은 이를 어떻게 얻어낼 수 있는지 알고 있다. 통상적으로 사람들은 AutoML을 복합 알고리즘 선택 및 초매개변수 ..

해당 글은 LAMY 팬이 번역했습니다. 라미 2000의 소재 전편에서는 라미 사의 역사, 라미 디자인, 그리고 라미 2000의 탄생에 이바지한 디자인의 역사와 기풍에 대해 다뤄봤다. 그러나 산업 디자인을 이해하는 데 있어 디자인의 콘셉트와 용어들을 이해하는 것만으로는 부족하다. 바우하우스부터 울름으로 그리고 브라운으로부터 라미로 넘어오며 "형태는 기능을 따른다"와 "디자인의 간소화"라는 가치가 물건에 반영되긴 했으나 물건이 비롯되는 제작과 생산 과정도 이들만큼이나 중요하다. 라미는 고급 필기구 생산이라는 사업에 참여하고 있다. 그리고 이를 위해서 이익을 최대화하는 생산 방식을 사용한다. 아마 산업 디자인에서 미학, 기능성, 그리고 생산성 모두 고려하는 것으로 제일 유명한 기업은 애플일 것이다. (애플의 ..

해당 글은 LAMY 팬이 번역했습니다. 소개 라미 2000은 Fountain Pen Network 웹사이트에서 제일 많이 추천되는 펜 중 하나다. 이는 펜 자체가 흔하게 널려있어 상대적으로 저렴하기도 하며, 잉크를 흡입하고 방출할 수 있는 고성능 피스톤 메커니즘, 금닙, 그리고 세련된 디자인 감성을 동시에 담아내기도 했으며, 라미가 제품에 대해 뒤에서 강하게 보증을 서주기 때문이기도 하다. 그러나 많은 찬양에도 불구하고 라미 2000은 호불호가 많이 갈리는 펜이기도 하다. 변덕스러운 닙, 단순한 색상, 그리고 디자인의 세세한 점들까지 포함해서 비판을 받기도 한다. 이 글을 작성하는 동안만 해도 벌써 새 유저들이 라미 2000의 성능이나 관리 문제에 대한 스레드를 몇 개씩이나 열어놨다. 이는 무시할 수도 ..