데이터사이언스 6

[논문리뷰] AnoGAN을 위한 GAN(Generative Adversarial Networks) 리뷰

✨GAN? (Generative Adversarial Networks) https://proceedings.neurips.cc/paper/2014/file/5ca3e9b122f61f8f06494c97b1afccf3-Paper.pdf 두 모델의 ‘경쟁’을 활용하여 진짜같은 데이터를 만들어내는 모델. Generator과 Discriminator로 구성 G와 D😶 GAN은 서로 다른 모델 G와 D가 각각 학습함. G는 random한 latent variable에서 출발해 실제 이미지와 비슷한 그럴싸한 가짜 이미지를 만들어 내는 것이 목표. D는 이미지 데이터가 input으로 들어왔을 때 그것이 진짜 이미지인지 가짜인지 제대로 구분하는 것이 목표. 같은 목적함수를 사용하나, 두 모델의 목표가 다른 것을 확인할 ..

Optimization: Random Search부터 Gradient Descent까지

Optimization이란?😶 optimization은, 말 그대로 모델의 파라미터를 '최적화'하는 것이다. cost function이 최소가 되도록 하는 파라미터가 무엇인지, 그것을 찾는 것이 optimization이라고 이해하면 되겠다. Randon Search부터 Gradient Descent까지😶 파라미터 업데이트를 위한 여러 방법들이 있다. Naive한 것부터 차례로 살펴보자. ✔️시도1: Random Search 말 그대로 랜덤한 조합의 파라미터를 모델에 넣어 성능을 비교하는 것이다. 시간이 아주 오래 걸릴 수 있다.. 사실 무식한 방법. 파라미터 튜닝에 loss function을 사용하지 않는다는 것도 한계다. 기껏 열심히 loss function 계산해놓고 사용하지 않는다... ✔️시도2:..

[머신러닝] SVM으로 Binary Classification 다지기

SVM (Support Vector Machine)이란😶 SVM도 이전에 정리했던 Logistic Regression처럼 이진분류모델이다. SVM 작동원리를 차근차근 살펴보자. ✔️최적의 Hyperplane을 찾자 = SVM! 데이터가 주어졌을 때, Hyperplane을 그어 이를 두가지로 나누는 방법에는 여러가지가 있다. 그림처럼, 같은 데이터를 분류한다고 하더라도 서로 다른 파라미터 조합으로 만든 여러개의 Hyperplane이 존재할 수 있다. 수많은 Hyperplane 중에서 가장 최적의 것을 찾는 것이 문제다. SVM은 이 '최적'의 모델을 '데이터와 Hyperplane 간의 Margin이 최대가 되는 Hyperplane' 이라고 보는 것이 핵심이다. 그림으로 좀 더 명확히 살펴보자. Hyperp..

[머신러닝] Logistic Regression으로 Binary Classification 감 잡기

Logistic Regression은 대표적인 Binary Classifier 중 하나다. (이름은 Regression인데 분류모델이다.) Parametric Model 접근법😶 이전에 포스팅했던 모델은 Non-Parametric Model인 K-NN이었다. 여기서 포스팅할 Logistic Regression은 Parametric Model이다. Logistic Regression이전에, Parametric Model을 다룰 때 어떻게 접근하는지 살펴보자. Parametric Model과 Non-Parametric Model의 차이는 아래 링크를 타고 들어가 확인할 수 있다. 2022.08.12 - [Data Science/ML | DL] - 까먹지 않아야 할 머신러닝의 아주 기본 까먹지 않아야 할 머신..

까먹지 않아야 할 머신러닝의 아주 기본

머신러닝(Machine Learning)이란😶 새로운 데이터를 잘 맞추는 모델을 데이터로부터 구축하고 학습시키는 것이다. Data-Driven Approach, Supervised Learning이라고도 불린다. (정답이 있는 데이터를 학습시키는 것!) 정확하게 예측하는 것 + Generalization(기존 데이터가 아니라, 지금껏 보지 못한 새로운 데이터에 대한 예측) 모두를 고려한 모델을 구축하는 것에 초점을 맞춘 정의로 이해하자. 'Learning from Data to Achieve Model with Good Generalization.' Mathematical Formula😶 아래는 ML과 관련한 기본적인 용어들이다. ✔️input: x ✔️output: y ✔️target function:..

벡터(Vector)

벡터의 의미 일반적인 의미 벡터는 크기와 방향을 갖는다. 크기(magnitude) + 방향(orientation, direction) *scalar(상수)는 magnitude만 있다. 선형대수에서의 의미 여러 개의 스칼라를 나열해 놓은 것으로 받아들일 수 있다. $$vector x = [x1, x2, x3,,,, xn]$$ $$(x ∈ R^n)$$ x1, x2, x3 등을 벡터의 element 또는 component라 하며, n개의 element로 이루어진 위와 같은 벡터를 통상적으로 실수집합으로 이루어진 n - dimensional(차원) vector 라고 부른다. 벡터의 표기 일반적으로 벡터는 아래와 같이 Column Vector Notation으로 표기한다. *Row Vector Notation은 ..

수학/선형대수 2021.09.14