Archive
For the creature of oblivion
-
Tree-based enesemble
이 글은 고려대학교 강필성 교수님의 2018년 2학기 비즈니스 어낼리틱스 강의 내용을 바탕으로 작성되었습니다. Random Forests Intro 랜덤 포레스트는 트리들의 상관성을 제거하는(decorrlate) 단순한 방법으로 배깅 트리보다 더 좋은 성능을 보여준다. 트리들의 상관성을 제거하는 이유는 모델의 다양성을 증가시키기 위함이다. 랜덤 포레스트에서는 모델의 다양성(diversity)을 증가시키기 위해 두 가지 방법을 사용한다. 하나는 배깅이고, 다른...
-
Delta Method
Delta Method는 중심극한정리(Central Limit Theorem)를 일반화한 개념이라고 할 수 있다. 중심극한정리에서는 normal distribution을 극한분포로 갖는 표준화된 확률변수를 다룬다. 하지만 때로는 확률변수 자체의 분포보다는 확률변수의 함수의 분포에 관심이 있을 수 있다. 이때 유용하게 사용될 수 있는 것이 Delta Method이다. Talyor Seires Expansion Delta Method는 Talyor Seires Expansion을 통해 유도 된다. 가...
-
Convergence concepts
infinite sample size라는 개념이 이론적으로만 존재하는 것이기는 하지만, finite sample case에 대한 유용한 approximation을 제공해준다. 이는 limit 개념을 활용할 때 expression이 단순해지는 경우가 많기 때문이다. Convergence in Probability Weaker type 중 하나이기 때문에 확인하기 쉽다. Definition 모든 에 대하여 다음이 성립하면 의 random variable들의 sequence가 random variable 로 converges in...
-
Ridge Regression
Intro 원래 Ridge regression은 shrinkage method로써 만들어지지 않았다고 한다. 처음에는 linear regression에서 발생하는 multicollinearity(다중공선성: 독립변수들 간의 강한 상관관계) 문제를 해결하기 위한 방법으로써 고안되었다. 독립변수 x들의 correlation이 크면 가 불안정하게 된다. 여기서 불안정하다는 말의 의미는 X가 조금만 바뀌어도 가 많이 바뀐다는 것이다. 결과적으로 이러한 계산의 불안정성 때문에 OLS(Ordinary Least Square) 추정값이...
-
Image-to-Image Translation with Conditional Adversarial Networks
Image-to-Image Translation with Conditional Adversarial Networks Abstract 이 논문에서는 image to image translation 문제에 대한 general purpose solution으로 conditional adversarial networks을 사용했다. 여기서 general purpose solution이라고 한 이유는 cGAN이 input image에서 output image로의 mapping을 학습할 뿐만 아니라 이 mapping을 훈련시키는데 필요한 loss function도 학습하기 때문이다. 기존의 모델에서는 문제의 기본적인 setting이...