일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- dynamic topic modeling
- 임베딩
- 동적토픽모델링
- QANet
- sbert
- 알파베타가지치기
- Google Cloud Platform
- 허깅페이스
- 의미연결망
- word representation
- hugging face
- ROC-AUC Curve
- 분류모델평가
- Min-Max 알고리즘
- Enriching Word Vectors with Subword Information
- word2vec
- GCP
- 사회연결망분석
- Holdout
- type-hint
- sequential data
- 머신러닝
- semantic network
- sensibleness
- degree centrality
- Meena
- 토픽모델링
- 감성분석
- 구글클라우드플랫폼
- topic modeling
- Today
- Total
목록전체 글 (54)
Dev.log
모델을 설계를 하다보면 각 모델별로 필요한 파라미터(Parameter.매개변수)들이 존재합니다. 파라미터란 모델 내에서 결정되는 평균, 표준편차, 선형회귀 계수와 같은 변수들을 의미합니다. 이러한 변수들의 개념을 생각해본다면, 이들은 사용자가 지정하는 것이 아니라 데이터에 따라서 자동으로 결정되는 것임을 알 수 있습니다. 또한 이러한 파라미터가 어떻게 결정되는가에 따라 모델의 성능 및 동작이 크게 달라지기도 합니다. 하이퍼파라미터(hyperparameter)는 사용자가 임의로 예상하거나 목표하는 파라미터 값을 주로 의미하며, 신경망의 학습 (learning rate), 서포트 벡터 머신(SVM)의 C값, KNN에서의 K값 등이 이에 해당됩니다. 오버피팅(overfitting) 오버피팅(overfittin..
본 포스팅에서는 ROC-AUC curve에 대해 포스팅 해보도록 하겠습니다. 전 포스팅에서 말씀드렸다 싶이, confusion matrix는 분류문제를 학습한 모델을 평가할 때 사용되는 지표입니다. ROC curve 역시 다양한 threshold에서 분류모델의 성능을 측정 할때 주로 사용되는 방법중 하나입니다. ROC-AUC Curve ROC는 분류 모델의 성능을 보여주는 그래프가 될 수 있습니다. 또한, ROC curve는 모델의 효율성을 민감도(sensitivity)와 특이도(specificity)를 사용하며, ROC curve의 x축은 False Positive Rate(FPR, fall-out)으로 거짓을 참이라고 잘못 예측한 수치를 나타냅니다. 그리고 y축은 True Positive Rate(T..
모델에 대한 성능 평가를 위해서 일반적으로는 정확도(accuracy)라는 기준을 주로 사용하는데, 정확도만을 이용하여 모델을 평가하기에는 충분하지 않을 수 있습니다. 예를 들어 이번 코로나 감염에 대해 머신러닝을 통해서 분류한다고 가정해 봅시다. 코로나의 발병률은 일반적으로 극히 낮기에 ‘코로나에 걸리지 않았다’라고 학습하게 되면 모델의 예측 정확도가 거의 100%에 수렴할 수 있습니다. 하지만 이 모델에서는 코로나에 진짜 걸렸는지를 잘 판별하고 싶었던 것이지, 코로나에 안 걸렸다는 사실을 판별하고 싶었던 것은 아닐 것입니다. 이러한 상황을 불균형 데이터(skewed class)문제라고 합니다. Confusion matrix 정확도만으로는 모델의 성능평가가 힘든데, 이때 주로 confusion matri..
본 포스팅에서는 턴제 게임과 같은 곳에서 활용될 수 있는 MinMax알고리즘에 대해 포스팅 해 보겠습니다. Min-Max 알고리즘는 최대 최소전략을 사용하여 턴제 게임(체스, 오목, 바둑)등과 같은 프로그램에서 의사결정에 주로 사용되는 알고리즘입니다. 여기서 최대 최소 전략이란, 어떠한 계획의 성공을 통한 효과를 고려하는것보다 실패했을 떄의 손실을 고려해서 그 손실이 최소가 되도록 계획을 세우는 전략입니다. MinMax 알고리즘은, 최대 최소 전략의 원리에 따라 실패했을 때 어떻게 될지를 생각하여 그 손실이 최소가 되도록 합니다. 예를들어 Tic-tac-toe와 같은 게임에서는 다음 수를 예측하기 위해서는 수읽기를 통해 가장 승률이 높은 수를 선택해야 합니다. A와 B가 게임을 한다고 가정해보면, A에게..