일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- 머신러닝
- 감성분석
- Meena
- 임베딩
- Holdout
- ROC-AUC Curve
- QANet
- semantic network
- topic modeling
- word2vec
- GCP
- Enriching Word Vectors with Subword Information
- Min-Max 알고리즘
- hugging face
- sbert
- type-hint
- 사회연결망분석
- 구글클라우드플랫폼
- dynamic topic modeling
- degree centrality
- 허깅페이스
- word representation
- 의미연결망
- 분류모델평가
- sensibleness
- Google Cloud Platform
- 알파베타가지치기
- sequential data
- 동적토픽모델링
- 토픽모델링
- Today
- Total
목록전체 글 (54)
Dev.log
본 포스팅에서는 지도위에 데이터를 표시할수 있는 Python 라이브러리 Folium에 대해 진행해보도록 하겠습니다. Folium은 지리 공간 데이터를 시각화하는 데 사용되는 Python 라이브러리입니다. 또한 leaflet.js 기반으로 이루어졌으며, 시각화를 위해 OpenStreetMap, Mapbox, Stamen과 같은 지도 이미지들을 제공하기도 합니다. 자세한 내용은 아래 공식 도큐멘트에서 확인할 수 있습니다. Folium — Folium 0.12.1 documentation folium builds on the data wrangling strengths of the Python ecosystem and the mapping strengths of the leaflet.js library. Ma..
현재 구글, 아마존, 마이크로소프트등 현재 많은 클라우드 서비스 제공업체가 있습니다. 본 포스팅에서는 클라우드 서비스 중 구글 클라우드 플랫폼(Google Cloud Platform)에 대해 진행해 보도록 하겠습니다 클라우드 서비스 클라우드 서비스는 서버나 스토리지 같은 컴퓨팅 자원이 필요할때 이를 아마존이나 구글과 같은 벤더로 부터 빌려오고 이게 해당하는 비용을 지불하는 서비스입니다. 클라우드 서비스가 제공하기전, 기존 방식에서 서버를 운영한다면 서버를 직접구입해서 인터넷 데이터센터(IDC)에 입주시키는 형태로 사용해 왔습니다. 이런식의 운영방식은 서버가 IDC 내부에 설치되기 때문에 초기 비용 및 이를 세팅하기 위한 시간도 발생하게 됩니다. 또한 장애가 발생시, IDC에 방문해서 직접적으로 처리해야했..
본 포스팅에서는 Python 3.5 이후의 버전에서 standard 라이브러리로 추가된 typing 패키지 및 type annotation과 이를 검사하는 mypy 패키지에 대해 진행해 보도록 하겠습니다. Python의 변수는 동적 타입으로 하나의 변수에 여러 타입의 값을 할당할 수 있습니다. 즉, 변수에 값을 대입할 때, 굳이 타입을 선언해 줄 필요가 없습니다. 예를들어 Python에서 a = 1이라는 변수를 할당할때, a의 타입을 숫자형인 int 나 float으로 지정해 주지 않아도, python내에서 이를 숫자로 인식합니다. 하지만 이런 동적타입의 경우 코드의 길이가 길어지게되면 타입을 체크하는데 힘들어진다는 단점이 존재합니다. 이에 Python 3.5 버전 이후 부터 Type Annotation이..
본 포스팅에서는 Blei와 Lafferty에 의해 고안되었으며, 주제 표현이 고정된 시간 간격으로 진화할 수 있도록 순차적으로 문서 처리를 가능케 하는 LDA의 확장형 모델인 Dynamic topic modeling에 대해 포스팅을 진행해 보도록 하겠습니다. Dynamic topic modeling은 동적토픽모델링이라고도 불리며, 시계열에 의한 문서 집합에서 토픽의 진화를 분석하는데 사용 할 수 있는 생성 모델입니다. 기존의 LDA 의 경우 단어가 문서에 나타나는 순서와 문서가 코퍼스(corpus)에 나타나는 순서는 무시하는 반면, 동적토픽모델링에서는 문서는 시간별로 그룹화 되며, 각 문서는 이 전 그룹으로부터 진화된 토픽집합으로부터 온 것으로 가정됩니다. 또한 각 문서의 집합에서 관찰되지 않은 토픽이 ..