일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
- study book
- bloc
- Kaggle
- Algorithm
- ML
- DART
- BAEKJOON
- Flutter
- fastapi를 사용한 파이썬 웹 개발
- Dreamhack
- system hacking
- 영상처리
- Got
- 백준
- pytorch
- rao
- 파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터비전 심층학습
- Image Processing
- llm을 활용 단어장 앱 개발일지
- Computer Architecture
- FastAPI
- C++
- MDP
- ARM
- MATLAB
- Stream
- Widget
- PCA
- BOF
- BFS
- Today
- Total
목록word2vec (2)
Bull

Word2Vec 모델Word2Vec는 자연어 처리에서 단어를 벡터로 표현하기 도구입니다. 벡터를 처음 마주한다면 어떤 뜻인지 궁금할 수 있을텐데요. 쉽게 생각하면 배열을 상상하면 됩니다. 벡터의 본래 개념은 방향과 크기를 가진 물리량입니다. 만약 2차원 좌표공간에서 우리는 1,2를 x=1, y=2이라는 좌표를 떠올릴 수 있습니다. 이를 2차원이 아닌 n차원에서 벡터를 표현하게 된다면 [X1, X2, X3, ..., Xn]으로 벡터 물리량을 표현할 수 있습니다. 우리는 단어 혹은 말뭉치(코퍼스)를 n개 라 할 때 단어를 차원으로 표현할 것입니다. 예를 들어, "fat cat on the mat"인 단어는 5차원 벡터로 ["fat", "cat", "on", the", "mat"]로 표현할 수 있겠네요. 즉,..

[Gensim의 공식문서]https://radimrehurek.com/gensim/intro.html Gensim: topic modelling for humansEfficient topic modelling in Pythonradimrehurek.comGensimGensim은 무료 오픈소스 파이썬 라이브러리로, 비정형 디지털 텍스트를 비지도 머신 러닝 알고리즘을 사용하여 효율적으로 처리하는 데 중점을 둡니다. Gensim을 사용하면 문서를 의미 벡터로 표현하여 강력한 텍스트 분석 및 자연어 처리 작업을 수행할 수 있습니다.Gensim의 역사와 발전Gensim은 2008년 체코 디지털 수학 도서관(dml.cz) 프로젝트를 위한 파이썬 스크립트 모음으로 시작되었습니다. 이 스크립트는 주어진 기사와 가장 유..