일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
31 |
- study book
- BAEKJOON
- PCA
- ARM
- Stream
- Dreamhack
- ML
- BOF
- Algorithm
- Got
- Image Processing
- rao
- 백준
- Flutter
- llm을 활용 단어장 앱 개발일지
- 파이토치 트랜스포머를 활용한 자연어 처리와 컴퓨터비전 심층학습
- system hacking
- MDP
- Widget
- fastapi를 사용한 파이썬 웹 개발
- Kaggle
- pytorch
- DART
- MATLAB
- Computer Architecture
- FastAPI
- 영상처리
- C++
- BFS
- bloc
- Today
- Total
목록Artificial Intelligence (53)
Bull

학교 캡스톤 디자인 중 OpenVoice를 쓰다가 아키텍처를 일반인도 보기 쉽게 바꿔보았다.. 논문은 자세히 안읽어서 알맞은 정보인지는 모른다. 아까워서 블로그에 저장
https://www.youtube.com/watch?v=zxQyTK8quyY StatQuest안녕하세요, 저는 조쉬 스타머(Josh Starmer)이고, 스탯퀘스트(StatQuest)에 오신 것을 환영합니다!오늘은 트랜스포머(Transformer) 신경망에 대해 이야기해 보겠습니다.이해하기 쉽게 설명할 거예요.트랜스포머는 클라우드에서 라이팅(Lightning)과 함께 직접 만들어보면 더 재밌습니다. 빰!요즘 사람들은 챗GPT(ChatGPT)에 엄청 열광하고 있습니다.예를 들어, 우리의 친구 스탯스쿼치(Statsquatch)가 챗GPT에다가 “스탯퀘스트 스타일로 멋진 노래를 써 줘” 같은 걸 입력해볼 수 있죠.“트랜슬레이션, 이건 트랜스포머로 한 거야!”아무튼 챗GPT가 어떻게 작동하는지 이야기할 게 ..
FID(Frechet Inception Distance)은 Generative Adversarial Networks(GAN) 같은 생성 모델에서 생성된 이미지의 품질과 다양성을 평가하는 지표.생성된 이미지와 실제 데이터 간의 분포 차이를 측정하여 얼마나 사실적인지를 평가1. FID의 핵심 개념FID는 두 개의 이미지 데이터 분포(실제 이미지와 생성된 이미지) 간의 Frechet Distance를 계산Inception 네트워크(사전 훈련된 Inception v3 모델)를 사용하여 이미지의 특징 벡터를 추출한 후, 특징 벡터의 평균과 공분산을 비교평균(mean): 각 특징 차원의 평균 값공분산(covariance): 각 특징 차원의 상관 관계를 나타내는 행렬2. 계산 과정$$FID = ||\mu_r - \m..

정규화는 예시로 설명하자면 0~255인 이미지 데이터를 0~1로 정규화하는 걸 말함. 활성화 함수에서 Internal Covariate Shift문제가 일어나지 않도록 기울기 안정성을 위해 진행. 쉽게 요약하자면,배치 정규화: 모든 샘플의 같은 채널끼리 (R끼리) 한 번에 정규화.모든 이미지의 채널만 모아서 기준을 만듬레이어 정규화: 각 샘플(이미지) 전체를 한 번에 정규화 (R, G, B 채널을 모두 포함).개별 이미지끼리 기준으로 만듬인스턴스 정규화: 각 샘플 내에서 채널별로 따로 정규화 (R, G, B 채널 각각 독립적으로).개별 이미지의 각 채널기준으로 각각 만듬그룹 정규화: 각 샘플의 채널을 그룹으로 나누어 그룹별로 정규화 (R과 G는 한 그룹, B는 다른 그룹 등).개별 이미지의 채널(R,G..



