'reward' 태그의 글 목록

Notice

Recent Posts

Recent Comments

Link

« 2025/10 »
일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

Tags more

Archives

Today

Total

관리 메뉴

목록reward (1)

Bull

[DL] 순전파의 bias와 MDP의 reward의 차이

궁금해진 이유 학부 공부중, 딥러닝과 강화학습을 동시에 배우고 있는데 수식중에 bias과 reward는 은닉층에서의 수식에 더하는 개념으로 등장하는데 생김새가 비슷해서 같은 개념인지 헷갈려서 정리한다. 순전파의 Bias(편향) 딥러닝에서 신경망의 각 뉴런은 입력 데이터에 가중치를 곱한 후, 이 결과에 bias를 더하여 최종 출력을 결정한다. Bias는 신경망이 입력 데이터가 없거나 입력에 대한 가중치의 합이 0일 때도 활성화될 수 있게 하는 역할을 한다. 이를 통해 모델의 유연성과 표현력이 향상된다. 순전파는 입력 데이터가 신경망을 통해 전달되어 출력까지 이르는 과정을 말하며, 이 과정에서의 bias는 데이터가 가진 기본적인 편향을 모델에 반영하는 역할을 한다. 강화학습의 MDP의 Reward(보상) 강..

Artificial Intelligence/Deep Learning 2024. 3. 6. 00:10

이전 Prev 1 Next 다음

목록reward (1)

Bull

티스토리툴바