반응형
Continuous Actions (연속적 행동)
행동 공간이 연속적인 값으로 표현된다. 예를 들어, 에이전트가 이동하는 방향이나 속도를 연속적으로 조절할 수 있다. 값이 연속적이기 때문에 행동 공간이 무한대에 가까운 범위를 가질 수 있다.
- 예시: 자동차의 스티어링 각도나 속도 조절, 캐릭터의 움직임에서의 x, y, z 축의 이동 등
Discrete Actions (이산적 행동)
유한한 행동 집합에서 선택하는 방식이다. 행동 공간이 특정한 선택지로 나뉘며, 각 선택지는 명확하게 구분된다.
- 예시: 왼쪽으로 이동, 오른쪽으로 이동, 점프하기, 앉기 등
차이점
- 연속행동은 무한에 가까운 범위의 값으로 행동을 표현하는 반면, 이산행동은 명확히 구분된 행동 선택지를 제공한다.
- 연속행동은 세밀한 제어가 필요한 상황에 적합하고, 이산행동은 명확한 행동 분류가 필요한 경우에 적합하다.
- 연속행동은 더 복잡한 제어가 가능하지만, 학습이 더 어려울 수 있다. 반면, 이산행동은 상대적으로 간단하다.
오늘의 회고
이거 진짜에요. 연속행동 학습하기 어려워요.. 학습 안돼서 이산행동으로 학습시키니깐 많이 학습이 잘되더라고요 ㅎㅎ 그래서.. 아직 저는 꼬꼬마 애기라고 느꼈습니다.. 공부가 더 필요해..
반응형
'Record > TIL' 카테고리의 다른 글
[Unity] 마우스 커서, 마우스 포인터 변경 (0) | 2024.08.06 |
---|---|
[Unity] 유니티 해상도 드롭박스로 조절하기 (0) | 2024.08.05 |
[Unity] ML-Agent 알고리즘 종류 (0) | 2024.08.01 |
[Unity] CPU와 GPU의 작동 방법 차이 (0) | 2024.07.31 |
[Unity] 스크롤뷰 Content 개수만큼 크기 늘리고싶다면? (0) | 2024.07.30 |