반응형
- [ 인공지능/강화학습 ]Policy Iteration2024-03-31 08:23:56벌써 오늘이 마지막 날이다 어제 조대협님의 대항로도 끝을 맺었고... 다시 리프레시할겸 계획을 세워야 겠다 구글 스터디잼 + AWS 자격증 + 사이드 프로젝트 + 독서 + 운동 +...ㅎ 나는 계속 매일 블로그를 올려볼 생각이다. 원래는 패스트캠퍼스 강의 남은걸로 진행할까 했는데 구글 스터디잼도 괜찮을 것 같다. 여튼 뭐가 됐든ㅎ 이전에는 벨류를 구하는 방법을 찾았으니, 이번에는 최적의 폴리시를 구하는 방법을 알아보자 이전과 같은 작은 MDP 문제를 사용해보자 작은 문제 작다는 것은 다음의 가짓수가 작은 것을 의미함 A c t io n s p a c e S t a t e s p a c e T im e h o r iz o n M D P 를 알 때 𝑀𝐷𝑃 ≡ {𝑆, 𝐴, 𝑅, 𝑃, 𝛾} 𝑅, 𝑃 를 알 때 ..
- [ 인공지능/강화학습 ]MDP를 알 때의 플래닝2024-03-30 12:06:41마음을 다시 굳게 먹자 해이해졌어 김재형 계획을 다시 세우자 그리고 매일 상상하자 구체화시키고 실현시키자 겁먹지 말자 무엇을 하든 지금보단 나을테니까... 나는 지금 단거리가 아닌 마라톤을 해야 한다. 그러니까 지속적으로 할 수 있는 원동력이 필요하다. 사소한 것에서 성취감을 찾으려고 노력하자. 무뎌지지 말자. 포기하지말자 지금의 난 아무것도 아니지만 5년 후의 나는 어떻게 되어있을까? 기대되지 않는가? 술취한 사람의 귀가 문제 각 스테이트의 밸류는 무엇일까? 이 문제에서 우리는 MDP를 알고 있다 𝑀𝐷𝑃 ≡ {𝑆, 𝐴, 𝑅, 𝑃, 𝛾} 𝑅, 𝑃 를 알 때 여기서 안 다는 것은 해보기도 전에 미리 아는 것 그리고 이 문제는 MDP가 작은 문제라고 볼 수 있다 작다고 하는 것은 다음의 가짓수가 작은 것을 ..
- [ 인공지능/강화학습 ]강화 학습 - 지도학습과 강화학습, 순차적 의사결정, 리워드2024-03-24 06:53:18이제 실습 위주는 끝났고 강화학습 이론 강의로 들어간다 면접 준비도 미리 하고 학업 계획서도 미리 작성하자 1. 지도 학습 vs 강화 학습 우리가 어릴 때 자전거를 배우는 모습을 상상해보자 누군가는 부모님 또는 이웃이 도와줬던 경우가 있었을 수 있고, 누군가는 혼자 넘어지면서 배운 사람들도 있을 것이다 나는 친구 자전거를 빌려서 혼자 넘어지고 다치면서 배웠던 경험이 있다 이처럼 부모님 또는 이웃(정답을 알고 있는)의 지도를 통한 학습 → 지도 학습, 혼자 넘어지면서(Trial & Error) 시행착오를 통한 학습 → 강화 학습 으로 나누어 볼 수 있다 머신 러닝은 크게 보면 지도 학습, 비지도 학습, 강화 학습이 있다 비지도 학습에는 클러스터링 이런 것들이 있겠다 2. 강화 학습이란? 강화 학습이란 쉽게..
- [ 인공지능/인공지능 기초 ]비지도, 자기지도, 강화학습, 인공신경망2024-02-23 21:41:44혁펜하임 강의 재밌다!!! 외쳐 혁펜하임!!! https://www.youtube.com/@hyukppen 혁펜하임 | AI & 딥러닝 강의 현) 성균관대학교 의과대학 초빙강사 현) 혁펜하임 아카데미 대표 전) 삼성전자 책임연구원 AI 강의 / 딥러닝 강의 등 최고의 설명법을 연구, 개발합니다. ‘혁펜하임’은 신호처리 분야의 전설 www.youtube.com 1. 비지도 학습 비지도 학습이란 지도 학습과 반대로 정답을 모르는 상태에서 학습하는 것을 말한다 군집화 (K-means, DBSCAN, …) 군집화는 개체들을 비슷한 것끼리 그룹을 나누는 것을 말한다 차원 축소 (데이터 전처리 : PCA, SVD, …) 데이터 세트를 그대로 사용하지 하지 않고 데이터 로더를 사용하여 전처리를 하는 것을 말한다 이때..
반응형