반응형
- [ 인공지능/강화학습 ]Markov Decision Process2024-03-27 06:05:53요즘 마음이 너무 싱숭생숭하다 무엇이 문제일까? 사실 무엇이 문제인지는 알고 있는데 쉽지가 않다 지금은 내가 해야할 것에만 집중할 수 있도록...그러다보면... 모르겠다ㅋ Markov Decision Process 액션이 추가되었다 액션의 집합 A = {𝑎0, 𝑎1} MP ≡ {𝑆, 𝑃} MRP ≡ {𝑆, 𝑃, 𝑅, 𝛾} MDP ≡ {𝑆, 𝑃, 𝑅, 𝛾, 𝐴} 𝑆 : 상태의 집합 𝑆 = {𝑠0, 𝑠1, 𝑠2, 𝑠3, 𝑠4} 𝑃 : 전이 확률 $P^{a}_{ss'}$ : s 에서 a를 했을때 s’에 도달할 확률 $P^{a}_{ss'}= ℙ[s_{t+1}=s'|s_{t}=s,a_{t}=a]$ 형태가 약간 바뀜 MP, MRP : $P_{ss'}$ MDP : $P^{a}_{ss'}$ 전이 확률 예시 $P^{a_..
- [ 인공지능/강화학습 ]Markov Process, Markov Reward Process2024-03-26 05:29:44어제부터 구글 스터디잼이 시작했는데, 진행은 오늘부터 할 것 같다 가보자구!!! Markov Process Markov Process란 현재 상태만 보고 미래를 결정할 수 있는 상태를 말한다 예를 들어 우리가 체스를 두고 있는 상황에서 중간에 내가 대신 두게 된다면 어떨까? 이전에 첫수부터 지금까지의 수까지 알 필요가 있을까? 현재 보드판의 상태만 보고도 바로 체스를 이어갈 수 있을 것이다. 이런 것을 마르코프한 상태라고 부른다. 위와 같은 장면의 사진만 가지고 운전을 바로 할 수 있을까? 물론 사람은 운전에 대한 사전지식을 많이 가지고 있기 때문에 할 수는 있겠지만, 현재 상태만으로는 많은 정보를 담고 있지 않기 때문에 쉽지 않을 것이다. 속력은 몇인지... 다른차가 끼어들려고 하는건지 아닌지...등 ..
- [ 인공지능/강화학습 ]에이전트, Exploitation, Exploration2024-03-25 05:35:23챌린지도 끝이 보인다 사실 챌린지를 시작하게 된 이유 중 하나가 내가 60일 동안 꾸준히 아침에 일어나서 올릴 수 있을까? 가 궁금해서 실험해본 것도 있다 다행히 실험은 성공할 것 같다 이번 기회를 통해 바뀐 생활 패턴이 추후에 나에게 큰 도움이 되었으면 하는 바람이다 1. 에이전트와 환경 에이전트란 학습을 하는 주체이다 환경으로 부터 현재 시점 t에서의 환경에 대한 정보 st와 보상 rt를 받음 st를 바탕으로 어떤 행동을 해야 할지 결정 결정된 행동 at를 환경으로 보냄 환경 에이전트로부터 받은 행동 at를 통해서 상태 변화를 일으킴 그 결과 상태는 st → st+1로 바뀜 에이전트에게 줄 보상 또한 rt → rt+1로 바뀜 st+1과 rt+1을 에이전트에게 전달 RL(Reinforcement Lea..
- [ 인공지능/강화학습 ]강화 학습 - 지도학습과 강화학습, 순차적 의사결정, 리워드2024-03-24 06:53:18이제 실습 위주는 끝났고 강화학습 이론 강의로 들어간다 면접 준비도 미리 하고 학업 계획서도 미리 작성하자 1. 지도 학습 vs 강화 학습 우리가 어릴 때 자전거를 배우는 모습을 상상해보자 누군가는 부모님 또는 이웃이 도와줬던 경우가 있었을 수 있고, 누군가는 혼자 넘어지면서 배운 사람들도 있을 것이다 나는 친구 자전거를 빌려서 혼자 넘어지고 다치면서 배웠던 경험이 있다 이처럼 부모님 또는 이웃(정답을 알고 있는)의 지도를 통한 학습 → 지도 학습, 혼자 넘어지면서(Trial & Error) 시행착오를 통한 학습 → 강화 학습 으로 나누어 볼 수 있다 머신 러닝은 크게 보면 지도 학습, 비지도 학습, 강화 학습이 있다 비지도 학습에는 클러스터링 이런 것들이 있겠다 2. 강화 학습이란? 강화 학습이란 쉽게..
- [ 인공지능/프레임워크 or 라이브러리 ]ResNet 이미지 분류2024-03-23 10:13:16지치지 않기 위해서 매일 조금씩이라도 성취감? 소확행?을 느껴보자 사실 매일 반복되는 일상에 그런 것들을 찾는게 쉽지는 않다 그렇지만 긴 여정이 될 지금 나의 도전에 있어서 지치지 않고 끝까지 가기 위해서는 그런 것들이 필요해보인다 시간이 없어? 못할 것 같아? 실패하면 어떡하지? 다 핑계일 뿐이다. 일단 해보고 생각하자. 그리고 머리도 좋은 편이라고 생각하기 때문에 충분히 할 수 있을 것이라고 생각한다. 실습내용 ResNet 사용하여 이미지를 학습하고 10개의 카테고리를 갖는 이미지를 분류하는 이미지 분류기를 생성합니다. 데이터셋: CIFAR ResNet 깊은 신경망(152 layers… ) 학습이 가능하게 하는 skip connections 구조 Batch Normalization을 적용 분류기 학습..
- [ 인공지능/프레임워크 or 라이브러리 ]GAN2024-03-22 06:14:29지금 살짝 발등에 불 떨어졌다 토익 공부도 해야한다... 대학원 제출 서류를 너무 제대로 찾아보지 않고 안일하게 있었던 것 같다 심지어 담주가 제출이네? ㅅㅂㅋ 님 머하세요? 실습 목표 GAN을 사용하여 이미지 생성 모델을 만듭니다. (데이터셋: CIFAR10) GAN A GAN consists of two networks that train together: Generator — Given a vector of random values (latent inputs) as input, this network generates data with the same structure as the training data. Discriminator — Given batches of data containing ob..
- [ 인공지능/프레임워크 or 라이브러리 ]LSTM Classifier2024-03-21 07:04:25실습 목표 자연어 처리를 위한 주요 신경망의 사용법을 이해한다. 영화 리뷰평의 긍정/부정을 판단하기 위한 감정분석 분류 모델을 생성한다. 데이터셋: imdb 전처리 완료 데이터 문제 정의 binary classifier(positive or negative) 1. RNN의 유형 many to one 영화 리뷰 텍스트(many)를 입력으로 받아 긍정 또는 부정(one)을 출력하는 구조 Embedding: 영화 리뷰(text)를 벡터로 변환하는 연산 LSTM: 시계열 데이터를 처리하기 위한 구조 Linear: 결과 출력 모델 구조 미리보기 LSTMClassifier( (embedding): Embedding(121301, 256) (lstm): LSTM(256, 512, num_layers=2, batch_..
- [ 인공지능/프레임워크 or 라이브러리 ]Variational Autoencoder2024-03-20 06:34:30나는 할 수 있다 요즘 실습 위주라 코드만 막 올라가고 있긴 한데...ㅎ 몰라~ 실습 목표 VAE를 설계하고 학습시켜 이미지를 생성하는 모델을 만듭니다. (데이터셋: MNIST) 문제 정의 VAE VAE [Step1] Load libraries & Datasets import numpy as np import matplotlib.pyplot as plt from torchvision.transforms import ToTensor from torch.utils.data import DataLoader from torchvision import datasets, transforms import torch.nn as nn import torch.nn.functional as F import torch tra..
반응형