방명록
- CNN, RNN, GAN, 지도 학습2024년 02월 22일 06시 53분 47초에 업로드 된 글입니다.작성자: 재형이반응형
- 드디어 진짜 인공지능이 어떤건지 개념들에 대해서 강의가 시작되었다!!!
- 오예~
- 딥러닝 공부할 때 논문을 많이 읽는게 답이라고 해서 어제 좀 찾아보다가 바로 덮었다ㅋ
- 영어;; 영어 공부 좀 하자...
1. AI(Artificial Intelligence) vs ML(Machine Leanring) vs DL(Deep Learning)
- AI 즉, 인공지능이란 사람의 사고 방식을 흉내낸 것을 의미한다
- 보통 사람은 어떻게 사고를 할까?
- 아기들을 생각해보면 주변에 보이는 행동들을 따라하면서 학습을 한다
- 즉, 많은 양의 데이터들이 입력이 되고 그에 맞는 행동들이 출력이 되는 것이다
- 이것처럼 똑같이 AI 모델에 많은 양의 데이터를 입력하여 학습시키고 우리가 원하는 출력값을 얻을 수 있는 것이다
- AI, ML, DL은 모두 숫자를 입력값으로 받고, 숫자를 출력값으로 뱉는다
- 우리 주변의 모든 사물들, 그리고 모든 개념들은 숫자로 표현할 수 있다
- 한글, 영어도 우리가 이런 숫자로 표현하자고 정한 약속들이 있고 그것들을 토대로 숫자로 표현하여 입력하게 된다
- 물론 이미지 또한 픽셀 단위로 나누어져 RGB (0~255, 0~255, 0~255) 형식으로 숫자로 표현할 수 있다
- AI랑 ML이랑 DL은 어떻게 다를까?
- DL은 ML에 포함되고, ML은 AI에 포함되는 개념이라고 볼 수 있다
- AI에서 많은 양의 데이터를 통해 학습이 되면 ML이고, 깊은 인공 신경망을 사용하면 DL이라고 볼 수 있다
- AI에 대표적인 것은 Rule-Based Algorithms이 있고, ML에는 결정 트리, 선형 회귀, 퍼셉트론, SVM (Support Vector Machine), DL에는 CNN, RNN, GAN이 있다
- 지금 듣고 있는 딥러닝 시그니쳐 강의에서는 이름 그대로 딥러닝에 대해서 강의가 진행이 된다
2. CNN (Convolutional Neural Network)
- CNN이란 데이터로부터 직접 학습하는 딥러닝의 신경망 아키텍처입니다
- 기존의 방식은 데이터에서 지식을 추출해 학습이 이루어졌지만, CNN은 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조입니다
- 예를 들어 사진을 보고 강아지인지 고양이인지 판단하고자 할 때 사용할 수 있습니다
- 사진은 앞에서 말했듯이 숫자로 표현하면 RGB 형식으로 표현할 수 있습니다
- 이때 RGB 각각을 행렬로 표현하여 3차원 행렬로 표현할 수 있고 이것을 데이터로 입력할 수 있습니다
- 그리고 CNN에서 중요한 것은 사람이 누워있는 고양이, 뒤집힌 고양이, 또는 노을에 비춰진 고양이의 실루엣만 보고도 고양이인 것을 인지할 수 있는 것처럼 다양한 상황의 데이터들을 입력해주어야 모델의 완성도가 높아질 수 있다는 것입니다
- 입력이 숫자인 것처럼 마찬가지로 출력도 숫자로 출력이 됩니다 (강아지는 1, 고양이는 0은 우리가 정하기 나름)
3. RNN (Recurrent Neural Network)
- RNN은 순차 데이터 입력을 처리하고 특정 순차 데이터 출력으로 변환하도록 훈련된 딥러닝 모델입니다
- 반복적이고 순차적인 데이터(Sequential data)학습에 특화된 인공신경망의 한 종류로써 내부의 순환구조가 들어있다는 특징을 가지고 있습니다
- 순환구조를 이용하여 과거의 학습을 Weight를 통해 현재 학습에 반영합니다
- 기존의 지속적이고 반복적이며 순차적인 데이터학습의 한계를 해결하연 알고리즘 입니다. 현재의 학습과 과거의 학습의 연결을 가능하게 하고 시간에 종속된다는 특징도 가지고 있습니다
- 음성 웨이브폼을 파악하거나, 텍스트의 앞 뒤 성분을 파악할 때 주로 사용됩니다
4. GAN (Generative Adversarial Network)
- GAN에는 Generator Model 과 Discriminator Model로 이루어진다
- G 모델은 정답과 유사한 가짜들을 만들어낸다
- D 모델은 G가 만든 가짜들이 진짜인지 아닌지 판별한다
- GAN모델의 목표는 G 모델이 만들어내는 가짜들을 D가 진짜인지 아닌지 판별하기 힘들정도로 만들게 하는 것이다
즉, 가짜를 진짜처럼 잘 만드는 G 모델이 GAN의 최종 목표인 것이다 - 여기서 핵심은 G 모델과 D 모델은 동시에 학습할 수 없다는 것이다
- 다음과 같은 방식으로 GAN 모델을 학습시켜 나간다
- 형편 없는 실력의 G 모델과 D 모델이 있다
- 형편 없는 실력의 G 모델이 만든 가짜를 보고 D 모델을 학습시킨다 → D 모델의 수준이 그나마 조금 올라온다
- 이제는 D 모델의 학습을 잠깐 멈추고, G 모델을 학습시킨다. G 모델이 생성하고 D 모델에게 판별을 맡겨서 가짜를 진짜인 것으로 구분하게 만드는 것이다. D 모델은 처음보다 학습된 상태이므로 G 모델이 점차 따라잡는다
- 이제는 조금 성장한 G 모델의 학습을 멈추고 D 모델을 학습시킨다
- 이런 식으로 서로 조금씩 학습을 시키고 서로를 따라잡으면서 학습을 시키다보면 결국에는 D 모델의 결과값이 진짜라고 판별 0.5, 가짜라고 판별 0.5가 나와버린다. 마치, G 모델이 만든 가짜가 진짜인지 가짜인지 헷갈려버린 D 모델이 아무거나 막 찍어버리는 상황이 연출되는 것이다
- 이것이 최종 목표이다
- 이 정도 수준까지 올라오게 된다면 우리는 GAN 모델로 많은 것을 할 수 있다
- 단지 밑그림만 보고도 진짜 사람처럼 색칠을 하게 시킬 수도 있다
- 아니면 이런 식으로 이미지를 변환할 수도 있다
5. 지도 학습 (Supervised Learning)
- Ml (머신 러닝)은 크게 보면 4가지로 나누어 볼 수 있다
- 지도 학습
- 비지도 학습
- 자기지도 학습
- 강화 학습
- 오늘은 지도 학습까지만 알아보고 나머지는 내일 알아보자
5-1. 지도 학습 - 회귀 (regression), 분류 (classification)
- 지도 학습이란 무엇일까?
- 여기서 말하는 지도란 우리가 길을 찾을 때 사용하는 지도(Map)가 아니다
- "선생님이 학생들을 올바른 길로 지도한다" 할 때의 "지도"이다
- 즉, 어떠한 올바른 길(정답)이 입력되고 그 방향으로 유도한다는 것이다 (출력)
- 간단히 말하면 정답(Label)이 있는 데이터를 활용해 데이터를 학습시키는 것이라고 할 수 있다
- 지도 학습의 예로는
- 회귀 (regression)
- 분류 (classification)
- 가 있다
- 이것처럼 강아지의 위치, 고양이의 위치를 찾게할 수 있다
- 여기서 강아지인지 아닌지, 고양이인지 아닌지는 분류를 통해 학습하고, 고양이 위치의 좌표, 네모 크기는 어느정도로 그려야 하는지와 같은 것은 회귀를 통해 진행이 된다
- 분류와 회귀가 서로 다른 모델로 진행된다는 의미가 아니다. 모두 같은 하나의 모델에서 진행이 된다. 출력이 하나의 모델에서 여러개가 나온다는 의미이다
- 회귀 모델은 예측하고 싶은 종속변수가 숫자일 때 사용한다. 예를 들어 어떠한 요식업 사장님의 매출지표가 주어졌을 때 다음날의 매출은 얼마일까? 등을 예측할 때 사용할 수 있다
- 회귀 모델 활용 예시)
- 독립 변수 : 나이
종속 변수 : 키
학습시킬 데이터 : 학생들의 나이에 따른 키 기록 - 독립 션수 : 온실 기체량
종속 변수 : 기온 변화량
확습시킬 데이터 : 과거에 배출된 온실 기체량과 기온의 변화량 비교
- 독립 변수 : 나이
- 회귀 모델 활용 예시)
- 분류 모델은 추측하고 싶은 결과가 숫자가 아니라 문자일 때 사용한다.
- 분류 모델 활용 예시)
- 독립 변수 : 메일 발신일
종속 변수 : 스팸 메일 여부
학습시킬 데이터 : 메일 구분 - 독립 변수 : X-ray 사진과 영상 속 종양의 크기, 두께
종속 변수 : 악성 종양 여부
학습시킬 데이터 : 의학적으로 양성과 음성이 확인된 사진과 영상 데이터 수집
- 독립 변수 : 메일 발신일
- 분류 모델 활용 예시)
- 회귀 모델과 분류 모델의 정확한 이론적인 개념은 아니고 그냥 활용할 때 이런식으로 참고하면 편할 것 같아서 정리했다
출처) https://yozm.wishket.com/magazine/detail/2073/
반응형'인공지능 > 인공지능 기초' 카테고리의 다른 글
MSE, log-likelihood, MLE, 다중 분류 (2) 2024.02.27 비선형 액티베이션, 역전파, 이진분류 (6) 2024.02.26 Momentum, Adam, Validation, DNN (2) 2024.02.25 선형 회귀, 경사 하강법, 가중치 초기화, SGD (2) 2024.02.24 비지도, 자기지도, 강화학습, 인공신경망 (0) 2024.02.23 다음글이 없습니다.이전글이 없습니다.댓글