전체 글 (136)
방명록
- CNN, RNN, GAN, 지도 학습2024년 02월 22일 06시 53분 47초에 업로드 된 글입니다.작성자: 재형이반응형
- 드디어 진짜 인공지능이 어떤건지 개념들에 대해서 강의가 시작되었다!!!
- 오예~
- 딥러닝 공부할 때 논문을 많이 읽는게 답이라고 해서 어제 좀 찾아보다가 바로 덮었다ㅋ
- 영어;; 영어 공부 좀 하자...
1. AI(Artificial Intelligence) vs ML(Machine Leanring) vs DL(Deep Learning)
- AI 즉, 인공지능이란 사람의 사고 방식을 흉내낸 것을 의미한다
- 보통 사람은 어떻게 사고를 할까?
- 아기들을 생각해보면 주변에 보이는 행동들을 따라하면서 학습을 한다
- 즉, 많은 양의 데이터들이 입력이 되고 그에 맞는 행동들이 출력이 되는 것이다
- 이것처럼 똑같이 AI 모델에 많은 양의 데이터를 입력하여 학습시키고 우리가 원하는 출력값을 얻을 수 있는 것이다
- AI, ML, DL은 모두 숫자를 입력값으로 받고, 숫자를 출력값으로 뱉는다
- 우리 주변의 모든 사물들, 그리고 모든 개념들은 숫자로 표현할 수 있다
- 한글, 영어도 우리가 이런 숫자로 표현하자고 정한 약속들이 있고 그것들을 토대로 숫자로 표현하여 입력하게 된다
- 물론 이미지 또한 픽셀 단위로 나누어져 RGB (0~255, 0~255, 0~255) 형식으로 숫자로 표현할 수 있다
- AI랑 ML이랑 DL은 어떻게 다를까?
- DL은 ML에 포함되고, ML은 AI에 포함되는 개념이라고 볼 수 있다
- AI에서 많은 양의 데이터를 통해 학습이 되면 ML이고, 깊은 인공 신경망을 사용하면 DL이라고 볼 수 있다
- AI에 대표적인 것은 Rule-Based Algorithms이 있고, ML에는 결정 트리, 선형 회귀, 퍼셉트론, SVM (Support Vector Machine), DL에는 CNN, RNN, GAN이 있다
- 지금 듣고 있는 딥러닝 시그니쳐 강의에서는 이름 그대로 딥러닝에 대해서 강의가 진행이 된다
2. CNN (Convolutional Neural Network)
- CNN이란 데이터로부터 직접 학습하는 딥러닝의 신경망 아키텍처입니다
- 기존의 방식은 데이터에서 지식을 추출해 학습이 이루어졌지만, CNN은 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조입니다
- 예를 들어 사진을 보고 강아지인지 고양이인지 판단하고자 할 때 사용할 수 있습니다
- 사진은 앞에서 말했듯이 숫자로 표현하면 RGB 형식으로 표현할 수 있습니다
- 이때 RGB 각각을 행렬로 표현하여 3차원 행렬로 표현할 수 있고 이것을 데이터로 입력할 수 있습니다
- 그리고 CNN에서 중요한 것은 사람이 누워있는 고양이, 뒤집힌 고양이, 또는 노을에 비춰진 고양이의 실루엣만 보고도 고양이인 것을 인지할 수 있는 것처럼 다양한 상황의 데이터들을 입력해주어야 모델의 완성도가 높아질 수 있다는 것입니다
귀여워~ - 입력이 숫자인 것처럼 마찬가지로 출력도 숫자로 출력이 됩니다 (강아지는 1, 고양이는 0은 우리가 정하기 나름)
3. RNN (Recurrent Neural Network)
- RNN은 순차 데이터 입력을 처리하고 특정 순차 데이터 출력으로 변환하도록 훈련된 딥러닝 모델입니다
- 반복적이고 순차적인 데이터(Sequential data)학습에 특화된 인공신경망의 한 종류로써 내부의 순환구조가 들어있다는 특징을 가지고 있습니다
- 순환구조를 이용하여 과거의 학습을 Weight를 통해 현재 학습에 반영합니다
- 기존의 지속적이고 반복적이며 순차적인 데이터학습의 한계를 해결하연 알고리즘 입니다. 현재의 학습과 과거의 학습의 연결을 가능하게 하고 시간에 종속된다는 특징도 가지고 있습니다
- 음성 웨이브폼을 파악하거나, 텍스트의 앞 뒤 성분을 파악할 때 주로 사용됩니다
4. GAN (Generative Adversarial Network)
- GAN에는 Generator Model 과 Discriminator Model로 이루어진다
- G 모델은 정답과 유사한 가짜들을 만들어낸다
- D 모델은 G가 만든 가짜들이 진짜인지 아닌지 판별한다
- GAN모델의 목표는 G 모델이 만들어내는 가짜들을 D가 진짜인지 아닌지 판별하기 힘들정도로 만들게 하는 것이다
즉, 가짜를 진짜처럼 잘 만드는 G 모델이 GAN의 최종 목표인 것이다 - 여기서 핵심은 G 모델과 D 모델은 동시에 학습할 수 없다는 것이다
- 다음과 같은 방식으로 GAN 모델을 학습시켜 나간다
- 형편 없는 실력의 G 모델과 D 모델이 있다
- 형편 없는 실력의 G 모델이 만든 가짜를 보고 D 모델을 학습시킨다 → D 모델의 수준이 그나마 조금 올라온다
- 이제는 D 모델의 학습을 잠깐 멈추고, G 모델을 학습시킨다. G 모델이 생성하고 D 모델에게 판별을 맡겨서 가짜를 진짜인 것으로 구분하게 만드는 것이다. D 모델은 처음보다 학습된 상태이므로 G 모델이 점차 따라잡는다
- 이제는 조금 성장한 G 모델의 학습을 멈추고 D 모델을 학습시킨다
- 이런 식으로 서로 조금씩 학습을 시키고 서로를 따라잡으면서 학습을 시키다보면 결국에는 D 모델의 결과값이 진짜라고 판별 0.5, 가짜라고 판별 0.5가 나와버린다. 마치, G 모델이 만든 가짜가 진짜인지 가짜인지 헷갈려버린 D 모델이 아무거나 막 찍어버리는 상황이 연출되는 것이다
- 이것이 최종 목표이다
- 이 정도 수준까지 올라오게 된다면 우리는 GAN 모델로 많은 것을 할 수 있다
- 단지 밑그림만 보고도 진짜 사람처럼 색칠을 하게 시킬 수도 있다
- 아니면 이런 식으로 이미지를 변환할 수도 있다
5. 지도 학습 (Supervised Learning)
- Ml (머신 러닝)은 크게 보면 4가지로 나누어 볼 수 있다
- 지도 학습
- 비지도 학습
- 자기지도 학습
- 강화 학습
- 오늘은 지도 학습까지만 알아보고 나머지는 내일 알아보자
5-1. 지도 학습 - 회귀 (regression), 분류 (classification)
- 지도 학습이란 무엇일까?
- 여기서 말하는 지도란 우리가 길을 찾을 때 사용하는 지도(Map)가 아니다
- "선생님이 학생들을 올바른 길로 지도한다" 할 때의 "지도"이다
- 즉, 어떠한 올바른 길(정답)이 입력되고 그 방향으로 유도한다는 것이다 (출력)
- 간단히 말하면 정답(Label)이 있는 데이터를 활용해 데이터를 학습시키는 것이라고 할 수 있다
- 지도 학습의 예로는
- 회귀 (regression)
- 분류 (classification)
- 가 있다
- 이것처럼 강아지의 위치, 고양이의 위치를 찾게할 수 있다
- 여기서 강아지인지 아닌지, 고양이인지 아닌지는 분류를 통해 학습하고, 고양이 위치의 좌표, 네모 크기는 어느정도로 그려야 하는지와 같은 것은 회귀를 통해 진행이 된다
- 분류와 회귀가 서로 다른 모델로 진행된다는 의미가 아니다. 모두 같은 하나의 모델에서 진행이 된다. 출력이 하나의 모델에서 여러개가 나온다는 의미이다
악필 지송...ㅎ - 회귀 모델은 예측하고 싶은 종속변수가 숫자일 때 사용한다. 예를 들어 어떠한 요식업 사장님의 매출지표가 주어졌을 때 다음날의 매출은 얼마일까? 등을 예측할 때 사용할 수 있다
- 회귀 모델 활용 예시)
- 독립 변수 : 나이
종속 변수 : 키
학습시킬 데이터 : 학생들의 나이에 따른 키 기록 - 독립 션수 : 온실 기체량
종속 변수 : 기온 변화량
확습시킬 데이터 : 과거에 배출된 온실 기체량과 기온의 변화량 비교
- 독립 변수 : 나이
- 회귀 모델 활용 예시)
- 분류 모델은 추측하고 싶은 결과가 숫자가 아니라 문자일 때 사용한다.
- 분류 모델 활용 예시)
- 독립 변수 : 메일 발신일
종속 변수 : 스팸 메일 여부
학습시킬 데이터 : 메일 구분 - 독립 변수 : X-ray 사진과 영상 속 종양의 크기, 두께
종속 변수 : 악성 종양 여부
학습시킬 데이터 : 의학적으로 양성과 음성이 확인된 사진과 영상 데이터 수집
- 독립 변수 : 메일 발신일
- 분류 모델 활용 예시)
- 회귀 모델과 분류 모델의 정확한 이론적인 개념은 아니고 그냥 활용할 때 이런식으로 참고하면 편할 것 같아서 정리했다
출처) https://yozm.wishket.com/magazine/detail/2073/
[쉽게 배우는 AI] 9. 회귀 vs 분류 | 요즘IT
지도학습은 크게 회귀(regression)와 분류(classification) 두 가지로 나뉩니다. 회귀의 경우 예측하고 싶은 결괏값이 숫자일 때 사용하며, 온실가스 변화에 따른 지구 기온의 변화나 공기 중 평균 습도
yozm.wishket.com
반응형'인공지능 > 인공지능 기초' 카테고리의 다른 글
MSE, log-likelihood, MLE, 다중 분류 (2) 2024.02.27 비선형 액티베이션, 역전파, 이진분류 (6) 2024.02.26 Momentum, Adam, Validation, DNN (2) 2024.02.25 선형 회귀, 경사 하강법, 가중치 초기화, SGD (2) 2024.02.24 비지도, 자기지도, 강화학습, 인공신경망 (0) 2024.02.23 다음글이 없습니다.이전글이 없습니다.댓글재형이의 성장통 일지하루 하루 성장하자