반응형
- [ 인공지능/프레임워크 or 라이브러리 ]자전거 대여량 예측 - 선형 회귀, 군집 모델 (클러스터링) 실습2024-03-15 06:42:26가보자 가보자~ 1. 자전거 대여량 예측 - 선형회귀 다음과 같은 항목들로 이루어져 있는 데이터를 사용해볼 것이다 시간 - 시간별 타임 스탬프 계절 - 1 = 봄, 2 = 여름, 3 = 가을, 4 = 겨울 휴일 - whether the day is considered a holiday 주간 - whether the day is neither a weekend nor holiday 날씨 - 1: 맑음, Few clouds, Partly cloudy, Partly cloudy 2: 안개낌 + Cloudy, Mist + Broken clouds, Mist + Few clouds, Mist 3: 약간 눈내림, 약간 비 + 천둥번개 + Scattered 구름, 약간의 비 + Scattered 구름 4: 소나기 +..
- [ 인공지능/프레임워크 or 라이브러리 ]제조 데이터의 분류기 실습2024-03-14 05:35:22실습 위주라 블로그에 정리하기가 애매하군 제조 데이터의 분류기 실습 1. 데이터 로드 numpy와 pandas는 데이터를 로드하고 형식에 맞게 변형 matplotlib.pyplot과 seaborn은 데이터 시각화를 위해 사용 # 라이브러리 & 데이터 로드 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns df = pd.read_csv('exercise1.csv') df.head() df.shape로 데이터 프레임의 형태를 파악할 수 있다 총 1000개의 행과 7개의 열로 이루어져있다는 것을 확인할 수 있다 df.shape # (1000, 7) target은 0과 1로 구분되어있게 구성했다...
- [ 인공지능/프레임워크 or 라이브러리 ]데이터 로더, 모델 실습, 로깅2024-02-21 07:13:11가보자 가보자 1. 데이터 로더 (Data Loader) 데이터 세트가 항상 내가 원하는 형식으로 되어있지 않기 때문에 데이터를 불러올 때 특정한 형식으로 불러올 수 있어야 한다 이때 커스텀 데이터 로더를 구성해서 이용할 수 있다 다음 같은 구성으로 데이터 로더를 만들 수 있다 1-1. 꽃 분류 데이터 세트 불러오기 꽃 분류 데이터 세트 구성 커스텀 데이터 로더 구성하기 import torch from torchvision import transforms from torch.utils.data import DataLoader from PIL import Image from IPython.display import display import matplotlib.pyplot as plt import nump..
- [ 인공지능/프레임워크 or 라이브러리 ]Image Captcha 라이브러리 (Library)2024-02-20 07:01:100. Image Captcha 라이브러리 설치하기 특정 자릿수의 정수를 이미지 형태로 반환하는 이미지 캡차(image captcha) 라이브러리 !pip install captcha 1. 랜덤 캡차 이미지 생성하기 (이미지, 정답 레이블)을 생성한 뒤에, 메타 데이터를 저장하여 관리할 수 있다 메타 데이터는 테이블(table) 형태의 데이터에 해당하므로, 판다스(Pandas)의 데이터프레임(dataframe) 형태로 저장할 수 있다 from captcha.image import ImageCaptcha def generate_random_images(directory, n_digits, cnt): # 메타 데이터 (경로, 정답) metadata = [] # 디렉토리(directory)가 존재하지 않을 때 ..
- [ 인공지능/프레임워크 or 라이브러리 ]대량의 데이터 다루기, 누락된 데이터 처리, 클래스 활용2024-02-20 06:55:12어제 같이 국비지원 학원을 다녔던 친구를 만나서 가볍게 한잔하고 왔더니 한시간 더 자버렸다ㅋ 그래도 적당히 마셔서 다행이다 휘유~ 그리고 돈 좀 아껴쓰자!!! 1. 자료구조를 이용해 수만 개의 데이터 처리하기 어떤 자료 구조를 이용해야 수만 개의 데이터를 빠르게 다룰 수 있을까? 파이썬으로 대량의 데이터를 만들어보고 직접해보자 성(last name)과 이름(first name)을 30개씩 준비한다 가능한 조합은 30 * 30 = 900개이다 import random import numpy as np import pandas as pd import heapq import time last_names = [ "Smith", "Johnson", "Williams", "Jones", "Brown", "Davis..
- [ 인공지능/프레임워크 or 라이브러리 ]의사 결정 트리, 랜덤 포레스트, SVM, 선형 회귀2024-02-15 05:13:39여기까지 딥러닝과 관련된 파이썬의 라이브러리 또는 프레임워크들을 알아보았고 내일부터는 기초 수학들을 좀 다룰 예정이다 ex) 함수, 로그, 미분... 고등학교 시절 추억이 새록새록 날 것 같다ㅎㅎ 친구들이랑 야자 도망가면서 많이 맞았었는데...ㅋ 사실 지금까지 정리한 것들을 다 이해했다고 말하기 힘들다. 아니 절반도 이해 못했다. 하지만 시작이 중요한거니까... 끝까지 가면 내가 다 이겨 1. 의사 결정 트리 (Decision Tree) 이진 트리 구조로 예/아니오로 답할 수 있는 질문을 반복하여 분류를 수행하며 판별을 한다 붓꽃 데이터 세트로 실습해보자 컬럼명 의미 데이터 타입 Species 붓꽃의 종 : setosa, versicolor, virginica Factor Sepal.Width 꽃받침의 ..
- [ 인공지능/프레임워크 or 라이브러리 ]사이킷런 개요, 가상 데이터, 데이터 분할, ROC 커브2024-02-14 06:25:01어제 천재 혁명가 곽상빈이라는 유튜브에서 나만의 부적만들기라는 컨텐츠를 보고 따라해보려고 하는 중이다 10년 후의 나의 모습, 5년 후, 3년 후를 생각해서 작성하려다 보니 쉽지 않다 항상 계획을 짜야지 짜야지 생각은 했었는데 막상 해보려고 하니 어렵다 매달, 매주, 매일 계획을 짜고 하나씩 달성해보자 1. 사이킷런(Scikit-Learn) 개요 사이킷런(scikit-learn)은 기계 학습을 위한 다양한 기능을 제공하는 파이썬 라이브러리다 가상 데이터(분류 등) 생성 기능을 제공한다 기계 학습을 위해 다양한 기본적인 데이터 세트를 제공한다 다양한 기계 학습 모델(SVM, 랜덤 포레스트 등)을 제공한다 1-1. 사이킷런에서 제공하는 데이터 세트 예시 - 붓꽃(iris) 품종 예측 데이터 세트 붓꽃에 대한..
- [ 인공지능/프레임워크 or 라이브러리 ]텐서플로우 자동미분, 모델 생성 후 테스트2024-02-13 05:51:02연휴 끝! 1. 텐서플로우의 자동 미분과 기울기(Gradient) TensorFlow에서는 Gradient Tape 기능을 제공한다 중간의 관련 연산들을 테이프에 기록하고, 역전파(backward)를 수행했을 때 기울기가 계산된다 import tensorflow as tf x = tf.Variable([3.0, 4.0]) y = tf.Variable([1.0, 2.0]) # 진행되는 모든 연산들을 기록 with tf.GradientTape() as tape: z = x + y loss = tf.math.reduce_mean(z) dx = tape.gradient(loss, x) # loss가 scalar이므로 계산 가능 print(dx) TensorFlow에서는 변수가 아닌 상수라면 기본적으로 기울기를 ..
반응형