반응형
- [ 인공지능/프레임워크 or 라이브러리 ]대량의 데이터 다루기, 누락된 데이터 처리, 클래스 활용2024-02-20 06:55:12어제 같이 국비지원 학원을 다녔던 친구를 만나서 가볍게 한잔하고 왔더니 한시간 더 자버렸다ㅋ 그래도 적당히 마셔서 다행이다 휘유~ 그리고 돈 좀 아껴쓰자!!! 1. 자료구조를 이용해 수만 개의 데이터 처리하기 어떤 자료 구조를 이용해야 수만 개의 데이터를 빠르게 다룰 수 있을까? 파이썬으로 대량의 데이터를 만들어보고 직접해보자 성(last name)과 이름(first name)을 30개씩 준비한다 가능한 조합은 30 * 30 = 900개이다 import random import numpy as np import pandas as pd import heapq import time last_names = [ "Smith", "Johnson", "Williams", "Jones", "Brown", "Davis..
- [ 인공지능/프레임워크 or 라이브러리 ]사이킷런 개요, 가상 데이터, 데이터 분할, ROC 커브2024-02-14 06:25:01어제 천재 혁명가 곽상빈이라는 유튜브에서 나만의 부적만들기라는 컨텐츠를 보고 따라해보려고 하는 중이다 10년 후의 나의 모습, 5년 후, 3년 후를 생각해서 작성하려다 보니 쉽지 않다 항상 계획을 짜야지 짜야지 생각은 했었는데 막상 해보려고 하니 어렵다 매달, 매주, 매일 계획을 짜고 하나씩 달성해보자 1. 사이킷런(Scikit-Learn) 개요 사이킷런(scikit-learn)은 기계 학습을 위한 다양한 기능을 제공하는 파이썬 라이브러리다 가상 데이터(분류 등) 생성 기능을 제공한다 기계 학습을 위해 다양한 기본적인 데이터 세트를 제공한다 다양한 기계 학습 모델(SVM, 랜덤 포레스트 등)을 제공한다 1-1. 사이킷런에서 제공하는 데이터 세트 예시 - 붓꽃(iris) 품종 예측 데이터 세트 붓꽃에 대한..
반응형