반응형
- [ 인공지능/인공지능 기초 ]Auto Encoder, GAN(1)2024-03-11 06:31:43어제 GPT API로 비트코인 자동매매를 만들어보려고 했는데, 생각보다 GPT API 비용이 만만치 않다는 것을 깨달았다 1분마다 보내면 대충 한달에 43만원? 어제 나도 모르게 급발진해서 바로 11달라 충전하고 10마넌 넣고 그랬는데, 지금 생각해보면 너무 대책 없었던 것 같다 이런 것도 다 경험이니까... Gemini 오픈 소스를 써볼까 1. Autoencoder 입력(𝑥)과 출력(𝑦)이 동일한 차원을 갖는 신경망 $(x, 𝑦) ∈ ℝ^{d}$ Encoder의 출력 $𝑧 = ℎ(𝑥) = 𝑤_{𝑒}𝑥 + 𝑏_{𝑒}$ Decoder의 출력 $𝑦 = 𝑔(𝑧) = 𝑔(ℎ(𝑥)) = 𝑤_{𝑑}𝑧 + 𝑏_{𝑑}$ Loss $𝐿(𝑥, 𝑦) = 𝐿(𝑥, 𝑔 (ℎ (𝑥))) = \lVert 𝑥 − 𝑦 \rVert^{..
- [ 인공지능/인공지능 기초 ]NLP (3)2024-03-10 10:48:42오늘은 UFC 션 오말리의 챔피언 타이틀 방어전이 하는 날입니다 지금 아침부터 작성 중인데 아마 글을 올릴 때 쯤이면 이미 결과가 나왔을 수도 있겠네요 션 오말리 화이팅~!! 션 오말리 승~ 1. 의미 연결망 분석(Semantic Network Analysis) 단어 간의 관계를 분석하기 위해 사용 단어의 관계에 적용하여 텍스트의 의미 구조를 파악하려는 분석 기법이다 특정 단어가 어떤 단어와 함께 자주 사용되었는가? 문서의 저자가 강조하고자 하는 것이 무엇인지, 어떤 어조를 띄고 있는지 추측할 수 있음 SNA 분석 방법 문서를 구성하고 있는 단어를 노드로 구성하고 노드와 노드를 연결 네트워크 = 문서를 구성하고 있는 단어와 관계 SNA 분석는 배달 어플의 리뷰를 분석해서 글쓴이의 감정을 파악하는데 사용할..
- [ 인공지능/인공지능 기초 ]NLP (2)2024-03-09 11:23:57어제 조대협 강사님의 항로 1기 1주차 프로젝트 미팅을 하고 왔다 요즘들어 집에 있는게 편하고 친구들이 만나자고 해도 귀찮고 그랬었는데, 오랜만에 처음보는 사람들을 만나니 너무 신났다 역시 아무래도 나는 E가 맞는가보다 1. 텍스트 정제 (Cleaning) 모든 텍스트 마이닝의 첫 시작은 텍스트 정제부터 시작해야한다 텍스트 정제 : 자연어를 단어 기준으로 구분하거나 형태소 기준으로 구분하는 것처럼 특징을 추출하기 용이한 형태로 바꾸는 것 텍스트 마이닝 : 자연어에서부터 특징을 추출하여 의미있는 정보들을 가져오는 것 다양한 텍스트 정제 활동 대소문자 통일 문장부호/특수문자 제거 숫자제거 공백, 개행문자 제거 띄어쓰기 보정 품사분석 (Part of Speech tagging) 불용어 (stopword) 제거..
- [ 인공지능/인공지능 기초 ]Embedding (2), NLP (1)2024-03-08 06:17:10드디어 NLP 시작!!! 세상에는 대단한 사람들이 참 많다. 물론 그들이 열심히 해서 이룬 것들이겠지만... 뒤늦게라도 그 사람들을 따라잡으려고 하다보면 어느 순간 막막해질 때가 있다. 세상은 원래 불공평하다고 하지 않는가... 그걸 받아들이는게 중요한 것 같다 세상이 원래 불공평하다는 것을 받아들이고, 나와의 공평한 싸움을 하자. 어제의 나와 오늘의 나의 차이는 24시간 동안 무엇을 했는지일 뿐이니까... 매일, 어제보다 조금이라도 성장하자는 마음으로 달려나가자. 그러다보면 언젠가는 남 부럽지 않은 삶을 살 수 있지 않을까? 운동 유튜브를 보다가 마음에 와닿는 글귀가 있어서 적어본다 "생각은 곧 사라지지만 모든 행동은 흔적을 남긴다" 1. Word2Vec BoW는 단순히 빈도수를 기반으로 하기 때문에 ..
- [ 인공지능/인공지능 기초 ]신경망 성능 향상, 1D conv, Embedding (1)2024-03-07 07:24:03볼펜 사야겠네;; 오늘은 예비군 작계 훈련이 있는 날이라 아침에 좀 느긋하게 작성하는 중이다 사실 마음이 싱숭생숭해서 집중이 잘 안됨;;ㅜㅜ 사춘긴가 짜증 1. 신경망의 성능을 높이기 위해 자주 사용하는 방법들 좋은 성능의 인공 신경망의 특징 일반화 : 미확인 데이터에 대해서도 예측을 잘 할 수 있어야 함 정확도 : 답변이 믿을만 해야 함 리소스 측면 : 컴퓨팅 자원을 효율적으로 사용해야 함 학습 속도 측면 : 학습 속도가 너무 느리면 곤란함 인공 신경망의 일반화를 위해서는 대표적으로 오버피팅을 막아야 한다 학습용 데이터를 늘림 Early Stopping Regularization : L2, L1, Dropout 등 앙상블 모델 2. 다양한 Conv Convolution 연산은 단순히 이미지에만 적용시킬..
- [ 인공지능/인공지능 기초 ]VGGNet, GoogLeNet(Inception), ResNet, Transfer Learning2024-03-06 06:22:06이번 강의를 통해서는 다양한 모델들을 간단하게 리뷰해보면서 개발자가 어떤 생각을 가지고 디자인을 했을까?라고 생각할 수 있는 계기가 되었습니다 생각하면서 느꼈던 것은 꼭 수식적인 증명(물론 논문을 발표할 때는 필요하겠지만)뿐만 아니라 상상하는 대로 모델을 바꿀 수 있고 실제로 성능도 더 좋아질 수도 있다는 걸 느꼈습니다 그래서 딥러닝 연구 분야는 창의력, 사고력이 굉장히 중요한 분야이구나라는 생각을 했습니다 감사합니다 1. VGGNet VGGNet은 ILSVRC (Large Scale Visual Recognition Challenge)라는 이미지 넷(Image Net)의 사물 인식 대회에서 2014년에 2등을 했었던 모델이다 근데 왜 1등도 아니고 2등을...? 왜냐하면 단순한 구조로 좋은 성능을 보여..
- [ 인공지능/인공지능 기초 ]CNN 연산, Conv, Pooling, 컴퓨터 비젼2024-03-05 06:37:32최근에 같이 조대협님의 프로젝트를 진행하면서 만난 팀원분께 좋은 말씀을 많이 듣고 있다 같이 프로젝트를 진행하면서 아마 인사이트가 많이 변할 것 같다 확실히 다양한 사람들을 만나면서 의견을 공유해보는게 많이 도움이 되는 것 같다 1. 컴퓨터 비젼의 주요 TASK 컴퓨터는 이미지를 이해하지 못한다 컴퓨터는 모든 것들을 숫자로 이해를 하기 때문에 (정확히는 이진법) 입력되는 데이터들을 숫자로 변환해서 넣어주어야 한다 이미지를 학습시키기 위해 입력값으로 넣어주려고 하는 경우에는 어떻게 할 수 있을까? 컬러 이미지는 RGB로 구성되어 있고 각각의 값들은 0과 255사이의 값들이다. 즉, 깊이 3을 가지는 행렬들의 모임이라고 할 수 있다 이런식으로 이미지든 문자이든 숫자로 표현해서 넣어주어야 한다 컴퓨터 비젼 T..
- [ 인공지능/인공지능 기초 ]분류 알고리즘, 회귀 알고리즘2024-03-04 10:07:11포스트잍에 날짜만 적고 몇일차인지를 안 적으니까 좀 헷갈리는 것 같다 내일부터는 몇일차인지도 같이 적어야겠다 1. 분류 알고리즘 1-1. Decision Tree Classifier 의사 결정 나무 분류 알고리즘이라고 부름 1-2. RandomForest 하지만 하나의 의사 결정 트리를 사용하게 된다면 정확도는 높아지겠지만 오버피팅될 확률이 높아진다 그렇기 때문에 여러개의 의사 결정 트리를 사용하고 나온 값들을 다수결(voting)을 통해 오버피팅을 개선한 것이 Random Forest 이다 높은 정확도, 과적합 문제 해결, 많은 갯수의 독립변수를 다룰 수 있다 단점으로는 연산 시간이 오래 걸린다 1-3. XGBoost Voting을 하는 방식에는 하드 보팅과 소프트 보팅이 있다 하드 보팅은 다수의 분류..
반응형