2024 하계 모각코 5

모각코 5회차 - 7/29일, 14시~17시

목표koGPT2 기반 감성 ChatBot 만들기 결과데이터 전처리¶In [ ]:train = pd.read_csv(path + "train.csv")test = pd.read_csv(path + "test.csv")In [ ]:train = train[['사람문장', '시스템문장']]test = test[['사람문장', '시스템문장']]In [ ]:train.rename(columns={'사람문장': 'Q'}, inplace=True)train.rename(columns={'시스템문장': 'A'}, inplace=True)test.rename(columns={'사람문장': 'Q'}, inplace=True)test.rename(columns={'시스템문장': 'A'}, inplace=True)In [ ]..

모각코 4회차 - 7/24일, 14시~17시

목표1. 유방암 데이터셋으로 데이터 분석. 머신러닝 모델 학습2. 학습한 모델 저장 후 웹과 연결 결과1. 유방암 데이터셋으로 데이터 분석. 머신러닝 모델 학습import xgboostfrom xgboost import XGBClassifierimport lightgbm as lgbdtrain = xgboost.DMatrix(data=X_train, label=y_train)dtest = xgboost.DMatrix(data=X_test)#model = XGBClassifier(eta=0.2, max_depth=4, gamma=1, random_state=42)#model = lgb.LGBMClassifier(num_leaves=30, objective='binary', random_state=42)pa..

모각코 3회차 - 7/17일, 14시~17시

목표유방암 데이터셋으로 데이터 분석. 머신러닝 모델 학습(F1 Score 80 넘기기) 결과https://www.kaggle.com/datasets/akshaydattatraykhare/diabetes-dataset Diabetes DatasetDiabetes Patients Datawww.kaggle.com위 사이트의 데이터 사용In [ ]:from google.colab import drivedrive.mount('/content/drive')Mounted at /content/driveIn [ ]:import numpy as np # 배열들의 연산을 해주는 라이브러리import pandas as pd # 주로 DataFrame이라고 불리는 이차원 배열을 처리하는 라이브러리In [ ]:from skl..

모각코 2회차 - 7/8일, 14시~17시

목표koGPT2 기반 ChatBot 만들기 결과1. koGPT2 기반 ChatBot 만들기https://nanocat.tistory.com/26 데이터셋을 전처리 해보자데이터셋은 AI-Hub의 '감성 대화 말뭉치'를 가져와서 사용하였습니다.https://aihub.or.kr/aihubdata/data/view.do?currMenu=115&topMenu=100&dataSetSn=86 AI-Hub샘플 데이터 ? ※샘플데이터는 데이터의 이해를 돕기 위해nanocat.tistory.com모델 학습에 사용할 데이터셋을 전처리하였다. 전체 내용은 위 링크에 정리해두었다.

모각코 1회차 - 7/3일, 14시~17시

목표koGPT2 ChatBot 만들기 연습 결과1. koGPT2 ChatBot 만들기 연습https://wikidocs.net/158023 9-3. koGPT2 ChatBot프로그래밍에 사용된 패키지들의 버전은 다음과 같다. * huggingface-hub 0.2.1 pypi_0 pypi *…wikidocs.net위 사이트를 많이 참고하였다.사용 챗봇 데이터 : 송영숙님의 챗봇 데이터 (https://github.com/songys/Chatbot_data) - koGPT2를 colab에 가져와보았다.import torchfrom transformers import GPT2LMHeadModelfrom transformers import PreTrainedTokenizerFasttokenizer = PreT..