본문 바로가기

practical AI/TFX

[TFX 스터디 4주차] 연습 프로젝트 세부사항 결정

[TFX 스터디 4주차] 연습 프로젝트 세부사항 결정

 

박찬성님의 TFX tutorial을 바탕으로 이를 다른 모델에 적용해보는 연습용 프로젝트를 10월동안 하기로 했다.

 

레포도 만들었다~

 

GitHub - hongseoi/TFX_Pipeline: TFX를 활용한 LSTM모델의 Text Data 감성분석 Pipeline 제작 Project

TFX를 활용한 LSTM모델의 Text Data 감성분석 Pipeline 제작 Project - GitHub - hongseoi/TFX_Pipeline: TFX를 활용한 LSTM모델의 Text Data 감성분석 Pipeline 제작 Project

github.com

 

task는 텍스트 데이터 감성분류, 모델은 LSTM을 하려고 한다. 잘 돌아가기만 하면 되기 때문에 무난한 모델인 LSTM을 골랐는데 성능은 어떨지 모르겠다... 성능에 따라 모델을 바꾸는 것도 고려해봐야 할 듯 하다.

 

데이터는 네이버의 영화 리뷰 데이터셋을 사용하려고 한다.

 

그리고 제작한 머신러닝 파이프라인으로 웹 서비스를 만드려고 한다.

전에 조코딩에서 배운 streamlit을 활용해보려고 생각중이다.

 

좀 더 세부적인 계획은 박찬성님의 가이드라인을 따르려고 한다.

가이드라인

 

음... 10월 22일까지 완료하기로 했는데 3주정도 남았다. 시간이 매우매우매우매우 촉박하다.

오류 발생까지 생각하면 적어도 원래 기한에서 1주 전인 10월 15일까지는 완성하는 것이 좋다고 생각한다.

근데 그러면 이제 2주남음...

 

일단 이번주는 매우매우매우 바쁘므로 3가지만 해야겠다.

 

1. Notebook to prepare input dataset in TFRecord format

2.  Upload the input dataset into the GCS bucket

3. Implement and include RNN model in the pipeline

 

을 할 계획이다.