Skip to content

Latest commit

 

History

History
69 lines (40 loc) · 4.42 KB

README.md

File metadata and controls

69 lines (40 loc) · 4.42 KB

🚘 AIFFELTHON X SOCAR 🚘

📅 프로젝트 기간 : 2022.04.20-2022.06.08

  • 김빈 : KoBERT를 활용한 이진 분류 및 멀티레이블 분류 모델 구현, 시스템 자동화를 위한 파일 구성
  • 노지연 : KoBERT를 활용한 키워드 추출 모델 구현, 준실시간 데이터 제공을 위한 시스템 자동화 구현
  • 박지호 : KoBERT를 활용한 이진 분류 및 멀티레이블 분류 모델 구현, 키워드 카테고리 분류
  • 신혜지
  • 홍서영

🚦 Introduction

<쏘카와 관련된 리뷰 및 후기를 기반으로 한 분석 자동화 시스템 구축하기>

최근 방송 뿐만이 아니라 유튜브, 개인 그리고 인플루언서 등의 영향력이 커지고 있습니다. 이는 기업의 이미지에 큰 영향력을 끼치기 때문에 B2C 사업에서는 이에 대한 관리가 필요합니다. 하지만 영향력을 미치는 개인이 많고 동시다발적으로 콘텐츠가 업로드가 되기 때문에 이를 정량적으로 파악하기가 어려울 뿐만 아니라 인력으로 대응하기도 어렵다고 판단했습니다. 이슈에 관한 빠르고 유연한 대처를 위해 다양한 채널에서 쏘카 리뷰들을 수집하고 분석했습니다.

  1. 쏘카의 최근 이슈를 파악할 수 있는 급상승 키워드를 제공
  2. 쏘카에 대한 인식이 현재 긍정적인지, 부정적인지 알 수 있는 감성분석을 통한 긍/부정 키워드 기획
  3. 부정적인 의견을 기반으로 주요 불만 키워드를 파악할 수 있도록 카테고리로 분류
  4. 어떤 내용이 부정적인지 정확한 데이터를 제공하고자, 실제 리뷰 데이터 원본 제공

🏃 Project Details

  • Tools

    Language : Python

    IDE : Google Colaboratory

    Library : Pytorch

    Platform : GCP, Airflow, Kafka, Bigquery, Google Data Studio

[전체 진행과정] 전체진행흐름도

[이진분류]

[카테고리 선정 과정] 카테고라이징방식

[시스템 구현도] 시스템구성도

🙋 Results


💌🕊️

🦒 🧡김빈 : 좋은 사람들과 프로젝트 진행하게 되어서 즐거웠습니다. 현재 저의 수준 이상에서나 가능할 시도를 많이 해볼 수 있어서 성장에 도움이 되었습니다. 추후에 multi-label classification의 미진했던 부분을 개선하여 나올 결과도 기대가 되네요!

🐹 💛 노지연 : “쏘카에 대한 리뷰 분석”이란 흥미로운 주제를 가지고 처음에는 어떻게 풀어가야 할지 막막했지만, 마음이 맞는 팀원들과 함께 역경에도 굴하지 않고 끝까지 매진하여 좋은 결과를 도출한 만족스런 프로젝트였습니다.

🐧 ❤️ 박지호 : 프로젝트 진행 과정 중에 많은 어려움도 있었지만 끊임없는 소통으로 끝까지 문제 해결을 하는 과정에서 많이 배웠습니다. 부족 저를 이끌어주고 많이 배울 수 있게 해준 우리 팀원 모두 감사합니다.

🐱 💚신혜지 : 캐처는 한달 남짓한 시간동안 다섯 팀원이 공들여 만든 소중한 프로젝트입니다. 효과적으로 유저의 피드백을 수집하고 종합하고자 하는 많은 분들께 캐처가 도움이 되었으면 좋겠습니다. 고생하신 우리 캐처팀 감사합니다!

🐸 💙 홍서영 : 6개월 전 코드 한 줄 몰랐던 제가 멋진 사람들을 만나 충만한 결과물을 내기까지, 하냥 즐거운데다 유익하기까지 한 시간이었습니다. “캐처”팀을 감성분석하면 “Positive” 100%, 키워드 추출하면 “즐거움”이 나올거란 확신이 드네요. 캐처 상사, 퇴사 없어!