728x90
GitHub - smilegate-ai/korean_unsmile_dataset
Contribute to smilegate-ai/korean_unsmile_dataset development by creating an account on GitHub.
github.com
GitHub - smilegate-ai/HuLiC
Contribute to smilegate-ai/HuLiC development by creating an account on GitHub.
github.com
밑에 있는 데이터셋은 챗봇 관련 데이터이다.
Train과 Validaiton 데이터셋으로 구분되어 있고 총 약 15000개의 훈련데이터, 3737개의 val 데이터가 있었고 NaN도 없는 완전한 데이터이다.
클린~
약 18000개의 데이터를 더 얻었다.
728x90
'포트폴리오 Portfolio > AI Project' 카테고리의 다른 글
AI Project NLP 악플 데이터 셋 일부 proprocessing eda (0) | 2022.04.01 |
---|---|
악플 데이터 셋 추가 (0) | 2022.03.30 |
NLP 비하 차별 혐오 악성 발언, 댓글 데이터셋 정리 (0) | 2022.03.18 |
한국어 NLP 전처리 (0) | 2022.03.18 |
비하발언, 악플, 악성댓글, 차별발언 데이터셋 (0) | 2022.03.18 |