sailorCat
작성일
2022. 3. 29. 21:49
작성자
sailorCat
728x90

https://github.com/smilegate-ai/korean_unsmile_dataset?fbclid=IwAR0xTlHYCWK0LtrghSL1bPm2su69-LbjisutmcvLlERlHzroMlVpHq3h71g 

 

GitHub - smilegate-ai/korean_unsmile_dataset

Contribute to smilegate-ai/korean_unsmile_dataset development by creating an account on GitHub.

github.com

https://github.com/smilegate-ai/HuLiC?fbclid=IwAR0jNYaQBTUfj8X8hbP_ihNXHFGnWLSWRfNOzP0X2r4pTqAIBfRLUPl33K8 

 

GitHub - smilegate-ai/HuLiC

Contribute to smilegate-ai/HuLiC development by creating an account on GitHub.

github.com

밑에 있는 데이터셋은 챗봇 관련 데이터이다.

 

Train과 Validaiton 데이터셋으로 구분되어 있고 총 약 15000개의 훈련데이터, 3737개의 val 데이터가 있었고 NaN도 없는 완전한 데이터이다.

 

클린~

 

약 18000개의 데이터를 더 얻었다.

 

728x90