개인적으로 수집한 한국어 NLP용 말뭉치 모음
☆139Sep 15, 2020Updated 5 years ago
Alternatives and similar repositories for corpus
Users that are interested in corpus are comparing it to the libraries listed below
Sorting:
- 초성 해석기 based on ko-BART☆29Mar 31, 2021Updated 4 years ago
- KB국민은행에서 제공하는 경제/금융 도메인에 특화된 한국어 ALBERT 모델☆241Oct 7, 2021Updated 4 years ago
- 한국어 악성댓글 데이터셋☆73Sep 26, 2020Updated 5 years ago
- Training Transformers of Huggingface with KoNLPy☆68Aug 28, 2020Updated 5 years ago
- https://ailabs.enliple.com/☆105Feb 25, 2021Updated 5 years ago
- 2019 국어경진대회 한국어 의존구문 분석 대상(문체부 장관상)☆15Oct 26, 2022Updated 3 years ago
- Korean Nested Named Entity Corpus☆20May 13, 2023Updated 2 years ago
- Pretrained ELECTRA Model for Korean☆631Feb 19, 2024Updated 2 years ago
- 한국어 데이터 세트 링크☆905Oct 14, 2024Updated last year
- 🤗 Pretrained BERT model & WordPiece tokenizer trained on Korean Comments 한국어 댓글로 프리트레이닝한 BERT 모델과 데이터셋☆496Nov 7, 2022Updated 3 years ago
- Wikitext format dataset of Namuwiki (Most famous Korean wikipedia)☆53Oct 25, 2020Updated 5 years ago
- Convert Numerical Representations to Korean Pronunciation☆14Apr 20, 2020Updated 5 years ago
- KSenticNet: 한국어 감성 사전☆33May 20, 2019Updated 6 years ago
- 한국어 개체명 정의 및 표지 표준화 기술보고서와 이를 기반으로 제작된 개체명 형태소 말뭉치☆94Jan 25, 2021Updated 5 years ago
- #Paired Question☆24Jun 16, 2020Updated 5 years ago
- 한국어 뉴스의 긍정, 부정이 레이블링 된 금융 뉴스 문장 감성 분석 데이터셋 (finance sentiment corpus) 입니다.☆109Nov 3, 2023Updated 2 years ago
- ☆11Oct 3, 2021Updated 4 years ago
- 모두의 말뭉치 데이터를 분석에 편리한 형태로 변환하는 기능을 제공합니다.☆11Mar 2, 2022Updated 4 years ago
- Open Korean NLP Dataset Curation for the Users All Around the Globe☆152Nov 18, 2023Updated 2 years ago
- MeCab model trained with OpenKorPos.☆23Jun 19, 2022Updated 3 years ago
- 🤗 Korean Comments ELECTRA: 한국어 댓글로 학습한 ELECTRA 모델☆261Nov 7, 2022Updated 3 years ago
- 문장단위로 분절된 한국어 위키피디아 코퍼스. Releases에서 다운로드 받거나 tfds-korean으로 사용해주세요.☆24Sep 6, 2023Updated 2 years ago
- 🦛 파이썬 한글 처리 라이브러리. Python Korean Morphological Analyzer☆19Feb 4, 2025Updated last year
- Korean Moview Review Emotion (KMRE) Dataset☆21Sep 7, 2020Updated 5 years ago
- Korean corpus repository☆743Oct 3, 2022Updated 3 years ago
- 세종 구문 분석 말뭉치의 의존 구문 구조로의 변환 도구☆10Sep 7, 2018Updated 7 years ago
- Sentence Embeddings using Siamese ETRI KoBERT☆163Aug 16, 2025Updated 6 months ago
- KoGPT2 on Huggingface Transformers☆33May 4, 2021Updated 4 years ago
- Korean BART☆464Jun 14, 2025Updated 8 months ago
- Bias, Hate classification with KoELECTRA 👿☆27Jun 12, 2023Updated 2 years ago
- 대량의 네이버 뉴스 기사를 수집하는 라이브러리입니다.☆97Feb 3, 2023Updated 3 years ago
- Naver sentiment movie corpus☆598Mar 7, 2017Updated 8 years ago
- BERTScore for Korean☆80Feb 22, 2024Updated 2 years ago
- Korean large emotion labeled dataset (EmoNSMC)☆14Mar 5, 2020Updated 5 years ago
- KoRean based BERT pre-trained models (KR-BERT) for Tensorflow and PyTorch☆212Apr 24, 2024Updated last year
- Use Mecab Library(NLP Library) in Google Colab☆77Jul 15, 2023Updated 2 years ago
- An integrated library for Korean language preprocessing.☆204Apr 23, 2023Updated 2 years ago
- ☆19Jan 17, 2021Updated 5 years ago
- KSS: Korean String processing Suite☆468Nov 13, 2025Updated 3 months ago