bab2min / corpusLinks
개인적으로 수집한 한국어 NLP용 말뭉치 모음
☆134Updated 4 years ago
Alternatives and similar repositories for corpus
Users that are interested in corpus are comparing it to the libraries listed below
Sorting:
- 한국어 자연어처리 튜토리얼☆117Updated 4 years ago
- KB국민은행에서 제공하는 경제/금융 도메인에 특화된 한국어 ALBERT 모델☆236Updated 3 years ago
- 🤗 Korean Comments ELECTRA: 한국어 댓글로 학습한 ELECTRA 모델☆252Updated 2 years ago
- 국내 자연어 처리 기술을 연구 및 개발하는 스타트업 목록☆166Updated 5 years ago
- 대량의 네이버 뉴스 기사를 수집하는 라이브러리입니다.☆94Updated 2 years ago
- Jiphyeonjeon Season 1☆179Updated 4 years ago
- KNU(케이앤유) 한국어 감성사전☆156Updated 3 years ago
- Korean wiki QA dataset for MRC☆121Updated last year
- OOV없이 빠르고 정확한 한국어 Embedding 라이브러리☆224Updated 6 years ago
- Korean Language Model을 이용한 심리상담 대화 언어 모델☆209Updated 2 years ago
- Implementation TextRank and related utils☆85Updated 3 years ago
- 🔥 Korean GPT-2, KoGPT2 FineTuning cased. 한국어 가사 데이터 학습 🔥☆226Updated 3 months ago
- BERT with SentencePiece for Korean text☆72Updated 5 years ago
- 띄어쓰기 오류 교정 라이브러리입니다. CRF 와 같은 머신러닝 알고리즘이 아닌, 직관적인 접근법으로 띄어쓰기를 교정합니다.☆150Updated 5 years ago
- KoBERT on 🤗 Huggingface Transformers 🤗 (with Bug Fixed)☆211Updated 11 months ago
- This repository provides list of Korean NLP papers.☆203Updated 5 years ago
- Naver movie review sentiment classification with KoBERT☆76Updated 2 years ago
- KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding☆308Updated 2 years ago
- KoBertSum은 BertSum모델을 한국어 데이터에 적용할 수 있도록 수정한 한국어 요약 모델입니다.☆83Updated 3 years ago
- Sentence Embeddings using Siamese SKT KoBERT-Networks☆141Updated 2 years ago
- Split Korean text into sentences using heuristic algorithm.☆214Updated 4 years ago
- Korean HateSpeech Dataset☆386Updated 5 years ago
- Distillation of KoBERT from SKTBrain (Lightweight KoBERT)☆195Updated last year
- 텐서플로2와 머신러닝으로 시작하는 자연어처리 (로지스틱회귀부터 BERT와 GPT3까지) 실습자료☆274Updated 2 years ago
- koGPT-2를 이용한 이야기 생성 AI☆77Updated 5 years ago
- Summarization module based on KoBART☆202Updated last year
- 한국어 악성댓글 데이터셋☆73Updated 4 years ago
- 🦅 Pretrained BigBird Model for Korean (up to 4096 tokens)☆202Updated last year
- Sentence Embeddings using Siamese ETRI KoBERT-Networks☆163Updated last year
- (deprecated) 은전한닢 프로젝트와 mecab 기반의 한국어 형태소 분석기의 독립형 python 인터페이스☆60Updated 5 years ago