kaniblu / hangul-utilsLinks
An integrated library for Korean language preprocessing.
☆205Updated 2 years ago
Alternatives and similar repositories for hangul-utils
Users that are interested in hangul-utils are comparing it to the libraries listed below
Sorting:
- Split Korean text into sentences using heuristic algorithm.☆215Updated 5 years ago
- Korean sejong corpus download and simple analysis☆144Updated 6 years ago
- 국내 자연어 처리 기술을 연구 및 개발하는 스타트업 목록☆166Updated 5 years ago
- 띄어쓰기 오류 교정 라이브러리입니다. CRF 와 같은 머신러닝 알고리즘이 아닌, 직관적인 접근법으로 띄어쓰기를 교정합니다.☆150Updated 6 years ago
- Korean wiki QA dataset for MRC☆121Updated last year
- NLP Shared tasks (NER, SRL) using NSML☆182Updated 6 years ago
- 개인적으로 수집한 한국어 NLP용 말뭉치 모음☆138Updated 5 years ago
- https://ailabs.enliple.com/☆105Updated 4 years ago
- OOV없이 빠르고 정확한 한국어 Embedding 라이브러리☆224Updated 7 years ago
- Korean HateSpeech Dataset☆393Updated 5 years ago
- This repository provides list of Korean NLP papers.☆202Updated 5 years ago
- KorNLI and KorSTS: New Benchmark Datasets for Korean Natural Language Understanding☆311Updated 2 years ago
- (deprecated) 은전한닢 프로젝트와 mecab 기반의 한국어 형태소 분석기의 독립형 python 인터페이스☆60Updated 5 years ago
- KoalaNLP = Korean + Scala + NLP. 한국어 형태소 및 구문 분석기의 모음입니다.☆219Updated 4 years ago
- Intonation-aided intention identification for Korean☆84Updated 3 years ago
- 🔥 Korean GPT-2, KoGPT2 FineTuning cased. 한국어 가사 데이터 학습 🔥☆226Updated 8 months ago
- A python binding for mecab-ko☆110Updated last year
- BERT with SentencePiece for Korean text☆71Updated 5 years ago
- (한국어) 텍스트 마이닝을 위한 공부거리들☆202Updated 5 years ago
- Distillation of KoBERT from SKTBrain (Lightweight KoBERT)☆196Updated 2 years ago
- 한국어 악성댓글 데이터셋☆73Updated 5 years ago
- Open Korean NLP Dataset Curation for the Users All Around the Globe☆152Updated 2 years ago
- 세종 말뭉치 데이터를 정제하기 위한 utils☆36Updated 6 years ago
- 문장의 욕설 여부를 분류한 한글 데이터셋입니다.☆116Updated 5 years ago
- 한글 자모 분리/조합 작업을 위한 툴킷☆299Updated last year
- 한국어 개체명 정의 및 표지 표준화 기술보고서와 이를 기반으로 제작된 개체명 형태소 말뭉치☆94Updated 4 years ago
- English to Korean Transliteration (영어-한글 표기 변환기)☆156Updated 3 years ago
- GPT-2 pretrained on Korean datasets.☆54Updated 4 years ago
- koGPT-2를 이용한 이야기 생성 AI☆77Updated 5 years ago
- KoRean based BERT pre-trained models (KR-BERT) for Tensorflow and PyTorch☆210Updated last year