suminb / hanja
한글, 한자 라이브러리
☆131Updated 2 months ago
Related projects ⓘ
Alternatives and complementary repositories for hanja
- An integrated library for Korean language preprocessing.☆202Updated last year
- 띄어쓰기 오류 교정 라이브러리입니다. CRF 와 같은 머신러닝 알고리즘이 아닌, 직관적인 접근법으로 띄어쓰기를 교정합니다.☆146Updated 5 years ago
- Korean wiki QA dataset for MRC☆122Updated 8 months ago
- English to Korean Transliteration (영어-한글 표기 변환기)☆151Updated 2 years ago
- 세종 말뭉치 데이터를 정제하기 위한 utils☆36Updated 5 years ago
- 한국어 개체명 정의 및 표지 표준화 기술보고서와 이를 기반으로 제작된 개체명 형태소 말뭉치☆90Updated 3 years ago
- Customized KoNLPy - Korean Natural Language Processing Toolkit KoNLPy wrapping code☆126Updated 5 years ago
- Korean sejong corpus download and simple analysis☆138Updated 5 years ago
- 국내 자연어 처리 기술을 연구 및 개발하는 스타트업 목록☆165Updated 4 years ago
- LexRank for Korean.☆63Updated 3 years ago
- 8K human in the loop hate speech dataset and 2.2K neutral sentences☆141Updated 2 years ago
- Python library for keyword extraction☆39Updated 3 years ago
- (deprecated) 은전한닢 프로젝트와 mecab 기반의 한국어 형태소 분석기의 독립형 python 인터페이 스☆59Updated 4 years ago
- 한국어 문장 띄어쓰기(삭제/추가) 모델입니다. 데이터 준비 후 직접 학습이 가능하도록 작성하였습니다.☆56Updated 2 years ago
- Split Korean text into sentences using heuristic algorithm.☆209Updated 3 years ago
- Hangulize transcribes non-Korean words into Hangul☆230Updated last year
- Korean Alphabet Transcription☆213Updated 6 years ago
- 자연어 처리와 텍스트 분석을 위한 오픈소스 파이썬 라이브러리 입니다.☆107Updated last year
- Hangul syllable decomposition and synthesis using jamo.☆103Updated 2 years ago
- SmartyPants for Korean language☆131Updated last week
- 한국어 중의성 해소 평가 데이터 세트☆46Updated last year
- koGPT-2를 이용한 이야기 생성 AI☆78Updated 4 years ago
- MeCab-Ko builds (Windows, macOS, and Linux)☆63Updated 2 months ago
- A BERT-based reverse dictionary of Korean proverbs☆96Updated last year
- A python binding for mecab-ko☆94Updated 3 months ago
- TextRank for Korean.☆209Updated 3 years ago
- 국립국어원 표준국어대사전 표제어 DB☆64Updated 5 years ago
- BERT with SentencePiece for Korean text☆70Updated 4 years ago
- Korean Online That-gul Emotions Dataset☆117Updated last year