KPF-bigkinds / BIGKINDS-LAB
데이터 분석가와 개발자를 위한 오픈소스 플랫폼으로 뉴스데이터와 타 분야 데이터를 융합할 수 있는 분석 및 개발 환경을 제공합니다. _Open source platform for data analysts and developers, Providing an analysis and development environment that can fuse news data with open data.
☆37Updated last year
Related projects: ⓘ
- 한국언론진흥재단 X 바이칼ai가 제작한 뉴스데이터 기반 형태소분석기 '바른(Bareun)' _Bareun, News Data-Based Morpheme Analyzer produced by Korea Press Foundation X Baikal…☆18Updated last year
- 한국어 뉴스의 긍정, 부정이 레이블링 된 금융 뉴스 문장 감성 분석 데이터셋 (finance sentiment corpus) 입니다.☆93Updated 10 months ago
- 자연어 처리와 텍스트 분석을 위한 오픈소스 파이썬 라이브러리 입니다.☆106Updated last year
- 대량의 네이버 뉴스 기사를 수집하는 라이브러리입니다.☆89Updated last year
- ☆72Updated 2 years ago
- 한국어 악성댓글 데이터셋☆70Updated 3 years ago
- 한국어 중의성 해소 평가 데이터 세트☆46Updated 11 months ago
- 유튜브 API를 이용하여 키워드에 따른 유튜브 영상 URL, 제목, 상세정보, 댓글, 자막을 크롤링합니다☆33Updated 2 years ago
- 파이썬 기초문법 부터 간단한 텍스트 분석을 수행하는 방법에 대해 다룹니다.☆27Updated 2 years ago
- KoBERTopic은 BERTopic을 한국어 데이터에 적용할 수 있도록 토크나이저와 BERT를 수정한 코드입니다.☆54Updated 2 years ago
- koGPT-2를 이용한 이야기 생성 AI☆78Updated 4 years ago
- Implementation TextRank and related utils☆84Updated 3 years ago
- Naver movie review sentiment classification with KoBERT☆76Updated last year
- Use Mecab Library(NLP Library) in Google Colab☆69Updated last year
- 세종 말뭉치 데이터를 정제하기 위한 utils☆36Updated 4 years ago
- 띄어쓰기 오류 교정 라이브러리입니다. CRF 와 같은 머신러닝 알고리즘이 아닌, 직관적인 접근법으로 띄어쓰기를 교정합니다.☆144Updated 4 years ago
- KoRean based SBERT pre-trained models (KR-SBERT) for PyTorch☆92Updated 2 years ago
- 파이썬 라이브러리를 활용해 텍스트 분석을 수행하는 방법에 대해 다룹니다.☆17Updated 2 years ago
- install & import하는 것만으로 matplotlib에서 한국어를 표시할 수 있습니다.☆52Updated 4 months ago
- Python library for keyword extraction☆39Updated 3 years ago
- 유튜브 댓글 크롤러 ( Python, BeautifulSoup, Selenium )☆35Updated 2 years ago
- 8K human in the loop hate speech dataset and 2.2K neutral sentences☆139Updated 2 years ago
- 모두의 한국어 텍스트 분석 with 파이썬☆30Updated 2 months ago
- BERT with SentencePiece for Korean text☆70Updated 4 years ago
- MeCab-Ko builds (Windows, macOS, and Linux)☆60Updated 2 weeks ago
- KSenticNet: 한국어 감성 사전☆33Updated 5 years ago
- BERT 기반의 문맥을 반영한 한국어 토픽 모델링 (BERT Contextualized Topic Models)☆37Updated 2 years ago
- Korean Online That-gul Emotions Dataset☆115Updated last year
- 한국어 개체명 정의 및 표지 표준화 기술보고서와 이를 기반으로 제작된 개체명 형태소 말뭉치☆90Updated 3 years ago
- (deprecated) 은전한닢 프로젝트와 mecab 기반의 한국어 형태소 분석기의 독립형 python 인터페이스☆59Updated 4 years ago