trannguyenhan / preprocessing-data
Tiền xử lý dữ liệu tiếng Việt với 4 bước
☆11Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for preprocessing-data
- Không gian luyện tập và rèn luyện thuật toán.☆88Updated 2 years ago
- Pre-trained Word2Vec models for Vietnamese☆152Updated 3 years ago
- Mô hình ngôn ngữ lớn cho người Việt☆60Updated last year
- Streaming data of Tiki with Kafka and processing with Spark, visualize with Elasticsearch & Kibana.☆11Updated 3 years ago
- Parse website and content extraction with jsoup☆9Updated 3 years ago
- Bài tập môn công nghệ web và dịch vụ trực tuyến☆11Updated 3 years ago
- A Large-scale Vietnamese News Text Classification Corpus☆101Updated 5 years ago
- Framework quét dữ liệu trên Internet hỗ trợ render javascript và quét đa nhiệm☆47Updated 2 years ago
- Những nội dung cơ bản về Machine Learning dành cho tất cả mọi người☆68Updated 4 years ago
- Thư viện xữ lý chữ số dành riêng cho Tiếng Việt.☆75Updated 3 months ago
- Vietnamese language model for spacy.io☆103Updated last year
- ☆25Updated 2 months ago
- Source code for Zalo AI 2021 submission☆136Updated 2 years ago
- Từ điển Họ Tên trong Việt Nam☆90Updated 10 months ago
- Vietnamese stopwords☆175Updated 2 years ago
- DANeS is an open-source E-newspaper dataset by collaboration between DATASET JSC (dataset.vn) and AIV Group (aivgroup.vn)☆65Updated 2 years ago
- Thư viện chuẩn hóa văn bản Tiếng Việt☆176Updated last year
- ☆39Updated 5 years ago
- Công cụ quét và phân tích từ khoá các trang báo mạng Việt Nam☆266Updated last year
- ☆28Updated last month
- MTet: Multi-domain Translation for English and Vietnamese☆176Updated last year
- Applied Phobert model by VinAI research for Vietnamese NER task on various dataset☆14Updated 2 years ago
- Sentiment classification for Vietnamese text using PhoBert☆96Updated 4 years ago
- Dịch máy giữa ngôn ngữ anh-viet☆49Updated 4 years ago
- Vietnamese sensitive words (including teencode) was created by ML algorithm☆61Updated 3 years ago
- Vietnamese Chatbot☆90Updated 7 months ago
- Pre-trained Word2Vec syllable- and word-level embeddings for Vietnamese☆49Updated last year
- Python Vietnamese Core NLP Toolkit☆245Updated last month
- The Rust Programming Language☆45Updated 10 months ago