trannguyenhan / preprocessing-dataLinks
Tiền xử lý dữ liệu tiếng Việt với 4 bước
☆14Updated 3 years ago
Alternatives and similar repositories for preprocessing-data
Users that are interested in preprocessing-data are comparing it to the libraries listed below
Sorting:
- Những nội dung cơ bản về Machine Learning dành cho tất cả mọi người☆82Updated 4 years ago
- Không gian luyện tập và rèn luyện thuật toán.☆90Updated 3 years ago
- Source code for Zalo AI 2021 submission☆141Updated 3 years ago
- Pre-trained Word2Vec syllable- and word-level embeddings for Vietnamese☆53Updated last year
- Thư viện chuẩn hóa văn bản Tiếng Việt☆178Updated last month
- BARTpho: Pre-trained Sequence-to-Sequence Models for Vietnamese (INTERSPEECH 2022)☆105Updated 11 months ago
- Streaming data of Tiki with Kafka and processing with Spark, visualize with Elasticsearch & Kibana.☆11Updated 3 years ago
- Pre-trained Word2Vec models for Vietnamese☆157Updated 4 years ago
- Framework quét dữ liệu trên Internet hỗ trợ render javascript và quét đa nhiệm☆47Updated 2 years ago
- A Large-scale Vietnamese News Text Classification Corpus☆104Updated 5 years ago
- Parse website and content extraction with jsoup☆9Updated 3 years ago
- A large-scale dataset for Vietnamese hate speech detection☆28Updated 2 months ago
- Sentiment classification for Vietnamese text using PhoBert☆98Updated 4 years ago
- Dịch máy giữa ngôn ngữ anh-viet☆51Updated 5 years ago
- Repository to track the progress in Vietnamese Natural Language Processing, including the datasets and the current state-of-the-art for t…☆361Updated 2 years ago
- Thư viện xữ lý chữ số dành riêng cho Tiếng Việt.☆75Updated 4 months ago
- Corpus tiếng việt☆360Updated last year
- ☆23Updated 2 years ago
- Vietnamese language model for spacy.io☆111Updated last year
- Zalo AI chalenge Voice Gender classification (https://challenge.zalo.ai/)☆131Updated 6 years ago
- 1st place solution for Zalo AI 2019 - Vietnamese Wiki Question Answering☆48Updated 5 years ago
- Vietnamese question answering system with BERT☆117Updated 2 years ago
- A Python wrapper for VnCoreNLP using a bidirectional communication channel.☆56Updated 6 years ago
- Mô hình ngôn ngữ lớn cho người Việt☆61Updated last year
- Vietnamese stopwords☆184Updated 2 years ago
- Cải thiện Elasticsearch trong bài toán semantic search sử dụng phương pháp Sentence Embeddings☆25Updated 4 years ago
- hBook Bí kíp luyện Lập trình nhập môn với Python☆67Updated 4 years ago
- Jupyter Notebook cung cấp các kiến thức cơ bản về Học Máy và Học Sâu bằng Python với Scikit-Learn, Keras, và TensorFlow 2.☆208Updated 2 years ago
- A Robustly Optimized BERT Pretraining Approach for Vietnamese☆32Updated 11 months ago
- code and dataset☆150Updated 5 years ago