trannguyenhan / preprocessing-data
Tiền xử lý dữ liệu tiếng Việt với 4 bước
☆13Updated 3 years ago
Alternatives and similar repositories for preprocessing-data:
Users that are interested in preprocessing-data are comparing it to the libraries listed below
- Streaming data of Tiki with Kafka and processing with Spark, visualize with Elasticsearch & Kibana.☆11Updated 3 years ago
- Parse website and content extraction with jsoup☆9Updated 3 years ago
- Không gian luyện tập và rèn luyện thuật toán.☆89Updated 2 years ago
- Bài tập môn công nghệ web và dịch vụ trực tuyến☆11Updated 3 years ago
- Dịch máy giữa ngôn ngữ anh-viet☆51Updated 4 years ago
- Sentiment classification for Vietnamese text using PhoBert☆99Updated 4 years ago
- Pre-trained Word2Vec models for Vietnamese☆154Updated 4 years ago
- Applied Phobert model by VinAI research for Vietnamese NER task on various dataset☆16Updated 2 years ago
- BARTpho: Pre-trained Sequence-to-Sequence Models for Vietnamese (INTERSPEECH 2022)☆102Updated 6 months ago
- Những nội dung cơ bản về Machine Learning dành cho tất cả mọi người☆76Updated 4 years ago
- Source code for Zalo AI 2021 submission☆139Updated 3 years ago
- Thư viện chuẩn hóa văn bản Tiếng Việt☆177Updated last year
- A Large-scale Vietnamese News Text Classification Corpus☆101Updated 5 years ago
- ☆32Updated 11 years ago
- Vietnamese stopwords☆180Updated 2 years ago
- ☆39Updated 5 years ago
- Pre-trained Word2Vec syllable- and word-level embeddings for Vietnamese☆51Updated last year
- Repository to track the progress in Vietnamese Natural Language Processing, including the datasets and the current state-of-the-art for t…☆353Updated 2 years ago
- DANeS is an open-source E-newspaper dataset by collaboration between DATASET JSC (dataset.vn) and AIV Group (aivgroup.vn)☆66Updated 2 years ago
- Từ điển Họ Tên trong Việt Nam☆93Updated last year
- Vietnamese Chatbot☆92Updated 10 months ago
- vietnamese OCR☆135Updated 5 years ago
- Mô hình ngôn ngữ lớn cho người Việt☆60Updated last year
- Leverage Deep Learning to digitize old Vietnamese handwritten for historical document archiving (Made with national pride in every single…☆123Updated 8 months ago
- Cải thiện Elasticsearch trong bài toán semantic search sử dụng phương pháp Sentence Embeddings☆25Updated 3 years ago
- Vietnamese Dictionary☆83Updated 6 years ago
- attention tutorial for beginer☆37Updated 5 years ago
- A Robustly Optimized BERT Pretraining Approach for Vietnamese☆31Updated 6 months ago
- Jupyter Notebook cung cấp các kiến thức cơ bản về Học Máy và Học Sâu bằng Python với Scikit-Learn, Keras, và TensorFlow 2.☆204Updated last year
- Solution for Zalo AI Challenge 2022 - E2E Question Answering☆111Updated 2 years ago