trannguyenhan / preprocessing-data
Tiền xử lý dữ liệu tiếng Việt với 4 bước
☆13Updated 3 years ago
Alternatives and similar repositories for preprocessing-data:
Users that are interested in preprocessing-data are comparing it to the libraries listed below
- A Large-scale Vietnamese News Text Classification Corpus☆102Updated 5 years ago
- Source code for Zalo AI 2021 submission☆139Updated 3 years ago
- Những nội dung cơ bản về Machine Learning dành cho tất cả mọi người☆72Updated 4 years ago
- Không gian luyện tập và rèn luyện thuật toán.☆90Updated 2 years ago
- Pre-trained Word2Vec models for Vietnamese☆152Updated 4 years ago
- BARTpho: Pre-trained Sequence-to-Sequence Models for Vietnamese (INTERSPEECH 2022)☆101Updated 5 months ago
- 1st place solution for Zalo AI 2019 - Vietnamese Wiki Question Answering☆49Updated 5 years ago
- Corpus tiếng việt☆354Updated 7 months ago
- Vietnamese stopwords☆180Updated 2 years ago
- MTet: Multi-domain Translation for English and Vietnamese☆179Updated last year
- Sentiment classification for Vietnamese text using PhoBert☆98Updated 4 years ago
- Streaming data of Tiki with Kafka and processing with Spark, visualize with Elasticsearch & Kibana.☆11Updated 3 years ago
- Parse website and content extraction with jsoup☆9Updated 3 years ago
- Zalo AI chalenge Voice Gender classification (https://challenge.zalo.ai/)☆129Updated 6 years ago
- DANeS is an open-source E-newspaper dataset by collaboration between DATASET JSC (dataset.vn) and AIV Group (aivgroup.vn)☆66Updated 2 years ago
- ☆48Updated 5 years ago
- Thư viện chuẩn hóa văn bản Tiếng Việt☆177Updated last year
- Repository to track the progress in Vietnamese Natural Language Processing, including the datasets and the current state-of-the-art for t…☆350Updated 2 years ago
- Mô hình ngôn ngữ lớn cho người Việt☆60Updated last year
- Applied Phobert model by VinAI research for Vietnamese NER task on various dataset☆16Updated 2 years ago
- ☆32Updated 11 years ago
- crawler facebook comment☆22Updated 10 months ago
- ☆39Updated 5 years ago
- Từ điển Họ Tên trong Việt Nam☆93Updated last year
- Solution for Zalo AI Challenge 2022 - E2E Question Answering☆111Updated 2 years ago
- A large-scale dataset for Vietnamese hate speech detection☆22Updated last month
- ntc-scv is dataset of blogs on website https://streetcodevn.com☆25Updated 3 years ago
- Thư viện xữ lý chữ số dành riêng cho Tiếng Việt.☆75Updated 5 months ago
- Dịch máy giữa ngôn ngữ anh-viet☆51Updated 4 years ago
- Công cụ quét và phân tích từ khoá các trang báo mạng Việt Nam☆267Updated last year