avanco / UGCNormalLinks
Normalizer tool for user-generated content (Brazilian Portuguese)
☆13Updated 3 years ago
Alternatives and similar repositories for UGCNormal
Users that are interested in UGCNormal are comparing it to the libraries listed below
Sorting:
- A flexible normalizer for user-generated content☆63Updated last month
- Tagger treinado para reconhecer palavras do Português☆41Updated 5 years ago
- Corpus do Idioma Português e Modelos☆26Updated 7 years ago
- Portuguese Word Embeddings: Evaluating on Word Analogies and Natural Language Tasks☆248Updated last year
- Named entity extraction from Portuguese web text☆71Updated 7 years ago
- ☆21Updated 6 years ago
- Portuguese Named Entity Recognition☆59Updated last year
- A Hierarchically-Labeled Portuguese Hate Speech Dataset☆33Updated 6 years ago
- Emotion Recognition from Brazilian Portuguese Informal Spontaneous Speech☆18Updated 3 years ago
- Linguistic Datasets for Portuguese: Lista de conjuntos de dados linguísticos para língua portuguesa com licença flexíveis: banco de dados…☆74Updated 4 years ago
- Códigos utilizados para pesquisar sobre bots em perfis do Twitter☆48Updated 6 years ago
- Análise de sentimentos relacionados aos candidatos a Eleição para a presidência de 2018☆47Updated 3 years ago
- Notebooks from Operação Serenata de Amor | ** Este repositório não recebe atualizações frequentes **☆52Updated 4 years ago
- 🌎 Data collection of geographical divisions of Brazil by IBGE☆38Updated last year
- Biblioteca Python com scrapers para acessar dados do mercado financeiro brasileiro (fundos imobiliários, CRAs, CRIs, debêntures, negociaç…☆20Updated this week
- Uma interface para acessar o analisador morfológico do CoGrOO em Python.☆38Updated 2 years ago
- We introduce the Fake.Br Corpus, which is composed of aligned true and fake news written in Brazilian Portuguese.☆177Updated 4 years ago
- Implementação e modelo gerado com o treinamento (trigram) da wikipedia em pt-br☆38Updated 8 years ago
- Superseeded by https://github.com/staticdev/human-readable☆9Updated 4 years ago
- Portuguese stopwords collection☆61Updated 8 years ago
- Code for training and evaluating T5 on Portuguese data.☆86Updated 2 years ago
- This is a legacy repo. Dev occurs now on GitHub.☆11Updated 4 years ago
- Wrapper para a API da Câmara dos Deputados do Brasil || A wrapper for Brazil's House of Representatives API☆26Updated 2 years ago
- Python library + CLI to easily access YouTube Data API in batches + scraping☆66Updated 8 months ago
- A web crawler that collects data about characters from Netflix's Dark serie☆19Updated 3 years ago
- DicSin - Dicionário de Sinônimos Português Brasil☆21Updated 7 years ago
- A Lemmatizer for Portuguese☆32Updated 6 years ago
- Base dos discursos dos deputados federais de 2003 a 2017☆13Updated 7 years ago
- Análises e tutoriais das bases de dados abertos da Secretaria Municipal de Educação em formato aberto☆56Updated 5 years ago
- pt-BR Corpus with the Wikipedia dump☆26Updated 5 years ago