datasets-br / unitex-pt-br
The Brazilian Portuguese language, Unitex primary sources for the vocabulary and dictionary definitions
☆20Updated 7 years ago
Alternatives and similar repositories for unitex-pt-br:
Users that are interested in unitex-pt-br are comparing it to the libraries listed below
- Linguistic Datasets for Portuguese: Lista de conjuntos de dados linguísticos para língua portuguesa com licença flexíveis: banco de dados…☆70Updated 4 years ago
- OpenWordnet-PT: an open access wordnet for Portuguese☆155Updated 9 months ago
- Portuguese Word Embeddings: Evaluating on Word Analogies and Natural Language Tasks☆244Updated last year
- Corpus do Idioma Português e Modelos☆26Updated 7 years ago
- nosso Querido Diário Oficial☆18Updated 7 years ago
- Portuguese Named Entity Recognition☆59Updated last year
- A flexible normalizer for user-generated content☆61Updated this week
- Base de acórdãos do Tribunal de Contas da União☆26Updated 2 years ago
- This Universal Dependencies (UD) Portuguese treebank.☆50Updated 3 months ago
- Dataset para análise de sentimentos na língua portuguesa com dados coletados do Twitter.☆66Updated 7 years ago
- pt-BR Corpus with the Wikipedia dump☆26Updated 4 years ago
- Wrapper para API de consulta do acervo do LexML☆40Updated 2 years ago
- Uma interface para acessar o analisador morfológico do CoGrOO em Python.☆37Updated 2 years ago
- Mapeamento de aplicativos e visualizações que usam dados abertos governamentais no Brasil.☆61Updated 5 years ago
- Classifica nomes por gênero de acordo com API do IBGE☆49Updated 5 years ago
- Portuguese stopwords collection☆58Updated 8 years ago
- We introduce the Fake.Br Corpus, which is composed of aligned true and fake news written in Brazilian Portuguese.☆172Updated 4 years ago
- Python Library for Natural Language Processing for Portuguese Language☆15Updated 8 years ago
- Scripts para baixar de forma automatizada as leis brasileiras disponíveis em sites de órgãos do governo☆14Updated 2 years ago
- Implementação e modelo gerado com o treinamento (trigram) da wikipedia em pt-br☆38Updated 7 years ago
- Análise de sentimentos relacionados aos candidatos a Eleição para a presidência de 2018☆46Updated 3 years ago
- A Lemmatizer for Portuguese☆32Updated 5 years ago
- Geographic Information Systems (GIS) Dataset Brasil - Coleção de shapefiles, GeoJSON e TopoJSON prontas para uso☆147Updated 2 years ago
- Tutorial para acessar a API do Sistema de Orçamento e Finanças _SOF da cidade de São Paulo, utilizando Python e a biblioteca Pandas, real…☆32Updated 6 years ago
- Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los☆150Updated 2 months ago
- Dados em formato aberto sobre municípios e unidades federativas do Brasil.☆99Updated last year
- Implementation of a BERT model to Classify Hate Speech on Social Media☆33Updated 4 years ago
- Tagger treinado para reconhecer palavras do Português☆41Updated 5 years ago
- A list of libraries and NLP projects for Portuguese☆19Updated 7 years ago
- LegalNLP - Natural Language Processing Methods for the Brazilian Legal Language☆167Updated last year