Nkluge-correa / Tucano
Natively pre-trained open-source Portuguese language models.
☆55Updated this week
Alternatives and similar repositories for Tucano:
Users that are interested in Tucano are comparing it to the libraries listed below
- Code and documentation for the MariTalk API☆266Updated this week
- Code and data to evaluate LLMs on the ENEM, the main standardized Brazilian university admission exams.☆45Updated 2 months ago
- A Natural Portuguese Language Benchmark (Napolab) for the evaluation of language models.☆66Updated 5 months ago
- Fine-tuning OpenLlama-Instruct with portuguese data, for commercial use.☆19Updated last year
- Baixa processos e decisões do Tribunal de Justiça de São Paulo☆87Updated 2 months ago
- ☆47Updated last year
- Gerador de DAGs no Apache Airflow para fazer clipping do Diário Oficial da União.☆102Updated 3 weeks ago
- List of resources and tools developed with focus on Portuguese.☆261Updated last week
- Related resources to the paper RoBERTaLexPT: A Legal RoBERTa Model pretrained with deduplication for Portuguese.☆20Updated 11 months ago
- LegalNLP - Natural Language Processing Methods for the Brazilian Legal Language☆167Updated last year
- A flexible normalizer for user-generated content☆61Updated this week
- Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los☆150Updated 2 months ago
- Wrapper para API de consulta do acervo do LexML☆40Updated 2 years ago
- Análise de sentimentos relacionados aos candidatos a Eleição para a presidência de 2018☆46Updated 3 years ago
- Portuguese Named Entity Recognition☆59Updated last year
- HateBR is the first large-scale expert annotated dataset of Brazilian Instagram comments for hate speech and offensive language detection…☆32Updated 3 weeks ago
- Scripts para baixar de forma automatizada as leis brasileiras disponíveis em sites de órgãos do governo☆14Updated 2 years ago
- Curadoria dos melhores links compartilhados no grupo https://t.me/nlpbr no Telegram.☆12Updated 10 months ago
- Mapeamento de iniciativas (e catálogos) de dados abertos governamentais no Brasil.☆257Updated 3 years ago
- NLPortuguês - Aprenda PLN em português! Esse repositório contem os materiais e exercícios do curso NLPortuguês, hospedado tambem no cours…☆99Updated 11 months ago
- Este repositório não recebe atualizações | Queremos descobrir onde os diários oficiais das prefeituras de todo o Brasil estão sendo publi…☆44Updated 2 years ago
- Este repositório não está recebendo atualizações | A platform for profiling public figures in Brazilian politics☆163Updated 2 years ago
- Brazilian city names and official codes, IBGE, LexML and others☆53Updated 4 years ago
- LeIA (Léxico para Inferência Adaptada) é um fork do léxico e ferramenta para análise de sentimentos VADER (Valence Aware Dictionary and s…☆122Updated last year
- Explorador da Constituição: a Constituição Federal e suas Emendas acessíveis para o mundo da Ciência de Dados☆68Updated 4 years ago
- O VEÍCULO COLABORATIVO SOBRE TRANSPARÊNCIA E OPEN DATA NO BRASIL.☆4Updated 11 months ago
- Mapeamento de aplicativos e visualizações que usam dados abertos governamentais no Brasil.☆61Updated 5 years ago
- Tutorial para colaboração no projeto Querido Diário☆29Updated last year
- Text processing repository to free brazilian municipal gazettes from closed file formats for the Querido Diário project.☆23Updated 3 months ago
- Base de acórdãos do Tribunal de Contas da União☆26Updated 2 years ago