Nkluge-correa / Tucano
Natively pre-trained open-source Portuguese language models.
☆57Updated last month
Alternatives and similar repositories for Tucano:
Users that are interested in Tucano are comparing it to the libraries listed below
- Code and documentation for the MariTalk API☆275Updated last week
- Code and data to evaluate LLMs on the ENEM, the main standardized Brazilian university admission exams.☆45Updated 3 months ago
- Fine-tuning OpenLlama-Instruct with portuguese data, for commercial use.☆19Updated last year
- Curadoria dos melhores links compartilhados no grupo https://t.me/nlpbr no Telegram.☆12Updated 11 months ago
- List of resources and tools developed with focus on Portuguese.☆266Updated last month
- NLPortuguês - Aprenda PLN em português! Esse repositório contem os materiais e exercícios do curso NLPortuguês, hospedado tambem no cours …☆100Updated last year
- LegalNLP - Natural Language Processing Methods for the Brazilian Legal Language☆167Updated last year
- Linguistic Datasets for Portuguese: Lista de conjuntos de dados linguísticos para língua portuguesa com licença flexíveis: banco de dados…☆70Updated 4 years ago
- HateBR is the first large-scale expert annotated dataset of Brazilian Instagram comments for hate speech and offensive language detection…☆32Updated last month
- Baixa processos e decisões do Tribunal de Justiça de São Paulo☆90Updated 3 weeks ago
- Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los☆152Updated 3 months ago
- ☆48Updated 2 years ago
- Finetuning Stanford Alpaca (LLaMA) with Brazilian Portuguese data☆39Updated last year
- ♠️TrucoBench: Qual é o melhor LLM no truco? Resultados, análises e insights estratégicos.☆18Updated last month
- Explorador da Constituição: a Constituição Federal e suas Emendas acessíveis para o mundo da Ciência de Dados☆68Updated 4 years ago
- Portuguese Named Entity Recognition☆59Updated last year
- Simplify your video editing workflow with Python 📹☆123Updated last month
- Related resources to the paper RoBERTaLexPT: A Legal RoBERTa Model pretrained with deduplication for Portuguese.☆20Updated last year
- A flexible normalizer for user-generated content☆62Updated last week
- Repositório contendo implementações e modelos prontos para utilização em projetos de língua portuguesa (pt-br)☆13Updated 3 weeks ago
- Projeto de Data Science completo no Databricks☆34Updated 7 months ago
- ☆38Updated 11 months ago
- A pair of tiny foundational models trained in Brazilian Portuguese.🦙🦙☆34Updated 2 months ago
- LeIA (Léxico para Inferência Adaptada) é um fork do léxico e ferramenta para análise de sentimentos VADER (Valence Aware Dictionary and s…☆123Updated last year
- Este repositório não está recebendo atualizações | A platform for profiling public figures in Brazilian politics☆163Updated 2 years ago
- ☆50Updated last month
- Gerador de DAGs no Apache Airflow para fazer clipping do Diário Oficial da União.☆103Updated 2 weeks ago
- O VEÍCULO COLABORATIVO SOBRE TRANSPARÊNCIA E OPEN DATA NO BRASIL.☆4Updated last year
- We introduce the Fake.Br Corpus, which is composed of aligned true and fake news written in Brazilian Portuguese.☆172Updated 4 years ago
- Text processing repository to free brazilian municipal gazettes from closed file formats for the Querido Diário project.☆23Updated 4 months ago