Nkluge-correa / Tucano
Natively pre-trained open-source Portuguese language models.
☆48Updated this week
Alternatives and similar repositories for Tucano:
Users that are interested in Tucano are comparing it to the libraries listed below
- Code and documentation for the MariTalk API☆260Updated last week
- Code and data to evaluate LLMs on the ENEM, the main standardized Brazilian university admission exams.☆42Updated last month
- LegalNLP - Natural Language Processing Methods for the Brazilian Legal Language☆166Updated last year
- List of resources and tools developed with focus on Portuguese.☆255Updated 2 months ago
- A Natural Portuguese Language Benchmark (Napolab) for the evaluation of language models.☆65Updated 4 months ago
- Baixa processos e decisões do Tribunal de Justiça de São Paulo☆84Updated last month
- NLPortuguês - Aprenda PLN em português! Esse repositório contem os materiais e exercícios do curso NLPortuguês, hospedado tambem no cours…☆98Updated 10 months ago
- Fine-tuning OpenLlama-Instruct with portuguese data, for commercial use.☆19Updated last year
- ☆46Updated last year
- HateBR is the first large-scale expert annotated dataset of Brazilian Instagram comments for hate speech and offensive language detection…☆28Updated last month
- Portuguese Named Entity Recognition☆59Updated last year
- Gerador de DAGs no Apache Airflow para fazer clipping do Diário Oficial da União.☆100Updated this week
- Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los☆150Updated last month
- Curadoria dos melhores links compartilhados no grupo https://t.me/nlpbr no Telegram.☆12Updated 9 months ago
- A flexible normalizer for user-generated content☆60Updated this week
- ☆45Updated 2 months ago
- Este repositório não recebe atualizações | Queremos descobrir onde os diários oficiais das prefeituras de todo o Brasil estão sendo publi…☆44Updated 2 years ago
- Simplify your video editing workflow with Python 📹☆112Updated this week
- ☆15Updated last year
- Espaço para divulgação de vagas da area de data science☆144Updated last year
- Finetuning Stanford Alpaca (LLaMA) with Brazilian Portuguese data☆39Updated last year
- Judicial decisions' miner☆36Updated 2 months ago
- Scripts de captura para dados do Censo IBGE☆24Updated 5 months ago
- Explorador da Constituição: a Constituição Federal e suas Emendas acessíveis para o mundo da Ciência de Dados☆64Updated 4 years ago
- A Natural Language Processing’s roadmap for begginers☆47Updated 2 years ago
- Scraper do Portal da Transparência do Governo Federal, em Python 3☆51Updated 3 months ago
- O VEÍCULO COLABORATIVO SOBRE TRANSPARÊNCIA E OPEN DATA NO BRASIL.☆4Updated 10 months ago
- Linguistic Datasets for Portuguese: Lista de conjuntos de dados linguísticos para língua portuguesa com licença flexíveis: banco de dados…☆67Updated 4 years ago
- Este repositório não está recebendo atualizações | A platform for profiling public figures in Brazilian politics☆163Updated 2 years ago
- Dataset para análise de sentimentos na língua portuguesa com dados coletados do Twitter.☆67Updated 7 years ago