gustrd / cabra
Fine-tuning OpenLlama-Instruct with portuguese data, for commercial use.
☆19Updated last year
Alternatives and similar repositories for cabra:
Users that are interested in cabra are comparing it to the libraries listed below
- Natively pre-trained open-source Portuguese language models.☆55Updated this week
- Code and data to evaluate LLMs on the ENEM, the main standardized Brazilian university admission exams.☆45Updated 2 months ago
- Extrator de entidades mencionadas em notícias da mídia☆14Updated 3 years ago
- HateBR is the first large-scale expert annotated dataset of Brazilian Instagram comments for hate speech and offensive language detection…☆32Updated 3 weeks ago
- Code and documentation for the MariTalk API☆266Updated this week
- Text processing repository to free brazilian municipal gazettes from closed file formats for the Querido Diário project.☆23Updated 3 months ago
- Este repositório não está recebendo atualizações | A platform for profiling public figures in Brazilian politics☆163Updated 2 years ago
- Curadoria dos melhores links compartilhados no grupo https://t.me/nlpbr no Telegram.☆12Updated 10 months ago
- Tutorial para colaboração no projeto Querido Diário☆29Updated last year
- Scripts para baixar de forma automatizada as leis brasileiras disponíveis em sites de órgãos do governo☆14Updated 2 years ago
- O VEÍCULO COLABORATIVO SOBRE TRANSPARÊNCIA E OPEN DATA NO BRASIL.☆4Updated 11 months ago
- ☆137Updated last year
- ☆15Updated last year
- Linguagem Potigol - Linguagem de programação funcional moderna para iniciantes - A Functional Programming Language for Beginners☆252Updated 8 months ago
- Related resources to the paper RoBERTaLexPT: A Legal RoBERTa Model pretrained with deduplication for Portuguese.☆20Updated 11 months ago
- Dataset para análise de sentimentos na língua portuguesa com dados coletados do Twitter.☆66Updated 7 years ago
- Classifica nomes por gênero de acordo com API do IBGE☆49Updated 5 years ago
- We introduce the Fake.Br Corpus, which is composed of aligned true and fake news written in Brazilian Portuguese.☆172Updated 4 years ago
- Python library + CLI to easily access YouTube Data API in batches + scraping☆63Updated 4 months ago
- A Natural Portuguese Language Benchmark (Napolab) for the evaluation of language models.☆66Updated 5 months ago
- Notebooks from Operação Serenata de Amor | ** Este repositório não recebe atualizações frequentes **☆52Updated 4 years ago
- Tool to monitor Brazilian legislators expenses while in the exercise of their mandates☆136Updated 5 years ago
- ☆47Updated last year
- Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los☆150Updated 2 months ago
- ☆91Updated 2 years ago
- Este repositório não recebe atualizações | Queremos descobrir onde os diários oficiais das prefeituras de todo o Brasil estão sendo publi…☆44Updated 2 years ago
- A flexible normalizer for user-generated content☆61Updated this week
- Espaço para compartilhamento de empresas de tecnologia na cidade de Goiânia e região e suas fontes de vagas.☆31Updated 3 years ago
- ☆53Updated 8 years ago
- Análises e tutoriais das bases de dados abertos da Secretaria Municipal de Educação em formato aberto☆57Updated 5 years ago