gustrd / cabra
Fine-tuning OpenLlama-Instruct with portuguese data, for commercial use.
☆18Updated last year
Related projects: ⓘ
- Extrator de entidades mencionadas em notícias da mídia☆14Updated 3 years ago
- Code and data to evaluate LLMs on the ENEM, the main standardized Brazilian university admission exams.☆34Updated 9 months ago
- HateBR is the first large-scale expert annotated dataset of Brazilian Instagram comments for hate speech and offensive language detection…☆25Updated 2 weeks ago
- Code and documentation for the MariTalk API☆245Updated this week
- Scraper do Portal da Transparência do Governo Federal, em Python 3☆51Updated last month
- Linguistic Datasets for Portuguese: Lista de conjuntos de dados linguísticos para língua portuguesa com licença flexíveis: banco de dados…☆63Updated 3 years ago
- A platform for profiling public figures in Brazilian politics☆162Updated 2 years ago
- Scripts para baixar de forma automatizada as leis brasileiras disponíveis em sites de órgãos do governo☆14Updated last year
- Scripts de captura para dados do Censo IBGE☆22Updated last month
- A framework for few-shot evaluation of language models.☆10Updated 2 weeks ago
- Finetuning Stanford Alpaca (LLaMA) with Brazilian Portuguese data☆39Updated last year
- ☆15Updated 8 months ago
- Dataset para análise de sentimentos na língua portuguesa com dados coletados do Twitter.☆67Updated 6 years ago
- A Natural Portuguese Language Benchmark (Napolab) for the evaluation of language models.☆63Updated 3 weeks ago
- Scripts para capturar dados do Repositório de Dados Eleitorais do TSE, limpá-los, normalizá-los e agrupá-los☆146Updated this week
- Portuguese Named Entity Recognition☆59Updated 11 months ago
- A flexible normalizer for user-generated content☆57Updated 2 weeks ago
- Brasil TTS é um conjunto de sintetizadores de voz, em português do Brasil, que lê telas para portadores de deficiência visual. Transforma…☆52Updated 3 years ago
- Notebooks from Operação Serenata de Amor | ** Este repositório não recebe atualizações frequentes **☆53Updated 4 years ago
- Implementation of a BERT model to Classify Hate Speech on Social Media☆33Updated 4 years ago
- Curadoria dos melhores links compartilhados no grupo https://t.me/nlpbr no Telegram.☆12Updated 5 months ago
- Related resources to the paper RoBERTaLexPT: A Legal RoBERTa Model pretrained with deduplication for Portuguese.☆16Updated 6 months ago
- Análises e tutoriais das bases de dados abertos da Secretaria Municipal de Educação em formato aberto☆57Updated 4 years ago
- Visualização gráfica de relacionamentos entre sócios e empresas com dados públicos de CNPJ.☆184Updated last week
- Text processing repository to free brazilian municipal gazettes from closed file formats for the Querido Diário project.☆17Updated last week
- Contains decisions from Supremo Tribunal Federal☆17Updated 3 years ago
- A Google Sheet that scrapes and stores data from covid.saude.gov.br☆40Updated 3 years ago
- Wrapper para API de consulta do acervo do LexML☆35Updated last year
- FaQuAD reading comprehension dataset and related code to reproduce experiments from Sayama et al. (BRACIS 2019).☆8Updated last year
- ☆10Updated 9 months ago