roquelopez / opizer

☆9

Alternatives and similar repositories for opizer:

Users that are interested in opizer are comparing it to the libraries listed below

rogersdepelle / OffComBR
Here we provide a data set of web comments which have been annotated for hate speech.
☆23Updated 6 years ago
thalesbertaglia / enelvo
A flexible normalizer for user-generated content
☆60Updated this week
turing-usp / Aulas-NLP
Repositório criado para armazenar as aulas ministradas internamente na área de Processamento de Linguagem Natural do Grupo Turing.
☆30Updated 3 years ago
felipemaiapolo / legalnlp
LegalNLP - Natural Language Processing Methods for the Brazilian Legal Language
☆166Updated last year
peluz / lener-br
☆46Updated last year
joaoaleite / ToLD-Br
Toxic Language Detection in Social Media for Brazilian Portuguese: New Dataset and Multilingual Analysis
☆39Updated 10 months ago
jneto04 / ner-pt
Portuguese Named Entity Recognition
☆59Updated last year
nathanshartmann / portuguese_word_embeddings
Portuguese Word Embeddings: Evaluating on Word Analogies and Natural Language Tasks
☆243Updated last year
franciellevargas / HateBR
HateBR is the first large-scale expert annotated dataset of Brazilian Instagram comments for hate speech and offensive language detection…
☆28Updated last month
ju-resplande / PLUE
Portuguese translation of the GLUE benchmark and Scitail dataset
☆29Updated 2 years ago
roneysco / Fake.br-Corpus
We introduce the Fake.Br Corpus, which is composed of aligned true and fake news written in Brazilian Portuguese.
☆169Updated 4 years ago
UniversalDependencies / UD_Portuguese-Bosque
This Universal Dependencies (UD) Portuguese treebank.
☆50Updated 2 months ago
lisaterumi / nlp-portuguese-postagger
☆10Updated last year
unicamp-dl / PTT5
Code for training and evaluating T5 on Portuguese data.
☆85Updated 2 years ago
netoferraz / py-lexml-acervo
Wrapper para API de consulta do acervo do LexML
☆37Updated 2 years ago
liafacom / faquad
FaQuAD reading comprehension dataset and related code to reproduce experiments from Sayama et al. (BRACIS 2019).
☆8Updated 2 years ago
paulafortuna / Portuguese-Hate-Speech-Dataset
A Hierarchically-Labeled Portuguese Hate Speech Dataset
☆31Updated 5 years ago
okfn-brasil / censo-querido-diario
Este repositório não recebe atualizações | Queremos descobrir onde os diários oficiais das prefeituras de todo o Brasil estão sendo publi…
☆44Updated 2 years ago
rdenadai / sentiment-analysis-2018-president-election
Análise de sentimentos relacionados aos candidatos a Eleição para a presidência de 2018
☆46Updated 3 years ago
LIAMF-USP / Word2vec-pt
Tensorflow implementation of the Skipgram model with different scripts to train Portuguese word embeddings.
☆18Updated 7 years ago
ajdavidl / Portuguese-NLP
List of resources and tools developed with focus on Portuguese.
☆255Updated 2 months ago
inoueMashuu / POS-tagger-portuguese-nltk
Conjunto de POS-taggers treinados para classificação gramatical de sentenças em português.
☆59Updated 5 years ago
augusto-herrmann / eleicoes-2020-planos-de-governo
Dados sobre os planos de governo das eleições municipais de 2020
☆30Updated 4 years ago
Nkluge-correa / Tucano
Natively pre-trained open-source Portuguese language models.
☆48Updated this week
EticaAI / linguistic-datasets-portuguese
Linguistic Datasets for Portuguese: Lista de conjuntos de dados linguísticos para língua portuguesa com licença flexíveis: banco de dados…
☆67Updated 4 years ago
hallpaz / cda2020
Ciência de Dados Aplicada 2020
☆27Updated 4 years ago
felipeparpinelli / word2vec-pt-br
Implementação e modelo gerado com o treinamento (trigram) da wikipedia em pt-br
☆38Updated 7 years ago
RafaelMonteiro95 / FakeNilc
FakeNilc is a set of tools written in python3 to train Machine Learning models for fake news detection. Models trained using this mini-fr…
☆18Updated 2 years ago
rdenadai / BR-BERTo
Transformer model for Portuguese language (Brazil pt_BR)
☆15Updated 9 months ago
TheDataTrain / Meetups
Repositório para armazenar materiais apresentados em Meetups
☆21Updated 2 years ago