ivbeg / lazyscraperLinks
Lazy helper tool to make easier scraping with simple tasks
☆19Updated 3 years ago
Alternatives and similar repositories for lazyscraper
Users that are interested in lazyscraper are comparing it to the libraries listed below
Sorting:
- Russian data and parsers from database of registry of repression victims (http://lists.memo.ru/)☆12Updated 4 years ago
- Opendata resources in Russian / Открытые данные на русском языке☆219Updated 3 years ago
- Russian names parsers, gender identification and processing tools☆134Updated last year
- Quick and dirty date parsing Python library to parse HTML dates really fast☆21Updated 2 years ago
- Парсер статистики ДТП с stat.gibdd.ru☆85Updated 2 years ago
- Rule-based facts extraction for Russian language☆325Updated 2 years ago
- A web-based engine for creating and annotating textual corpora☆250Updated 2 years ago
- Задачи для волонтеров/стажеров/всех желающих по работе с открытыми, большими данными. А также всеми иными задачами связанными с темами кр…☆77Updated 6 years ago
- Russian Law as Open Data☆40Updated 11 months ago
- Курс по Python по работе с VK API☆71Updated 7 years ago
- Попытка сделать свой GLR-парсер для русского языка на Python☆141Updated 8 years ago
- ☆33Updated 6 years ago
- Граф дружеских связей в vk.com. common friends☆105Updated 4 years ago
- Открытые лингвистические датасеты: тональный словарь русского языка КартаСловСент, датасет по семантике, ассоциативный граф и датасет по …☆370Updated 3 years ago
- Приложения к книге "Статистический анализ и визуализация данных с помощью R"☆155Updated 10 years ago
- Данные по статьям на хабре☆45Updated 5 years ago
- Trained T5 and T5-large model for creating keywords from text☆75Updated 3 years ago
- Sentiment analysis library for russian language☆318Updated 2 years ago
- Project on text topics evolution over time analysis☆81Updated 3 years ago
- Python library to read, write and convert data files with formats BSON, JSON, NDJSON, Parquet, ORC, XLS, XLSX and XML☆16Updated 3 months ago
- Карта ДТП v1.0. 👉 База знаний о проекте: https://github.com/dtpstat/dtp-project/wiki☆146Updated 3 months ago
- Скачивание списка Участников сообщества ВКонтакте☆20Updated 4 years ago
- Readability.io public code☆41Updated 9 years ago
- Lingtrain Alignment Studio is an ML based app for texts alignment on different languages. It can produce parallel corpora and parallel bo…☆281Updated 4 months ago
- Тот самый [гайд от подписчика по изучению Data Science] из FAQ чата python_beginners это мануал по подготовке к изучению учебных материал…☆64Updated 7 years ago
- Large silver standart Russian corpus with NER, morphology and syntax markup☆71Updated 2 years ago
- ☆498Updated 4 years ago
- A Python wrapper of the Yandex Mystem 3.1 morphological analyzer (http://api.yandex.ru/mystem). The original tool is shipped as a binary …☆294Updated 3 years ago
- Seman is a set of linguistic tools to analyze Russian or German texts, it contains lexicons and grammars. The project is interesting as a…☆88Updated 8 months ago
- Python library and cmd tool to backup API calls☆18Updated 3 months ago