WorksApplications / elasticsearch-sudachiLinks
The Japanese analysis plugin for elasticsearch
☆217Updated 4 months ago
Alternatives and similar repositories for elasticsearch-sudachi
Users that are interested in elasticsearch-sudachi are comparing it to the libraries listed below
Sorting:
- A lexicon for Sudachi☆269Updated last month
- Elasticsearch's Analyzer for Kuromoji with Neologd☆114Updated 2 years ago
- Japanese word embedding with Sudachi and NWJC 🌿☆168Updated last year
- A tool that divides Japanese full names into family and given names.☆251Updated last month
- 情報検索100本ノック☆92Updated 3 weeks ago
- 「仕事ではじめる検索システム」という本があ ったなら,という想像の産物です -> 「検索システム ― 実務者のための開発改善ガイドブック」になりました☆138Updated 3 years ago
- 自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器☆140Updated 9 months ago
- 📙UNICODE絵文字の日本語読み/キーワード/分類辞書📙☆82Updated 9 months ago
- A Python Module for JUMAN++/KNP☆92Updated 2 weeks ago
- Neologism dictionary based on the language resources on the Web for mecab-unidic☆86Updated 5 years ago
- 日本語における不適切表現を収集します。自然言語処理の時のデータクリーニング用等に使えると思います。☆198Updated 4 years ago
- ☆73Updated 4 months ago
- RESTful MeCab on Docker☆51Updated 7 years ago
- Wikipediaを用いた日本語の固有表現抽出データセット☆142Updated 2 years ago
- Testing tool to verify the search qualities of the Elasticsearch indices☆29Updated 2 years ago
- A fast converter between Japanese hankaku and zenkaku characters☆151Updated last year
- Open Source and Free GeoCoding API in Japan☆194Updated last year
- Japanese text normalizer for mecab-neologd☆287Updated 3 weeks ago
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆175Updated this week
- Japanese text8 corpus for word embedding.☆111Updated 8 years ago
- Algorithms of Recommender Systems : A survey paper of recommender systems (written in Japanese)☆76Updated 4 years ago
- Sentence boundary disambiguation tool for Japanese texts (日本語文境界判定器)☆199Updated last year
- ☆100Updated 2 years ago
- English-Japanese Dictionary data (Public Domain) EJDict-hand☆231Updated last month
- Solr / Elasticsearch Synonym mapping file for Japanese web documents using results of NEologd☆40Updated 9 years ago
- 研究用データセットです。☆78Updated 12 years ago
- text-only archives of www.aozora.gr.jp☆82Updated 2 years ago
- メディア芸術データベース(ベータ版)データセット☆92Updated this week
- ☆95Updated last year
- 5chの過去ログをスクレイピングして、過去流行った単語(ex, 香具師, orz)などを追跡調査☆74Updated 7 years ago