ndl-lab / ndlkotenocr_cli
NDL古典籍OCRのアプリケーション(ソースコードを含む)
☆63Updated 6 months ago
Alternatives and similar repositories for ndlkotenocr_cli
Users that are interested in ndlkotenocr_cli are comparing it to the libraries listed below
Sorting:
- NDL古典籍OCR-Liteのアプリケーションのリポジトリ(ソースコードを含む)☆100Updated 2 months ago
- NDL古典籍OCR学習用データセット(みんなで翻刻加工データ)☆14Updated 3 months ago
- OCR system for recognizing modern Japanese magazines☆144Updated last year
- Classical Chinese to Modern Japanese Translator☆29Updated last year
- Unidic packaged for installation via pip.☆95Updated 2 months ago
- デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット☆70Updated 10 months ago
- NDL-DocLデータセット(資料画像レイアウトデータセット)☆27Updated 2 years ago
- Word List by Semantic Principles (WLSP): “It is a collection of words classified and arranged by their meanings”☆54Updated 4 years ago
- Tokenizer POS-tagger Lemmatizer and Dependency-parser for modern and contemporary Japanese with BERT models☆20Updated last month
- Database for various Ideographic Variants Data☆63Updated last year
- 様々な漢字表のデータベース☆94Updated 6 years ago
- A Python Module for JUMAN++/KNP☆91Updated 2 months ago
- Sentence boundary disambiguation tool for Japanese texts (日本語文境界判定器)☆190Updated last year
- OCR処理プログラム研究開発事業において作成されたOCR学習用データセット☆13Updated 10 months ago
- ☆24Updated last week
- NDLOCRアプリケーションのリポジトリ(ソースコードを含む)☆544Updated 3 months ago
- 歴史資料の市民参加型翻刻プラットフォーム「みんなで翻刻」のテキストデータ置き場です。 / Transcription texts created on Minna de Honkoku (https://honkoku.org), a crowdsourced transc…☆13Updated last month
- ☆83Updated last year
- An integrated Japanese analyzer based on foundation models☆131Updated last week
- ☆98Updated 6 years ago
- Sudachi in Rust 🦀 and new generation of SudachiPy☆355Updated 2 weeks ago
- A lexicon for Sudachi☆252Updated 3 months ago
- Wikipediaを用いた日本語の固有表現抽出データセット☆138Updated last year
- TEIガイドラインへの準拠の仕方を日本語で解説します。☆12Updated 4 years ago
- Kyoto University Text Corpus☆62Updated last year
- 漢字データベースの辞書関連データ☆97Updated 2 years ago
- A comparison tool of Japanese tokenizers☆121Updated 11 months ago
- Automatic transcription models for Chinese historical documents trained with the kraken OCR engine☆13Updated last year
- Japanese data from the Google UDT 2.0.☆38Updated last week
- 日本語T5モデル☆116Updated 7 months ago