NDLOCRアプリケーションのリポジトリ(ソースコードを含む)
☆639Jan 5, 2026Updated last month
Alternatives and similar repositories for ndlocr_cli
Users that are interested in ndlocr_cli are comparing it to the libraries listed below
Sorting:
- デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット☆81Jun 26, 2024Updated last year
- YomiTokuはAIを活用した日本語文書解析エンジンを提供するPythonパッケージです。 Yomitoku is an AI-powered document image analysis package designed specifically for the Ja…☆1,313Feb 20, 2026Updated last week
- NDL古典籍OCRのアプリケーション(ソースコードを含む)☆93Oct 14, 2025Updated 4 months ago
- NDL-DocLデータセット(資料画像レイアウトデータセット)☆28Mar 2, 2023Updated 3 years ago
- デジタル化資料から作成したOCRテキストデータのngram頻度統計情報のデータセット☆16Jan 10, 2023Updated 3 years ago
- ☆1,590Updated this week
- NDL古典籍OCR-Liteのアプリケーションのリポジトリ(ソースコードを含む)☆152Feb 17, 2026Updated 2 weeks ago
- 次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)☆26Apr 27, 2023Updated 2 years ago
- 🎤 vibrato: Viterbi-based accelerated tokenizer☆398Feb 7, 2026Updated 3 weeks ago
- オープンソースの住所正規化ライブラリ。☆946Nov 5, 2025Updated 3 months ago
- 【2024年版】BERTによるテキスト分類☆30Jul 8, 2024Updated last year
- Japanese tokenizer for Transformers☆79Dec 15, 2023Updated 2 years ago
- PDFからテキストデータを抽出して機械学習等に適用するためのツール群☆12Aug 4, 2021Updated 4 years ago
- 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXの音声合成エンジン☆1,631Feb 22, 2026Updated last week
- 日本語OCR☆244Aug 7, 2021Updated 4 years ago
- OCR system for recognizing modern Japanese magazines☆154Jul 12, 2023Updated 2 years ago
- Mozc - a Japanese Input Method Editor designed for multi-platform☆2,841Updated this week
- Wikipediaを用いた日本語の固有表現抽出データセット☆142Sep 2, 2023Updated 2 years ago
- LLMとLoRAを用いたテキスト分類☆98Jul 22, 2023Updated 2 years ago
- 【2023年版】BERTによるテキスト分類☆235May 28, 2024Updated last year
- ☆846Updated this week
- このリポジトリは、Windows 上での USB メモリ / SD カードイメージ書き込みツールのデファクト・スタンダードとなっている Win32 Disk Imager について、以下の点を改良した 「Win32 Disk Imager Renewal」 の デジタル署名…☆348Feb 7, 2024Updated 2 years ago
- OCR処理プログラム研究開発事業において作成されたOCR学習用データセット☆14Jun 26, 2024Updated last year
- Easily turn large English text datasets into Japanese text datasets using open LLMs.☆26Jan 20, 2025Updated last year
- 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのコア☆1,068Updated this week
- UDEV Gothic は、ユニバーサルデザインフォントのBIZ UDゴシックと、 開発者向けフォントの JetBrains Mono を合成した、プログラミング向けフォントです。☆1,903Feb 23, 2026Updated last week
- NDL古典籍OCR学習用データセット(みんなで翻刻加工データ)☆20Feb 10, 2025Updated last year
- A Japanese NLP Library using spaCy as framework based on Universal Dependencies☆832Mar 30, 2024Updated last year
- 🛥 Vaporetto: Very accelerated pointwise prediction based tokenizer☆252Feb 7, 2026Updated 3 weeks ago
- General-purpose Swich transformer based Japanese language model☆118Sep 13, 2023Updated 2 years ago
- RVCで音声学習をするための便利スクリプト集☆26Apr 8, 2023Updated 2 years ago
- 肺です☆21Oct 4, 2023Updated 2 years ago
- experimental LD_PRELOAD library for tracking memory leaks☆38Dec 12, 2023Updated 2 years ago
- LLaVA-JP is a Japanese VLM trained by LLaVA method☆64Jul 3, 2024Updated last year
- 無料で使える中品質なテキスト読み上げソフトウェア、VOICEVOXのエディター☆3,028Updated this week
- Japanese OCR with CenterNet☆57Aug 2, 2025Updated 7 months ago
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆177Updated this week
- The corpus of Japanese spam messages of invitation Mama Katu.☆42Aug 1, 2025Updated 7 months ago
- A Slack Bot for summarizing arXiv papers, powered by OpenAI LLMs.☆71Sep 11, 2023Updated 2 years ago