ndl-lab / pdmocrdataset-part1View external linksLinks
デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
☆75Jun 26, 2024Updated last year
Alternatives and similar repositories for pdmocrdataset-part1
Users that are interested in pdmocrdataset-part1 are comparing it to the libraries listed below
Sorting:
- NDLOCRアプリケーションのリポジトリ(ソースコードを含む)☆567Jan 5, 2026Updated last month
- NDL-DocLデータセット(資料画像レイアウトデータセット)☆27Mar 2, 2023Updated 2 years ago
- 文字画像データセット(平仮名73文字版)☆18Apr 6, 2020Updated 5 years ago
- LEIA: Facilitating Cross-Lingual Knowledge Transfer in Language Models with Entity-based Data Augmentation☆23Apr 24, 2024Updated last year
- Code and documentation to train Stanford's Alpaca models, and generate the data.☆24Mar 19, 2023Updated 2 years ago
- OCR処理プログラム研究開発事業において作成されたOCR学習用データセット☆14Jun 26, 2024Updated last year
- NDL古典籍OCR学習用データセット(みんなで翻刻加工データ)☆18Feb 10, 2025Updated last year
- Show notes for https://anchor.fm/yoheikikuta.☆15Apr 24, 2022Updated 3 years ago
- 図表自動抽出のプログラム(A program that automatically extracts diagrams)☆19Aug 4, 2021Updated 4 years ago
- ☆19Sep 26, 2025Updated 4 months ago
- ☆12Dec 12, 2019Updated 6 years ago
- RealPersonaChat: A Realistic Persona Chat Corpus with Interlocutors' Own Personalities☆63Mar 13, 2024Updated last year
- ☆22Sep 18, 2023Updated 2 years ago
- GPGPU version of 数え上げお姉さん(https://github.com/primenumber/kazoeage-oneesan)☆11Dec 3, 2021Updated 4 years ago
- 解析が難しい日本の住所のテストデータセット☆14Sep 25, 2023Updated 2 years ago
- Tourmaline is a AOT programming language with LLVM☆12Aug 21, 2017Updated 8 years ago
- ☆15Nov 20, 2025Updated 2 months ago
- 進捗大陸で使用されたSATySFiファイル☆12May 22, 2023Updated 2 years ago
- Ono laboratory audio signal processing exercise for beginners.☆19May 10, 2023Updated 2 years ago
- 競馬予想プログラム☆12May 6, 2023Updated 2 years ago
- JMultiWOZ: A Large-Scale Japanese Multi-Domain Task-Oriented Dialogue Dataset, LREC-COLING 2024☆25Mar 27, 2024Updated last year
- ☆49Dec 18, 2024Updated last year
- Self hosted C compiler at seccamp2018☆10Aug 18, 2018Updated 7 years ago
- VRChatのワールドとローカルPCのシリアルポートを繋ぐUdonなど☆12Dec 8, 2022Updated 3 years ago
- simple PE parser☆12Mar 14, 2017Updated 8 years ago
- PDFからテキストデータを抽出して機械学習等に適用するためのツール群☆12Aug 4, 2021Updated 4 years ago
- Wikipediaを用いた日本語の固有表現抽出データセット☆142Sep 2, 2023Updated 2 years ago
- NDL古典籍OCRのアプリケーション(ソースコードを含む)☆85Oct 14, 2025Updated 4 months ago
- Unofficial entropix impl for Gemma2 and Llama and Qwen2 and Mistral☆17Jan 12, 2025Updated last year
- alpacaデータセットを日本語化したものです☆86Jun 3, 2023Updated 2 years ago
- ☆16Mar 4, 2024Updated last year
- Python binding for Jagger(C++ implementation of Pattern-based Japanese Morphological Analyzer)☆12Dec 16, 2025Updated last month
- ☆27Updated this week
- Google Chromeの内蔵ローカルLLMでチャットするためのサンプルコードです。☆13Jan 15, 2025Updated last year
- 鴨川って快活CLUBだ☆16Jan 24, 2023Updated 3 years ago
- JLCPCB PCBA向けの、部品探しを補助するためのMCPサーバー☆31Apr 20, 2025Updated 9 months ago
- Tokenizer POS-tagger Lemmatizer and Dependency-parser for modern and contemporary Japanese☆38Dec 29, 2025Updated last month
- LLMとLoRAを用いたテキスト分類☆98Jul 22, 2023Updated 2 years ago
- Recording Composition Tool Hisui☆23Feb 6, 2026Updated last week