デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
☆82Jun 26, 2024Updated last year
Alternatives and similar repositories for pdmocrdataset-part1
Users that are interested in pdmocrdataset-part1 are comparing it to the libraries listed below
Sorting:
- NDLOCRアプリケーションのリポジトリ(ソースコードを含む)☆639Jan 5, 2026Updated 2 months ago
- NDL-DocLデータセット(資料画像レイアウトデータセット)☆28Mar 2, 2023Updated 3 years ago
- 文字画像データセット(平仮名73文字版)☆18Apr 6, 2020Updated 5 years ago
- LEIA: Facilitating Cross-Lingual Knowledge Transfer in Language Models with Entity-based Data Augmentation☆23Apr 24, 2024Updated last year
- Code and documentation to train Stanford's Alpaca models, and generate the data.☆24Mar 19, 2023Updated 2 years ago
- OCR処理プログラム研究開発事業において作成されたOCR学習用データセット☆14Jun 26, 2024Updated last year
- ☆18Feb 9, 2025Updated last year
- ☆29Apr 10, 2025Updated 10 months ago
- Show notes for https://anchor.fm/yoheikikuta.☆15Apr 24, 2022Updated 3 years ago
- ☆19Sep 26, 2025Updated 5 months ago
- 図表自動抽出のプログラム(A program that automatically extracts diagrams)☆19Aug 4, 2021Updated 4 years ago
- Wio Terminal で L チカする☆21Feb 15, 2021Updated 5 years ago
- 次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)☆26Apr 27, 2023Updated 2 years ago
- ☆12Dec 12, 2019Updated 6 years ago
- RealPersonaChat: A Realistic Persona Chat Corpus with Interlocutors' Own Personalities☆63Mar 13, 2024Updated last year
- ☆22Sep 18, 2023Updated 2 years ago
- ☆15Nov 20, 2025Updated 3 months ago
- Tourmaline is a AOT programming language with LLVM☆12Aug 21, 2017Updated 8 years ago
- NLP2025 のチュートリアル「地理情報と言語処理 実践入門」の資料とソースコード☆17Feb 24, 2026Updated last week
- csvt is a command line tool for processing CSV.☆13Jan 14, 2026Updated last month
- 競馬予想プログラム☆12May 6, 2023Updated 2 years ago
- 進捗大陸で使用されたSATySFiファイル☆12May 22, 2023Updated 2 years ago
- SATySFi commands and DSL for displaying derivation trees with maintainable code☆11Jan 2, 2021Updated 5 years ago
- Ono laboratory audio signal processing exercise for beginners.☆19May 10, 2023Updated 2 years ago
- GPGPU version of 数え上げお姉さん(https://github.com/primenumber/kazoeage-oneesan)☆11Dec 3, 2021Updated 4 years ago
- JMultiWOZ: A Large-Scale Japanese Multi-Domain Task-Oriented Dialogue Dataset, LREC-COLING 2024☆25Mar 27, 2024Updated last year
- ☆49Dec 18, 2024Updated last year
- Self hosted C compiler at seccamp2018☆10Aug 18, 2018Updated 7 years ago
- simple PE parser☆12Mar 14, 2017Updated 8 years ago
- PDFからテキストデータを抽出して機械学習等に適用するためのツール群☆12Aug 4, 2021Updated 4 years ago
- Wikipediaを用いた日本語の固有表現抽出データセット☆142Sep 2, 2023Updated 2 years ago
- NDL古典籍OCRのアプリケーション(ソースコードを含む)☆93Oct 14, 2025Updated 4 months ago
- Unofficial entropix impl for Gemma2 and Llama and Qwen2 and Mistral☆17Jan 12, 2025Updated last year
- Unofficial browser extension for Scrapbox☆30Jul 31, 2022Updated 3 years ago
- alpacaデータセットを日本語化したものです☆86Jun 3, 2023Updated 2 years ago
- Google Chromeの内蔵ローカルLLMでチャットするためのサンプルコードです。☆13Jan 15, 2025Updated last year
- ☆29Feb 19, 2026Updated 2 weeks ago
- 鴨川って快活CLUBだ☆16Jan 24, 2023Updated 3 years ago
- ☆16Mar 4, 2024Updated 2 years ago