デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット
☆83Jun 26, 2024Updated last year
Alternatives and similar repositories for pdmocrdataset-part1
Users that are interested in pdmocrdataset-part1 are comparing it to the libraries listed below. We may earn a commission when you buy through links labeled 'Ad' on this page.
Sorting:
- NDL-DocLデータセット(資料画像レイアウトデータセット)☆29Mar 2, 2023Updated 3 years ago
- NDLOCRアプリケーションのリポジトリ(ソースコードを含む)☆651Jan 5, 2026Updated 2 months ago
- 文字画像データセット(平仮名73文字版)☆18Apr 6, 2020Updated 5 years ago
- デジタル化資料から作成したOCRテキストデータのngram頻度統計情報のデータセット☆15Jan 10, 2023Updated 3 years ago
- LEIA: Facilitating Cross-Lingual Knowledge Transfer in Language Models with Entity-based Data Augmentation☆23Apr 24, 2024Updated last year
- End-to-end encrypted cloud storage - Proton Drive • AdSpecial offer: 40% Off Yearly / 80% Off First Month. Protect your most important files, photos, and documents from prying eyes.
- OCR処理プログラム研究開発事業において作成されたOCR学習用データセット☆15Jun 26, 2024Updated last year
- 図表自動抽出のプログラム(A program that automatically extracts diagrams)☆19Aug 4, 2021Updated 4 years ago
- PDFからテキストデータを抽出して機械学習等に適用するためのツール群☆12Aug 4, 2021Updated 4 years ago
- ☆29Apr 10, 2025Updated 11 months ago
- ☆18Feb 9, 2025Updated last year
- 次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)☆26Apr 27, 2023Updated 2 years ago
- Google Chromeの内蔵ローカルLLMでチャットするためのサンプルコードです。☆13Jan 15, 2025Updated last year
- Code and documentation to train Stanford's Alpaca models, and generate the data.☆24Mar 19, 2023Updated 3 years ago
- NLP2025 のチュートリアル「地理情報と言語処理 実践入門」の資料とソースコード☆17Mar 19, 2026Updated last week
- NordVPN Special Discount Offer • AdSave on top-rated NordVPN 1 or 2-year plans with secure browsing, privacy protection, and support for for all major platforms.
- 解析が難しい日本の住所のテストデータセット☆14Sep 25, 2023Updated 2 years ago
- NDL古典籍OCRのアプリケーション(ソースコードを含む)☆93Oct 14, 2025Updated 5 months ago
- 音声を文字起こししてChatGPTと会話したい☆22Mar 8, 2023Updated 3 years ago
- SATySFi commands and DSL for displaying derivation trees with maintainable code☆11Jan 2, 2021Updated 5 years ago
- ☆19Mar 12, 2026Updated 2 weeks ago
- RealPersonaChat: A Realistic Persona Chat Corpus with Interlocutors' Own Personalities☆63Mar 13, 2024Updated 2 years ago
- Japanese BERT Pretrained Model☆23Nov 13, 2021Updated 4 years ago
- 鴨川って快活CLUBだ☆16Jan 24, 2023Updated 3 years ago
- text-only archives of www.aozora.gr.jp☆89Mar 22, 2023Updated 3 years ago
- Proton VPN Special Offer - Get 70% off • AdSpecial partner offer. Trusted by over 100 million users worldwide. Tested, Approved and Recommended by Experts.
- Mecab + NEologd + Docker + Python3☆36May 10, 2022Updated 3 years ago
- Wikipediaを用いた日本語の固有表現抽出データセット☆142Sep 2, 2023Updated 2 years ago
- 🛥 Vaporetto: Very accelerated pointwise prediction based tokenizer☆254Feb 7, 2026Updated last month
- 進捗大陸で使用されたSATySFiファイル☆12May 22, 2023Updated 2 years ago
- General-purpose Swich transformer based Japanese language model☆118Sep 13, 2023Updated 2 years ago
- Unofficial browser extension for Scrapbox☆30Jul 31, 2022Updated 3 years ago
- ☆15Nov 20, 2025Updated 4 months ago
- Japanese-BPEEncoder☆41Sep 12, 2021Updated 4 years ago
- ☆16Nov 19, 2023Updated 2 years ago
- Managed hosting for WordPress and PHP on Cloudways • AdManaged hosting with the flexibility to host WordPress, Magento, Laravel, or PHP apps, on multiple cloud providers. Cloudways by DigitalOcean.
- Easily turn large English text datasets into Japanese text datasets using open LLMs.☆27Jan 20, 2025Updated last year
- ☆15Nov 30, 2023Updated 2 years ago
- ☆12Dec 12, 2019Updated 6 years ago
- Pre-train Embedding in LightFM Recommender System Framework☆11Apr 28, 2019Updated 6 years ago
- Tokenizer POS-tagger Lemmatizer and Dependency-parser for modern and contemporary Japanese☆38Dec 29, 2025Updated 2 months ago
- VOICEVOX ENGINE、VOICEVOX NEMO ENGINE、COEIROINK用コマンドラインクライアント。複数のエンジンを使用した並列処理もできます☆11May 4, 2024Updated last year
- NDL古典籍OCR-Liteのアプリケーションのリポジトリ(ソースコードを含む)☆164Updated this week