ndl-lab / dataprocessingforpdf
PDFからテキストデータを抽出して機械学習等に適用するためのツール群
☆12Updated 3 years ago
Alternatives and similar repositories for dataprocessingforpdf:
Users that are interested in dataprocessingforpdf are comparing it to the libraries listed below
- デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット☆69Updated 9 months ago
- ☆48Updated last year
- メディア芸術データベース(ベータ版)データセット☆86Updated this week
- 次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)☆21Updated last year
- GUIで動作する文書校正ツール GUI tool for textlinting.☆86Updated 5 months ago
- 主要省庁と都道府県や自治体の経済支援制度をまとめる☆42Updated 3 years ago
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆103Updated this week
- ☆102Updated 4 years ago
- Bootcamp ハンズオンで使用する資料集☆69Updated 3 months ago
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆171Updated this week
- BADオープンデータ供養寺 建立予定地☆29Updated last year
- https://mediag.bunka.go.jp/madb_lab/ のデータを分析してJupyter Bookとして公開する☆39Updated 2 weeks ago
- リモートミーティングでの音声認識の活用事例☆60Updated 3 years ago
- OSS Gateワークショップ参加者の方からよく寄せられる疑問への回答を元にした、初めてのフィードバックの手引き☆89Updated last year
- サイボウズで行われた Kubernetes 研修の資料☆77Updated 3 years ago
- ISUCON過去問環境を構築するためのcloud-config集☆107Updated 3 weeks ago
- 東京都オープン・ソース・ソフトウェア公開ガイドライン☆114Updated 3 years ago
- ☆39Updated 3 years ago
- Code for Japan Decidim☆55Updated this week
- 福井県版 新型コロナウイルス感染症対策サイト / Fukui COVID-19 Task Force website☆28Updated 2 years ago
- Mecab + NEologd + Docker + Python3☆35Updated 2 years ago
- 赤ちゃんギャン泣きインシデントのMTTRを改善したい☆60Updated 2 months ago
- Online Cosense Converter☆63Updated 10 months ago
- 古橋研究室(古橋ゼミ)に興味のある学生は、最初に読んでください。これを熟読できていない学生は指導対象から外します。☆19Updated 2 weeks ago
- SmartHRらしい文書を書くための、textlintルールプリセットを提供します。☆114Updated this week
- 衆院選2017候補者データベース作成プロジェクト This repo will be archived 🗄️ in the future☆32Updated 2 years ago
- 日本の行政区画(市区町村)・選挙区の地形ファイルをTopoJSONとGeoJSONで公開します。☆90Updated last year
- Plain text format for Japanese law☆77Updated last month
- 一般社団法人日本CTO協会による提言を掲載するリポジトリです。☆65Updated 4 years ago
- ISUCON10予選☆47Updated last year