ndl-lab / dataprocessingforpdf
PDFからテキストデータを抽出して機械学習等に適用するためのツール群
☆12Updated 3 years ago
Related projects ⓘ
Alternatives and complementary repositories for dataprocessingforpdf
- デジタル化資料OCRテキスト化事業において 作成されたOCR学習用データセット☆64Updated 4 months ago
- メディア芸術データベース(ベータ版)データセット☆83Updated 2 months ago
- 次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)☆20Updated last year
- ☆48Updated last year
- ☆102Updated 3 years ago
- ☆39Updated 2 years ago
- https://mediag.bunka.go.jp/madb_lab/ のデータを分析してJupyter Bookとして公開する☆39Updated last year
- 日本の行政区画(市区町村)・選挙区の地形ファイルをTopoJSONとGeoJSONで公開します。☆81Updated 11 months ago
- Bootcamp ハンズオンで使用する資料集☆67Updated 2 months ago
- ☆93Updated 3 months ago
- 一般社団法人日本CTO協会による提言を掲載するリポジトリです。☆65Updated 4 years ago
- リモートミーティングでの音声認識の活用事例☆59Updated 2 years ago
- ISUCON過去問環境を構築するためのcloud-config集☆105Updated 3 months ago
- GUIで動作する文書校正ツール GUI tool for textlinting.☆86Updated last month
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆168Updated this week
- 主要省庁と都道府県や自治体の経済支援制度をまとめる☆42Updated 3 years ago
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆103Updated this week
- 兵庫県 新型コロナウイルスまとめサイト / Hyogo COVID-19 Summary website☆54Updated 2 years ago
- Code for Japan のイベントにおける行動規範☆39Updated 4 months ago
- text-only archives of www.aozora.gr.jp☆76Updated last year
- How to make use of zenn.dev☆86Updated 2 weeks ago
- オンボーディングのノウハウ/Tipsを集めているハンドブックです。☆58Updated 2 years ago
- 日本CTO協会エンジニア育成WGでの育成コンテンツまとめ用wiki☆48Updated 2 months ago
- 東京都オープン・ソース・ソフトウェア公開ガイドライン☆113Updated 2 years ago
- Plain text format for Japanese law☆63Updated 3 months ago
- 沖縄県 新型コロナウイルス感染症対策サイト / Tokyo COVID-19 Task Force website☆29Updated 2 years ago
- ☆82Updated 11 months ago
- Code for Japan Decidim☆54Updated this week
- 📙UNICODE絵文字の日本語読み/キーワード/分類辞書📙☆78Updated last year