ndl-lab / dataprocessingforpdfLinks
PDFからテキストデータを抽出して機械学習等に適用するためのツール群
☆12Updated 4 years ago
Alternatives and similar repositories for dataprocessingforpdf
Users that are interested in dataprocessingforpdf are comparing it to the libraries listed below
Sorting:
- メディア芸術データベース(ベータ版)データセット☆92Updated last week
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆175Updated last week
- aozorahack全般に関するissue/wiki用リポジトリです☆183Updated 10 years ago
- Bootcamp ハンズオンで使用する資料集☆76Updated 2 months ago
- Government Interoperability Framework☆148Updated 3 weeks ago
- Code for Japan のイベントにおける行動規範☆40Updated last year
- 次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)☆26Updated 2 years ago
- 5374(ゴミナシ).jp for Kanazawa☆119Updated 3 months ago
- Repository to track Japanese Law in text format☆152Updated 5 years ago
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆105Updated last week
- ☆103Updated 4 years ago
- Open Source and Free GeoCoding API in Japan☆194Updated last year
- OSS Gateワークショップ参加者の方からよく寄せられる疑問への回答を元にした、初めてのフィードバックの手引き☆96Updated 2 years ago
- CAT'S DOCument System☆220Updated 6 months ago
- The Missing Semester of Your CS Education (日本語版) 📚☆46Updated 3 years ago
- Code for Japan Decidim☆55Updated this week
- Discussion of opinions and requests for qiita.com☆93Updated 3 months ago
- 日本の行政区画(市区町村)・選挙区の地形ファイルをTopoJSONとGeoJSONで公開します。☆102Updated 2 years ago
- BADオープンデータ供養寺 建立予定地☆29Updated 2 years ago
- text-only archives of www.aozora.gr.jp☆83Updated 2 years ago
- Awesome Japan Open Data - 日本のオープンデータ情報一覧・まとめ☆155Updated 2 months ago
- デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット☆74Updated last year
- GUIで動作する文書校正ツール GUI tool for textlinting.☆87Updated 3 months ago
- ☆84Updated last week
- 法務省登記所備付地図データ(地図XML)をGeoJSONに変換するコンバータ☆221Updated 2 years ago
- 「きのこ本」を勝手に電子書籍化☆122Updated 8 months ago
- 主要省庁と都道府県や自治体の経済支援制度をまとめる☆42Updated 4 years ago
- ☆267Updated 4 years ago
- Webベースのテキスト比較ツール difff《デュフフ》☆204Updated 2 months ago
- 高速で使いやすい蔵書検索のための汎用的なユーザーインターフェース☆28Updated last year