ndl-lab / dataprocessingforpdf
PDFからテキストデータを抽出して機械学習等に適用するためのツール群
☆12Updated 3 years ago
Related projects: ⓘ
- メディア芸術データベース(ベータ版)データセット☆82Updated 2 months ago
- 次世代デジタルライブラリーのソースコード(Programs of the Next Digital Library.)☆20Updated last year
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆167Updated this week
- Bootcamp ハンズオンで使用する資料集☆66Updated 2 weeks ago
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆102Updated this week
- デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット☆63Updated 2 months ago
- https://mediag.bunka.go.jp/madb_lab/ のデータを分析してJupyter Bookとして公開する☆39Updated last year
- BADオープンデータ供養寺 建立予定地☆29Updated 8 months ago
- Plain text format for Japanese law☆52Updated last month
- ☆47Updated last year
- Mecab + NEologd + Docker + Python3☆35Updated 2 years ago
- 主要省庁と都道府県や自治体の経済支援制度をまとめる☆42Updated 3 years ago
- ☆101Updated 3 years ago
- COVID-19情報の自動収集とデータ生成・検証 for 兵庫県☆20Updated 2 years ago
- OSS Gateワークショップ参加者の方からよく寄せられる疑問への回答を元にした、初めてのフィードバックの手引き☆88Updated 11 months ago
- 東京都オープン・ソース・ソフトウェア公開ガイドライン☆113Updated 2 years ago
- リモートミーティングでの音声認識の活用事例☆59Updated 2 years ago
- OpenAIのChatGPT APIをSlack上で利用するためのSlackbotスクリプト (日本語での利用が前提)☆60Updated last month
- 赤ちゃんギャン泣きインシデントのMTTRを改善したい☆58Updated 5 months ago
- The Missing Semester of Your CS Education (日本語版) 📚☆43Updated 2 years ago
- ☆63Updated 10 months ago
- Code for Japan のイベントにおける行動規範☆38Updated 2 months ago
- GUIで動作する文書校正ツール GUI tool for textlinting.☆86Updated 2 weeks ago
- オンボーディングのノウハウ/Tipsを集めているハンドブックです。☆58Updated 2 years ago
- How to make use of zenn.dev☆84Updated 2 weeks ago
- clumsy is a clone of git implemented in rust.☆127Updated 3 years ago
- ママ活の勧誘のメッセージを自動生成する☆124Updated 2 years ago
- ☆81Updated 9 months ago
- text-only archives of www.aozora.gr.jp☆74Updated last year
- 「仕事ではじめる検索システム」という本があったなら,という想像の産物です -> 「検索システム ― 実務者のための開発改善ガイドブック」になりました☆135Updated 2 years ago
- ISUCON過去問環境を構築するためのcloud-config集☆95Updated last month