MosasoM / inappropriate-words-ja
日本語における不適切表現を収集します。自然言語処理の時のデータクリーニング用等に使えると思います。
☆173Updated 3 years ago
Alternatives and similar repositories for inappropriate-words-ja:
Users that are interested in inappropriate-words-ja are comparing it to the libraries listed below
- 5chの過去ログをスクレイピングして、過去流行った単語(ex, 香具師, orz)などを追跡調査☆71Updated 6 years ago
- 自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器☆138Updated last year
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆102Updated this week
- A tool for dividing the Japanese full name into a family name and a given name.☆245Updated 4 months ago
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆170Updated this week
- おーぷん2ちゃんねるをクロールして作成した対話コーパス☆95Updated 3 years ago
- 📙UNICODE絵文字の日本語読み/キーワード/分類辞書📙☆79Updated last year
- 「仕事ではじめる検索システム」という本があったなら,という想像の産物です -> 「検索システム ― 実務者のための開発改善ガイドブック」になりました☆137Updated 2 years ago
- テキストファイルやMarkdownファイルの日本語の文章をチェックするVS Codeの拡張機能☆142Updated last year
- ゼロから学ぶ Python☆166Updated 2 weeks ago
- リモートミーティングでの音声認識の活用事例☆60Updated 2 years ago
- OpenAIのChatGPT APIをSlack上で利用するためのSlackbotスクリプト (日本語での利用が前提)☆61Updated 6 months ago
- Mecab + NEologd + Docker + Python3☆35Updated 2 years ago
- 接触確認アプリ COCOA の非公式ドキュメント☆53Updated 4 years ago
- Saizeriya_1000yen GACHA☆59Updated 3 years ago
- ☆209Updated last week
- Repository to track Japanese Law in text format☆151Updated 4 years ago
- メディア芸術データベース(ベータ版)データセット☆85Updated last month
- ☆87Updated 3 years ago
- ☆94Updated last year
- ☆130Updated last year
- Japanese word embedding with Sudachi and NWJC 🌿☆158Updated 11 months ago
- ママ活の勧誘のメッセージを自動生成する☆124Updated 2 years ago
- ☆48Updated last year
- ☆68Updated 3 years ago
- text-only archives of www.aozora.gr.jp☆78Updated last year
- ☆77Updated last month
- ニコニコ風実況アプリ(メンテナンス停止中)☆60Updated 3 years ago
- 技術書典8用の資料とmarkdown(コロナで中止)☆45Updated 4 years ago
- GUIで動作する文書校正ツール GUI tool for textlinting.☆86Updated 3 months ago