MosasoM / inappropriate-words-ja
日本語における不適切表現を収集します。自然言語処理の時のデータクリーニング用等に使えると思います。
☆169Updated 2 years ago
Related projects ⓘ
Alternatives and complementary repositories for inappropriate-words-ja
- 自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器☆134Updated 9 months ago
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆103Updated this week
- 5chの過去ログをスクレイピングして、過去流行った単語(ex, 香具師, orz)などを追跡調査☆69Updated 6 years ago
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆168Updated this week
- A tool for dividing the Japanese full name into a family name and a given name.☆244Updated last month
- ☆201Updated 3 weeks ago
- ママ活の勧誘のメッセージを自動生成する☆124Updated 2 years ago
- ☆68Updated 3 years ago
- リモートミーティングでの音声認識の活用事例☆59Updated 2 years ago
- ☆267Updated 3 years ago
- ☆86Updated 3 years ago
- メディア芸術データベース(ベータ版)データセット☆82Updated last month
- hottoSNS-w2v: 日本語大規模SNS+Webコーパスによる単語分散表現モデル☆60Updated 3 years ago
- 「仕事ではじめる検索システム」という本があったなら,という 想像の産物です -> 「検索システム ― 実務者のための開発改善ガイドブック」になりました☆134Updated 2 years ago
- A comparison tool of Japanese tokenizers☆118Updated 5 months ago
- Saizeriya_1000yen GACHA☆60Updated 3 years ago
- GUIで動作する文書校正ツール GUI tool for textlinting.☆86Updated 3 weeks ago
- ゼロから学ぶ Python☆160Updated 4 months ago
- 技術書典8用の資料とmarkdown(コロナで中止)☆45Updated 4 years ago
- kaityo256/yaml_cv の実行環境☆62Updated last year
- テキストファイルやMarkdownファイルの日本語の文章をチェックするVS Codeの拡張機能☆138Updated last year
- ☆48Updated last year
- おーぷん2ちゃんねるをクロールして作成した対話コーパス☆93Updated 3 years ago
- Japanese word embedding with Sudachi and NWJC 🌿☆155Updated 8 months ago
- 本を読んだ感想を書くブログです。☆146Updated last year
- ☆37Updated 4 years ago
- Japanese text8 corpus for word embedding.☆110Updated 7 years ago
- OpenAIのChatGPT APIをSlack上で利用するためのSlackbotスクリプト (日本語での利用が前提)☆61Updated 3 months ago
- 情報検索100本ノック☆90Updated last year
- parsable Original Data☆30Updated last year