MosasoM / inappropriate-words-ja
日本語における不適切表現を収集します。自然言語処理の時のデータクリーニング用等に使えると思います。
☆176Updated 3 years ago
Alternatives and similar repositories for inappropriate-words-ja:
Users that are interested in inappropriate-words-ja are comparing it to the libraries listed below
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆103Updated this week
- 5chの過去ログをスクレイピングして、過去流行った単語(ex, 香具師, orz)などを追跡調査☆71Updated 6 years ago
- A tool for dividing the Japanese full name into a family name and a given name.☆245Updated 3 weeks ago
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆171Updated this week
- 自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器☆139Updated last month
- 📙UNICODE絵文字の日本語読み/キーワード/分類辞書📙☆79Updated 3 weeks ago
- 接触確認アプリ COCOA の非公式ドキュメント☆53Updated 4 years ago
- GUIで動作する文書校正ツール GUI tool for textlinting.☆86Updated 5 months ago
- source code of @HIKAKIN_SYM.☆73Updated 7 years ago
- ☆161Updated 4 years ago
- Webベースのテキスト比較ツール difff《デュフフ》☆191Updated last week
- Mecab + NEologd + Docker + Python3☆35Updated 2 years ago
- ニコニコ風実況アプリ(メンテナンス停止中)☆60Updated 3 years ago
- おーぷん2ちゃんねるをクロールして作成した対話コーパス☆95Updated 3 years ago
- テキストファイルやMarkdownファイルの日本語の文章をチェックするVS Codeの拡張機能☆143Updated 2 years ago
- ママ活の勧誘のメッセージを自動生成する☆124Updated 2 years ago
- Saizeriya_1000yen GACHA☆59Updated 4 years ago
- 「仕事ではじめる検索システム」という本があったなら,という想像の産物です -> 「検索システム ― 実務者のための開発改善ガイドブック」になりました☆138Updated 2 years ago
- ☆68Updated 3 years ago
- Kanjize(カンジャイズ): Easy converter between Kanji-Number and Integer☆60Updated 2 months ago
- ゼロから学ぶ Python☆166Updated last month
- このレポジトリは、現在の日本国憲法、そして現在の日本国憲法に対して日本国憲法改正案がどのような変更点を 含むのかを理解するためのものです☆86Updated 5 years ago
- markov-chain tweet generator webpage☆142Updated 2 years ago
- リモートミーティングでの音声認識の活用事例☆60Updated 3 years ago
- ☆48Updated last year
- 2001年の2ch閉鎖騒動の際のread.cgi CVSレポジトリをGit化したものです。脆弱性等も当時のままですので歴史的資料としてお使いください。☆268Updated 4 years ago
- メディア芸術データベース(ベータ版)データセット☆87Updated 2 weeks ago
- ☆87Updated 3 years ago
- 一般的な機械学習入門☆138Updated last month
- ☆94Updated last year