line / LINE-DistilBERT-Japanese
DistilBERT model pre-trained on 131 GB of Japanese web text. The teacher model is BERT-base that built in-house at LINE.
☆44Updated last year
Related projects: ⓘ
- Mecab + NEologd + Docker + Python3☆35Updated 2 years ago
- 参議院の公式ウェブサイトから議案、議員、会派、質問主意書をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆102Updated this week
- GPTがYouTuberをやります☆62Updated 9 months ago
- 【2024年版】BERTによるテキスト分類☆22Updated 2 months ago
- Slack log archive system and veiwer on GAE☆42Updated 5 years ago
- デジタル化資料OCRテキスト化事業において作成されたOCR学習用データセット☆63Updated 2 months ago
- 日本語における不適切表現を収集します。自然言語処理の時のデータクリーニング用等に使えると思います。☆162Updated 2 years ago
- Deep Running☆67Updated 3 years ago
- Kanjize(カンジャイズ): Easy converter between Kanji-Number and Integer☆58Updated 9 months ago
- Tuner for reading levels☆36Updated 4 months ago
- おーぷん2ちゃんねるをクロールして作成した対話コーパス☆93Updated 3 years ago
- メディア芸術データベース(ベータ版)データセット☆82Updated 2 months ago
- Viterbi-based accelerated tokenizer (Python wrapper)☆39Updated 2 weeks ago
- ボケて電笑戦 (bokete DENSHOSEN) Workshop☆41Updated 2 years ago
- 衆議院の公式ウェブサイトから国会に提出された議案をデータベース化しました。商用・非商用を問わず、自由にデータのダウンロードや検索が可能です。☆167Updated this week
- リモートミーティングでの音声認識の活用事例☆59Updated 2 years ago
- OpenAIのChatGPT APIをSlack上で利用するためのSlackbotスクリプト (日本語での利用が前提)☆60Updated last month
- ☆47Updated last year
- ☆52Updated this week
- ☆81Updated last year
- 自然言語で書かれた時間情報表現を抽出/規格化するルールベースの解析器☆132Updated 7 months ago
- ☆50Updated last year
- NLP2024 チュートリアル3 作って学ぶ日本語大規模言語モデル - 環境構築手順とソースコード / NLP2024 Tutorial 3: Practicing how to build a Japanese large-scale language model - E…☆105Updated 5 months ago
- ☆32Updated this week
- 解説動画生成ツール☆102Updated last month
- FlexGen with docker☆28Updated last year
- ママ活の勧誘のメッセージを自動生成する☆124Updated 2 years ago
- 一覧管理したい☆44Updated last year
- ☆17Updated 3 years ago
- ☆70Updated last year