houbb / opencc4j
🇨🇳Open Chinese Convert is an opensource project for conversion between Traditional Chinese and Simplified Chinese.(java 中文繁简体转换)
☆497Updated last year
Alternatives and similar repositories for opencc4j:
Users that are interested in opencc4j are comparing it to the libraries listed below
- The high performance pinyin tool for java.(java 高性能中文转拼音工具。支持同音字。)☆264Updated 2 years ago
- 拼音和汉字之间的转换、简体汉字和繁体汉字之间的转换☆140Updated 2 years ago
- A copy of http://sourceforge.net/projects/pinyin4j, then deploy it to maven central repository.☆1,262Updated last year
- The jieba-analysis tool for java.(基于结巴分词词库实现的更加灵活优雅易用,高性能的 java 分词实现。支持词性标注。)☆148Updated last year
- 中文工具集,包括中文简繁体转换、拼音转换以及中文分词。☆184Updated 9 years ago
- 一个生产级、高性能、模块化、可扩展的中文NLP工具包。(中文分词、平均感知机、fastText、拼音、新词 发现、分词纠错、BM25、人名识别、命名实体、自定义词典)☆682Updated last year
- 🇨🇳🇬🇧Chinese and English word spelling corrector.(中文易错别字检测,中文拼写检测纠正。英文单词拼写校验工具)☆252Updated 4 months ago
- Tokenizer support Lucene5/6/7/8/9+ version, LTS☆204Updated last year
- Jcseg is a light weight NLP framework developed with Java. Provide CJK and English segmentation based on MMSEG algorithm, With also keywo…☆923Updated last year
- Sensitive word filtering items provide TTMP, DFA, DAT, hash bucket, and Tire algorithm support filtering. Supports text highlighting, fil…☆248Updated 2 years ago
- xk-time 是时间转换,时间计算,时间格式化,时间解析,日历,时间cron表达式和时间NLP等的工具,使用Java8(JSR-310),线程安全,简单易用,多达70几种常用日期格式化模板,支持Java8时间类和Date,轻量级,无第三方依赖。☆329Updated 6 months ago
- 音频转码工具,主要用于将微信语音 amr 格式转换为 mp3 格式以便在 html5 的 audio 标签中进行播放☆218Updated 5 years ago
- 简繁体汉字转拼音的项目,解决多音字的问题。ElasticSearch、solr 的拼音分词工具☆116Updated 4 years ago
- 这个项目是一个基本包.封装了大多数nlp项目中常用工具☆1,501Updated 11 months ago
- JPinyin是一个汉字转拼音的Java开源类库☆58Updated 11 years ago
- Java Image I/O reader and writer for the Google WebP image format without system native libs☆158Updated 4 years ago
- 中国农历的Java实现,支持约300年公历范围:1850-02-12到2150-12-31;一个Java类不到1000行,不依赖任何第三方库。☆108Updated 2 years ago
- kaptcha - A kaptcha generation engine.☆456Updated 6 years ago
- Twitter的雪花算法SnowFlake,使用Java语言实现。☆843Updated 7 years ago
- 日历、公历(阳历)、农历(阴历、老黄历)、佛历、道历,支持节假日、星座、儒略日、干支、生肖、节气、节日、彭祖百忌、每日宜忌、吉神宜趋凶煞宜忌、吉神(喜神/福神/财神/阳贵神/阴贵神)方位、胎神方位、冲煞、纳音、星宿、八字、五行、十神、建除十二值星、青龙名堂等十二神、黄道日及…☆784Updated this week
- 简易敏感词处理器,支持返回敏感词,高亮敏感词,替换敏感词等操作☆263Updated 7 years ago
- 敏感词过滤、广告词过滤、包含敏感词库,停顿词库。☆177Updated 8 years ago
- An Efficient Lexical Analyzer for Chinese☆332Updated 7 years ago
- 如艺术一般优雅,像 1、2、3 一样简单,前后端通用,轻量却强大的 HTTP 客户端(同时支持 WebSocket 与 Stomp 协议)☆504Updated 2 weeks ago
- iText7文档的汉化版本☆176Updated 5 years ago
- jieba analysis plugin for elasticsearch 7.0.0, 6.4.0, 6.0.0, 5.4.0,5.3.0, 5.2.2, 5.2.1, 5.2, 5.1.2, 5.1.1☆531Updated last year
- 纯Java实现的支持W3C Xpath 1.0标准语法的HTML解析器。A html parser with xpath base on Jsoup and Antlr4. Maybe it is the best in java.Just try it.☆454Updated 4 months ago
- Emoji转换工具,便于各种类型的客户端生成的Emoji字符串转换成另外一种格式☆295Updated last year
- 🔐Sensitive log tool for java, based on java annotation. (基于注解的 java 日志脱敏工具框架,更加优雅的日志打印。支持自定义哈希、支持基于 log4j2 插件的统一脱敏、支持 logback 插件统一脱敏)☆635Updated last year
- Tencent Cloud API 3.0 SDK for Java☆546Updated this week