frapples / java-pinyinLinks
A library that provides Pinyin and Chinese conversion and Chinese word segmentation.一个汉字与拼音互转的工具库,提供简单的分词功能。
☆23Updated 2 years ago
Alternatives and similar repositories for java-pinyin
Users that are interested in java-pinyin are comparing it to the libraries listed below
Sorting:
- Tree-split 搬新家..给各位带来的不便深表歉意☆55Updated 8 years ago
- 中文拼写检查工具,用于对中文文本中的错误用语进行检测并给出纠正建议☆36Updated 7 years ago
- The jieba-analysis tool for java.(基于结巴分词词库实现的 更加灵活优雅易用,高性能的 java 分词实现。支持词性标注。)☆149Updated last year
- A opensource Java library for converting Chinese to Pinyin.☆55Updated 7 years ago
- A simple implementation of simhash algorithm by java.☆155Updated 4 years ago
- 拼音和汉字之间的转换、简体汉字和繁体汉字之间的转换☆141Updated 2 years ago
- 简单高效的URL关键词提取工具☆15Updated 6 years ago
- 基于词典的负面舆情信息评分算法。☆26Updated 10 years ago
- ☆23Updated 7 years ago
- FoolNLTK java version☆82Updated 6 years ago
- JPinyin是一个汉字转拼音的Java开源类库☆58Updated 12 years ago
- 搜狐实习自动回复项目:语音识别、问题过滤、答案推荐☆8Updated 10 years ago
- 使用Spark NaiveBayes 实现中文文本分类 use spark NaiveBayes for text classifi…☆25Updated 6 years ago
- 本项目目的在于构建一个标准化的NLP处理框架,提供企业级的API,以及各种推荐实现和测试包。 目前国内外有不少NLP语言包,包括中科院、复旦大学的,通过对这些常用NLP软件的封装,可以为企业提供一个可以根据需要来对比和无缝切换底层实现的NLP框架。☆22Updated last year
- Chinese Word Segmentation Tool, THULAC的Java实现.☆84Updated 4 years ago
- 基于deeplearning4j深度学习框架实现的价格预测,语义分析,文本分类等场景的代码☆14Updated 5 years ago
- CNBlog首页博客热度分析☆10Updated 9 years ago
- java音频格式转换工具☆36Updated 8 years ago
- A Java port of darts-clone.☆44Updated 11 years ago
- 通过web服务器对word分词的资源进行集中统一管理☆20Updated 8 years ago
- 本项目转移到https://github.com/cocolian/cocolian-nlp☆34Updated 11 years ago
- 高级结构双数组Trie树(DoubleArrayTrie) java实现☆23Updated 4 years ago
- Vert.X-generator是基于javafx8开发的图形界面Vert.x代码生成器,使用 Apache FreeMarker 作为代码文件的模板,用户可以一键将数据库中的表生成为任意风格的.java代码文件(比如经典的三层模型);☆40Updated 2 years ago
- crf-seg:用于生产环境的中文分词处理工具,可自定义语料、可自定义模型、架构清晰,分词效果好。java编写。☆14Updated 3 years ago
- ☆22Updated 7 years ago
- 基于Netty的文件传输程序,方便与其他系统的集成☆21Updated 6 years ago
- 基于hanlp的elasticsearch分词插件☆157Updated 3 years ago
- 基于jieba的elasticsearch中文分词插件☆20Updated 7 years ago
- The missing SVM-based text classification module implementing HanLP's interface☆47Updated 7 years ago
- 此文本分类项目主要面向机器学习初学者和文本分类效果测试者,项目内部含有朴素贝叶斯,余弦定理,逻辑回归多种分类算法以及mm,rmm分词器,同时从某新闻站点爬取了多个分类共6000多篇文章,以及一个中文词典。项目方便自由拓展各种分类器和分词器,并通过组装测试分类效果。☆35Updated 7 years ago