frapples / java-pinyinLinks
A library that provides Pinyin and Chinese conversion and Chinese word segmentation.一个汉字与拼音互转的工具库,提供简单的分词功能。
☆25Updated 2 years ago
Alternatives and similar repositories for java-pinyin
Users that are interested in java-pinyin are comparing it to the libraries listed below
Sorting:
- An efficient algorithm for text similarity computation☆60Updated 4 years ago
- Tree-split 搬新家..给各位带来的不便深表歉意☆54Updated 9 years ago
- Simhash Java单机实现☆114Updated 3 years ago
- A opensource Java library for converting Chinese to Pinyin.☆58Updated 8 years ago
- 中文拼写检查工具,用于对中文文本中的错误用语进行检测并给出纠正建议☆37Updated 8 years ago
- ☆23Updated 8 years ago
- 相似度计算软件包☆192Updated 2 years ago
- 使用Spark NaiveBayes 实现中文文本分类 use spark NaiveBayes for text classifi…☆26Updated 7 years ago
- 啊哈自然语言处理包,提供包括分词、依存句法分析、语义角色标注、自动摘要、语义相似度计算、LDA 主题预测、词云等服务。☆311Updated last year
- TextRank算法提取关键词的Java实现☆204Updated 10 years ago
- 中文地址解析☆19Updated 8 years ago
- 语义、情感、相似度分析。☆59Updated 10 years ago
- 专注于解决自然语言处理领域的几个核心问题:词法分析,句法分析,语义分析,语种检测,信息抽取,文本聚类和文本分类. 为相关领域的研发人员提供完整 的通用设计与参考实现. 涵盖了多种自然语言处理算法,适配了多个自然语言处理框架. 兼容Lucene/Solr/ElasticSe…☆118Updated 2 years ago
- 文本去重算法,研究自推荐系统中新闻的去重,采用了雅虎的Near-duplicates and shingling算法,服务端用c实现,客户端用java实现,利用thrift框架进行通信,为了提高扩展性,去重可以在服务端实现,服务器也提供了计算的接口,方便客户端自己扩展☆24Updated 11 years ago
- 基于java实现的有限状态自动机,轻松,快捷,高效的关联状态的扭转☆15Updated 6 years ago
- Chinese Word Segmentation Tool, THULAC的Java实现.☆86Updated 4 years ago
- A simple implementation of simhash algorithm by java.☆154Updated 5 years ago
- crf-seg:用于生产环境的中文分词处理工具,可自定义语料、可自定义模型、架构清晰,分词效果好。java编写。☆14Updated 4 years ago
- The missing SVM-based text classification module implementing HanLP's interface☆46Updated 8 years ago
- Document preprocessing for preparing formatted input data which is suitable for LibSVM tool.☆50Updated 8 years ago
- 中文分词、统计词频、比对文本相似度☆40Updated 6 years ago
- a word2vec impl of Chinese language, based on deeplearning4j and ansj☆28Updated 4 years ago
- 一款基于Java注解的elasticsearch mapping生成工具,支持ES 5.2.0所有可选参数☆21Updated 8 years ago
- 基于hanlp的elasticsearch分词插件☆157Updated 4 years ago
- 一套涵盖核心编程,人工智能,数字图像处理,自然语言处理,推荐与搜索,云服务领域的Java框架.☆88Updated 3 years ago
- 实现中文文本分类,支持文件、文本分类,基于多项式分布的朴素贝叶斯分类器。由于工作实际应用是二分类,加之考虑到每个分类属性都建立map存储词语向量可能引起的内存问题,所以目前只支持二分类。当然,直接复用这个结构扩展到多分类也是很容易。之所以自己写,主要原因是没有仔细研读mah…☆22Updated 9 years ago
- 自定制的精准短文本搜索服务☆18Updated 4 years ago
- 拼音和汉字之间的转换、简体汉字和繁体汉字之间的转换☆148Updated 3 years ago
- HanLP中文分词Lucene插件,支持包括Solr在内的基于Lucene的系统☆297Updated 5 years ago
- A Java port of darts-clone.☆45Updated 11 years ago