Kooooooma / DoubleArrayTrie
DoubleArrayTrie Java 实现类
☆15Updated 6 years ago
Related projects ⓘ
Alternatives and complementary repositories for DoubleArrayTrie
- 自定制的精准短文本搜索服务☆18Updated 3 years ago
- Tree-split 搬新家..给各位带来的不便深表歉意☆57Updated 8 years ago
- A Java port of darts-clone.☆44Updated 10 years ago
- 高级结构双数组Trie树(DoubleArrayTrie) java实现☆22Updated 3 years ago
- Java porting of Darts (Double ARray Trie System)☆268Updated 6 years ago
- 这是Word2vec和Doc2vec的一个应用示例:用Word2vec计算词的相似度和用doc2vec计算句子的相似度。☆26Updated 7 years ago
- Aho-Corasick的Java实现,针对Ascii优化,支持Unicode。☆189Updated 10 years ago
- Simhash Java单机实现☆106Updated 2 years ago
- 基于Java实现AhoCorasick自动机框架☆22Updated 5 years ago
- 语义、情感、相似度分析。☆57Updated 9 years ago
- Elasticsearch Plugin for Dynaic Synonym Token Filter.☆46Updated 7 years ago
- This is a light distributed real time computing framework. It can help you quickly setup a your-self defined distributed real time comput…☆90Updated 8 years ago
- Chinese Word Segmentation Tool, THULAC的Java实现.☆85Updated 3 years ago
- 同义词词林扩展版相似度计算-Java☆25Updated 9 years ago
- Text Classification ToolKit☆22Updated 6 years ago
- 使用Spark NaiveBayes 实现中文文本分类 use spark NaiveBayes for text classifi…☆25Updated 6 years ago
- 基于标题分类的主题句提取方法可描述为: 给定一篇新闻报道, 计算标题与新闻主题词集的相似度, 判断标题是否具有提示性。对于提示性标题,抽取新闻报道中与其最相似的句子作为主题句; 否则, 综合利用多种特征计算新闻报道中句子的重要性, 将得分最高的句子作为主题句。☆39Updated 8 years ago
- 一款运行于Elasticsearch之上的中文拼音智能分词插件,支持全拼、首字母、中文混合搜索☆155Updated 10 months ago
- 实现中文文本分类,支持文件、文本分类,基于多项式分布的朴素贝叶斯分类器。由于工作实际应用是二分类,加之考虑到每个分类属性都建立map存储词语向量可能引起的内存问题,所以目前只支持二分类。当然,直接复 用这个结构扩展到多分类也是很容易。之所以自己写,主要原因是没有仔细研读mah…☆23Updated 8 years ago
- 新闻评论观点挖掘系统,粗粒度的分析出新闻网评观点的倾向和走势☆53Updated 9 years ago
- elasticsearch-jdbc,在elasticsearch-sql的jdbc实验特性基础上完成,可使用sql和rest api的方式执行elasticsearch操作☆20Updated 5 years ago
- 把李航老师《统计学习方法》的后几章的算法都用java实现了一遍,实现盒子与球的EM算法,扩展到去GMM训练,后来实现了HMM分词(实现了HMM分词的参数训练)和CRF分词(借用CRF++训练的参数模型) ,最后利用tensorFlow把BiLSTM+CRF实现了,然后为luc…☆24Updated 2 years ago
- Expose a server running on your local machine to the internet, like Ngrok, based on Netty☆14Updated 3 years ago
- Document preprocessing for preparing formatted input data which is suitable for LibSVM tool.☆50Updated 7 years ago
- 复旦的中文自然语言工具包☆70Updated 7 years ago
- recommend system study☆67Updated 11 years ago
- 基于hanlp工具包的es分词插件☆10Updated 6 years ago
- FoolNLTK java version☆82Updated 5 years ago