当前位置:文档之家› 规 则 推 理 算 法 T r e a t

规 则 推 理 算 法 T r e a t

深度学习资源Table of ContentsCommon Lisp以下是根据不同语言类型和应用领域收集的各类工具库,持续更新中。

通用机器学习Recommender?- 一个产品推荐的C语言库,利用了协同过滤.计算机视觉CCV?- C-based-Cached-Core Computer Vision Library ,是一个现代化的计算机视觉库。

VLFeat?- VLFeat 是开源的 computer vision algorithms库, 有Matlab toolbox。

计算机视觉OpenCV?- 最常用的视觉库。

有 C++, C, Python 以及 Java 接口),支持Windows, Linux, Android and Mac OS。

DLib?- DLib 有 C++ 和 Python 脸部识别和物体检测接口。

EBLearn?- Eblearn 是一个面向对象的 C++ 库,实现了各种机器学习模型。

VIGRA?- VIGRA 是一个跨平台的机器视觉和机器学习库,可以处理任意维度的数据,有Python接口。

通用机器学习MLPack?- 可拓展的 C++ 机器学习库。

DLib?- 设计为方便嵌入到其他系统中。

encog-cppVowpal Wabbit (VW)?- A fast out-of-core learning system.sofia-ml?- fast incremental 算法套件.Shogun?- The Shogun Machine Learning ToolboxCaffe?- deep learning 框架,结构清晰,可读性好,速度快。

CXXNET?- 精简的框架,核心代码不到 1000 行。

XGBoost?- 为并行计算优化过的 gradient boosting library.CUDA?- This is a fast C++-CUDA implementation of convolutional [DEEP LEARNING]Stan?- A probabilistic programming language implementing full Bayesian statistical inference with Hamiltonian Monte Carlo samplingBanditLib?- A simple Multi-armed Bandit library.Timbl?- 实现了多个基于内存的算法,其中 IB1-IG (KNN分类算法)和 IGTree(决策树)在NLP中广泛应用.自然语言处理MIT Information Extraction Toolkit?- C, C++, and Python 工具,用来命名实体识别和关系抽取。

CRF++?- 条件随机场的开源实现,可以用作分词,词性标注等。

CRFsuite?- CRFsuite 是条件随机场的实现,可以用作词性标注等。

BLLIP Parser?- 即Charniak-Johnson parser。

colibri-core?- 一组C++ library, 命令行工具以及Python binding,高效实现了n-grams 和 skipgrams。

ucto?- 多语言tokenizer,支持面向Unicode的正则表达式,支持FoLiA 格式.libfolia?- C++ library for the?FoLiA formatMeTA?-?MeTA : ModErn Text Analysis?从巨量文本中挖掘数据。

机器翻译EGYPT (GIZA++)NiuTrans语音识别Kaldi?- Kaldi是一个C ++工具,以Apache许可证V2.0发布。

Kaldi 适用于语音识别的研究。

Sequence AnalysisToPS?- This is an objected-oriented framework that facilitates the integration of probabilistic models for sequences over a user defined alphabet.自然语言处理Cortical.io?- Retina: 此API执行复杂的NLP操作(消歧义,分类,流文本过滤等),快速、直观如同大脑一般。

CoreNLP?- Stanford CoreNLP 提供了一组自然语言分析工具,可采取raw英语文本输入并给出单词的基本形式。

Stanford Parser?- parser是一个程序,能分析出句子的语法结构。

Stanford POS Tagger?- 词性标注器Stanford Name Entity Recognizer?- 斯坦福大学NER是一个Java实现的命名实体识别器。

Stanford Word Segmenter?- 原始文本的token化是许多NLP任务的标准预处理步骤。

Tregex, Tsurgeon and Semgrex?- Tregex是匹配树模式的工具,基于树的关系和正则表达式的节点匹配(short for "tree regular expressions")。

Stanford Phrasal: A Phrase-Based Translation SystemStanford English Tokenizer?- Stanford Phrasal 是最先进的统计的基于短语的机器翻译系统,用Java编写。

Stanford Tokens Regex?- A tokenizer divides text into a sequence of tokens, which roughly correspond to "words"Stanford Temporal Tagger?- SUTime 是识别和规范时间表达式的库。

Stanford SPIED?- 从种子集开始,迭代使用模式,从未标注文本中习得实体。

Stanford Topic Modeling Toolbox?- 主题建模工具,社会学家用它分析的数据集。

Twitter Text Java?- Java实现的Twitter文本处理库。

MALLET?- 基于Java的软件包,包括统计自然语言处理,文档分类,聚类,主题建模,信息提取,以及其它机器学习应用。

OpenNLP?- 一个基于机器学习的自然语言处理的工具包。

LingPipe?- 计算语言学工具包。

ClearTK?- ClearTK提供了开发统计自然语言处理组件的框架,其建立在Apache UIMA之上。

Apache cTAKES?- Apache 临床文本分析及知识提取系统(cTAKES)是从电子病历、临床文本中进行信息抽取的一个开源系统。

通用机器学习aerosolve?- Airbnb 从头开始设计的机器学习库,易用性好。

Datumbox?- 机器学习和统计应用程序的快速开发框架。

ELKI?- 数据挖掘工具. (非监督学习: 聚类, 离群点检测等.)Encog?- 先进的神经网络和机器学习框架。

Encog中包含用于创建各种网络,以及规范和处理数据的神经网络。

Encog训练采用多线程弹性的传播方式。

Encog还可以利用GPU的进一步加快处理时间。

有基于GUI的工作台。

H2O?- 机器学习引擎,支持Hadoop, Spark等分布式系统和个人电脑,可以通过R, Python, Scala, REST-JSON调用API。

htm.java?- 通用机器学习库,使用Numenta’s Cortical Learning Algorithmjava-deeplearning?- 分布式深度学习平台for Java, Clojure,ScalaJAVA-ML?- Java通用机器学习库,所有算法统一接口。

JSAT?- 具有很多分类,回归,聚类等机器学习算法。

Mahout?- 分布式机器学习工具。

Meka?- 一个开源实现的多标签分类和评估方法。

基于weka扩展。

MLlib in Apache Spark?- Spark分布式机器学习库Neuroph?- 轻量级Java神经网络框架ORYX?- Lambda Architecture Framework,使用Apache Spark和Apache Kafka实现实时大规模机器学习。

RankLib?- 排序算法学习库。

Stanford Classifier?- A classifier is a machine learning tool that will take data items and place them into one of k classes.SmileMiner?- Statistical Machine Intelligence Learning Engine SystemML?- 灵活的,可扩展的机器学习语言。

WalnutiQ?- 面向对象的人脑模型Weka?- WEKA是机器学习算法用于数据挖掘任务的算法集合。

语音识别CMU Sphinx?- 开源工具包,用于语音识别,完全基于Java的语音识别库。

数据分析、可视化Hadoop?- Hadoop-HDFSSpark?- Spark 快速通用的大规模数据处理引擎。

Impala?- 实时Hadoop查询。

DataMelt?- 数学软件,包含数值计算,统计,符号计算,数据分析和数据可视化。

Dr. Michael Thomas Flanagan's Java Scientific LibraryDeep LearningDeeplearning4j?- 可扩展的产业化的深度学习,利用并行的GPU。

计算机视觉Scikit-Image?- Python中的图像处理算法的集合。

SimpleCV?- 一个开源的计算机视觉框架,允许访问几个高性能计算机视觉库,如OpenCV。

可以运行在Mac,Windows和Ubuntu Linux操作系统上。

Vigranumpy?- 计算机视觉库VIGRA C++ 的Python绑定。

自然语言处理NLTK?- 构建与人类语言数据相关工作的Python程序的领先平台。

Pattern?- 基于Python的Web挖掘模块。

它有自然语言处理,机器学习等工具。

Quepy?- 将自然语言问题转换成数据库查询语言。

TextBlob?- 为普通的自然语言处理(NLP)任务提供一致的API。

构建于NLTK和Pattern上,并很好地与两者交互。

YAlign?- 句子对齐工具,从对照语料中抽取并行句子。

相关主题