微软开放源分布式机器学习工具包以便更有效地大数据研究
- 来源:电脑问题网
- 作者:大数据
- 审核:志强网络科技有限公司
- 时间:2015-11-15 14:22
- 阅读: 次
电脑问题网-大数据 为了使大模型使用只是谦虚的群集的训练,以有效的方式,微软最近发布了分布式机器学习工具包 (DMTK),包含两个算法和系统创新。这使得大数据的研究,更可扩展、 灵活和高效。
该工具包,现在可用在 GitHub 上,为分布式的机器学习设计 — — 并行使用多台计算机来解决一个复杂的问题。它包含参数的基于服务器的编程框架,使得机器学习任务对大数据高度可扩展、 灵活和高效。它还包含两个的分布式的机器学习算法,可以用于训练速度最快、 规模最大的主题模型和世界最大的嵌字型号。
该工具包提供丰富、 使用方便的 Api,以减少分布式的机器学习的障碍,所以研究人员和开发人员可以专注于核心机器学习任务像数据、 模型和培训。
DMTK 的当前版本包括以下组件 (更多组件将添加到未来版本):
DMTK 框架: 一个灵活的框架,支持统一的数据并行,大模型存储模型大模型训练和高的训练效率自动流水线调度的混合数据结构的接口。
LightLDA,极其快速和可扩展主题模型算法,与 o (1) 吉布斯采样器和高效分布式实现。
分布式 (Multisense) 嵌字 (多感觉) 词嵌入算法的分布式版本。
机器学习研究人员和从业人员也可以生成自己分布式的机器学习算法在我们与他们现有的单机器算法小修改的框架上。
- 上一篇:在印度数字印度:同一硬币两个面
- 下一篇:开放源代码许可项目申请远远超出软件开发
推荐阅读
热点排行