您当前的位置:中国品味生活网 资讯 正文

2019年不行错失的45个AI开源东西你想要的都在这儿

2019-11-02 21:47:44  阅读:8985 作者:责任编辑NO。郑子龙0371

收拾 | Jane

出品 | AI科技大本营(ID:rgznai100)

一个好东西,能进步开发功率,优化项目研制进程,无论是企业仍是开发者个人都在寻求合适自己的开发东西。可是,选择正确的东西并不简单,有时这乃至是一项艰巨的使命。

2018 年末,咱们收拾了上一年备受重视的 Python开源东西与项目 Top100

、Github 开源项目总结状况以及最受欢迎开源项目 Top200。今日,AI科技大本营(ID:rgznai100)经过收集这一年(2018.10--2019.10)国内外新发布的 AI 东西,从中选择出了 45 个备受欢迎的开源东西,期望你不再错失。

Google

开源地址:

https://github.com/google/jax

2、AdaNet【Stars:2.9k】

AdaNet 是一款依据TensorFlow 的轻量型结构。能够运用最少的专家干涉来主动学习高质量模型,AdaNet供给的通用结构,不只能够用于学习神经网络架构,还能够学习集成,然后获得更好的模型。

开源地址:

https://github.com/tensorflow/adanet

3、TensorFlow Extended (TFX)【Stars:720】

开源地址:

https://github.com/tensorflow/tfx

开源地址:

https://github.com/tensorflow/federated

开源地址:

https://github.com/google/mediapipe

谷歌 X 试验室与加拿大 Perimeter 理论物理研讨所(Perimeter Institute for Theoretical Physics )的研讨人员合作开发了张量网络TensorNetwork,以 TensorFlow 作为后端,针对 GPU 处理进行了优化。与在 CPU 上核算作业比较,能够完成高达 100 倍的加速。这是一个全新的开源库,旨在进步张量核算功率。

开源地址:

https://github.com/google/tensornetwork

7、GPipe

GPipe 是一个分布式机器学习库,运用同步随机梯度下降和流水线并行技能进行练习,适用于任何由多个序列层组成的 DNN。重要的是,GPipe 让研讨人员无需调整超参数,即可轻松布置更多加速器,然后练习更大的模型并扩展功用。

开源地址:

https://github.com/tensorflow/lingvo/blob/master/lingvo/core/gpipe.py

8、 MLIR【Stars:1.5k】

MLIR 经过界说一个通用的中心表明,将在TensorFlow和相似的ML结构中履行高功用机器学习模型所需的基础设施进行共同,包含高功用核算技能运用或强化学习这类查找算法的集成。MLIR旨在下降开发新硬件的本钱,并进步现有TensorFlow用户的可用性。

开源地址:

https://github.com/tensorflow/mlir

DeepMind

中心的 OpenSpiel 完成依据 C ++ 和 Python 绑定,这有助于在不同的深度学习结构中选用。该结构包含一系列游戏,答应 DRL agent 学会合作和竞赛行为。一起,OpenSpiel 还包含查找、优化和单一 agent 等多种 DRL 算法组合。

开源地址:

https://github.com/deepmind/open_spiel

开源地址:

https://github.com/deepmind/spriteworld

强化学习行为套件(bsuite,The Behaviour Suite for Reinforcement Learning )的方针是成为强化学习范畴的 MNIST。具体来说,bsuite是一系列用来杰出 agent 可扩展性要害点的试验。这些试验易于测验和迭代,对基本问题,例如“探究”或“回忆”进行试验。

开源地址:

https://github.com/deepmind/bsuite

Facebook

悉数开源:

https://ai.facebook.com/results/open-source/?content_types%5B0%5D=blog

开源地址:

https://github.com/facebookresearch/LASER

10月11日,Facebook发布了Detectron2,这是依据PyTorch结构,以maskrcnn-benchmark为起点对Detectron的完全重写。经过全新的模块化规划,Detectron2灵敏且可扩展,能够在单个或多个GPU服务器上供给愈加速速的练习。

Detectron2现已包含了许多保质量完成的方针检测算法,包含:DensePose, panoptic feature pyramid networks和Mask RCNN的各种变种。,其模块化特性也使其能够有用协助研讨人员探究最先进的算法规划。

开源地址:

https://github.com/facebookresearch/detectron2

3、Habitat-Sim【Stars:549】

Habitat-Sim 是一个仿真的、灵敏、高功用的3D模拟器,可装备署理、多个传感器和通用3D数据集处理,让咱们能够在其间练习和评价 AI智能体。

开源地址:

https://github.com/facebookresearch/habitat-sim

PyText 是一个依据 PyTorch 构建的 NLP 建模(依据深度学习)结构,中心功用能够支撑文本分类、序列标示等神经网络模型。PyText 能够简化作业流程,加速试验,一起还能促进大规划布置。

开源地址:

https://github.com/facebookresearch/pytext

5、Nevergrad【Stars:2.1k】

Nevergrad 是Facebook 内部也在运用的一个无梯度优化 Python东西箱。除了内部项目中运用,还能够广泛运用在机器学习的多种问题中,比方多模态问题、可分离或旋转问题、部分可分离问题、离散、接连或混合等问题。

开源地址:

https://github.com/facebookresearch/nevergrad

6、QNNPACK【Stars:1.2k】

QNNPACK(量化神经网络包)是一个针对低精度高功用神经网络推理的移动端优化库。据官方发布,QNNPACK能够成倍提高神经网络的推理功率,现已成为 PyTorch 1.0 的一部分, 也现已被集成到 Facebook 的运用程序中,布置到数十亿台设备上。

开源地址:

https://github.com/pytorch/QNNPACK

PBG 比常用的嵌入软件更快,并在规范基准上生成与最先进模型质量适当的嵌入。有了这个新东西,任何人都能够用一台机器或多台机器并行地读取一个大图并快速生成高质量的嵌入。

开源地址:

https://github.com/facebookresearch/PyTorch-BigGraph

8、 CrypTen【Stars:274】

CrypTen是一个依据PyTorch的隐私维护机器学习结构 。它的方针是让机器学习的实践者能够运用安全地进行核算。

开源地址:

https://github.com/facebookresearch/crypten

开源地址:

https:///facebookresearch/dlrm

11、Pythia【Stars:2.9k】

Pythia 是一个模块化的深度学习结构。它能够支撑视觉和言语范畴的多使命处理,内置各种数据集,一起还支撑数据并行和分布式数据并行的分布式练习,满意用户对丢失、衡量、调度和优化器的定制需求。

开源地址:

https://github.com/facebookresearch/pythia

亚马逊

与传统依据张量(Tensor)的神经网络比较,图神经网络将图 (Graph) 作为输入,从图结构中学习潜在常识,该办法在近些年已被证明在许多场景能够获得很好的作用。但是,运用传统的深度学习结构(比方 TensorFlow、Pytorch、MXNet)并不能方便地进行图神经网络的开发和练习,而DGL作为专门面向图神经网络的结构,能够很好地补偿这一缺点。该结构在开源后于国内外引起了激烈的反应。

开源地址:

http://dgl.ai

https://github.com/dmlc/dgl

2、Neo-AI

Neo-AI 是 AWS 开源一个AI模型优化结构,包含了对 TVM、Treelite、DLR 所做多一些改善与立异。Neo-AI 运转时占用的空间并不大,转化模型的速度能够加速2 倍,但精度并不会遭到丢失,在方针硬件上运转时并不依赖于结构。

开源地址:

https://github.com/neo-ai

微软

开源地址:

https://github.com/microsoft/nni/blob/master/README_zh_CN.md

微软开源的 AI 核算渠道,协助加速机器学习的模型练习进程。供给了完好的 AI 模型练习和资源管理才能,能轻松扩展,并支撑各种规划的私有布置、云和混合环境。

开源地址:

https://github.com/microsoft/pai/blob/master/README.md

3、lnterpretML【Stars:2.1k】

微软开源的可解说机器学习东西包 lnterpretML。它不只能履行许多可了解的模型,也期望协助开发人员能测验各种办法解说模型和体系。

开源地址:

https://github.com/interpretml/interpret

4、PipeDream【Stars:34】

几个月曾经,微软研讨院宣告了Fiddle项目的创立,其包含了一系列的旨在简化分布式深度学习的研讨项目。PipeDreams是Fiddle发布的第一个侧重于深度学习模型并行练习的项目之一。PipeDream选用一种有别于其它办法的方法,运用称为“流水线并行”的技能来扩展深度学习模型的练习。

开源地址:

https://github.com/msr-fiddle/pipedream

Uber

1、Ludwig【Stars:5.9k】

一个依据TensorFlow的东西箱,不用写代码就能够练习和测验深度学习模型。能够协助开发者更好地了解深度学习方面的才能,并能够推动模型快速迭代。对AI专家来说,Ludwig能够简化原型规划和数据处理进程,然后让他们能够专心于开发深度学习模型架构。

开源地址:

https://github.com/uber/ludwig

OpenCV

1、OpenVINO【Stars:873】

OpenVINO 是一个模型练习结构,供给了很多的预练习模型,一起供给模型从头练习与布置的拓宽通道。

开源地址:

https://github.com/opencv/dldt

SciSharp STACK

一个依据 .NET 的机器学习生态,供给一个和 Python 生态体会共同的东西库,让模型搬迁更简单、学习曲线最低。SciSharp 从最基本的张量核算库 NumSharp 开端构建,到 TensorFlow Binding,再到吸纳其它深度学习库 SiaNet 做 ArrayFire.NET,最后到开发ICSharpCore以支撑Jupyter Notebook调试。

开源地址:

https://github.com/SciSharp/TensorFlow.NET

开源地址:

https://github.com/SciSharp/Numpy.NET

阿里

开源地址:

https://github.com/alibaba/euler/wiki

开源地址:

https://github.com/alibaba/x-deeplearning

开源地址:

https://github.com/alibaba/MNN/blob/master/README_CN.md

腾讯

开源地址:

https://github.com/Angel-ML/angel

字节跳动

1、BytePS【Stars:1.9k】

BytePS 是本年字节跳动发布的一款高功用的通用分布式练习结构。它支撑TensorFlow、Keras、PyTorch 和 MXNet,能够在TCP或RDMA网络上运转。BytePS在很大程度上优于现有的开源分布式练习结构。

开源地址:

https://github.com/bytedance/byteps

商汤

香港中文大学-商汤联合试验室开源了依据 PyTorch 的检测库——mmdetection。这个开源库供给了已揭露宣布的多种视觉检测中心模块。经过这些模块的组合,能够敏捷搭建出各种闻名的检测结构,比方 Faster RCNN,Mask RCNN,和 R-FCN 等各种新式结构,然后大大加速检测技能研讨的功率。

开源地址:

https://github.com/open-mmlab/mmdetection

2、PySOT【Stars:2.7k】

PySOT 方针盯梢库完成了现在 SOTA 的多个单方针盯梢算法,包含SiamRPN和SiamMask。PySOT 是用 Python 编写,依据 PyTorch 结构完成,一起该项目还包含一个评价盯梢器的Python 接口。

开源地址:

https://github.com/STVIR/pysot

搜狗

1、SMRC【Stars:547】

SMRC(Sogou Machine Reading Comprehension)现在业界最全的TensorFlow版别的阅览了解东西调集,从相关数据集的下载到最后模型的练习和测验,一应俱全。

开源地址:

https://github.com/sogou/SMRCToolkit

蚂蚁金服

开源地址:

https://github.com/sql-machine-learning/elasticdl/

其他

微众银行AI团队开源的联邦学习结构。联盟学习开源项目FATE(Federated AI Technology Enabler),供给了一种依据数据隐私维护的安全核算结构,为机器学习、深度学习、搬迁学习算法供给强有力的安全核算支撑。安全底层支撑同态加密、隐秘同享、哈希散列等多种多方安全核算机制,算法层支撑多方安全核算形式下的逻辑回归、Boosting、联邦搬迁学习等。

该结构能够协助学术研讨人员快速开发算法原型;为工业界人员快速开发运用供给一种简练有用的解决方案,支撑在多场景下的开辟和运用;凭借其灵敏的架构,用户能够轻松地将核算作业布置到多种渠道(CPU、GPU)和设备(桌面设备、服务器集群、移动设备等)

开源地址:

https:///FederatedAI/FATE

2、DeepCTR【Stars:2.2k】

DeepCTR 一个易于运用、模块化和可扩展的依据深度学习的 CTR 模型包,带有许多中心组件层,可用于轻松构建自己定制的模型。

开源地址:

https://github.com/shenweichen/DeepCTR

3、ALiPy【Stars:356】

ALiPy是一个依据Python完成的主动学习东西包,内置20余种主动学习算法,并供给包含数据处理、成果可视化等东西。ALiPy依据主动学习结构的不同部件供给了若干独立的东西类,这样一方面能够方便地支撑不同主动学习场景,另一方面能够运用户自由地安排自己的项目,用户能够不用承继任何接口来完成自己的算法与替换项目中的部件。此外,ALiPy不只支撑多种不同的主动学习场景,如标示价值灵敏,噪声标示者,多符号查询等。

开源地址:

https://github.com/NUAA-AL/ALiPy

4、Real-Time Voice Cloning【Stars:9.1k】

Real-Time Voice Cloning 是论文《Transfer Learning from Speaker Verification to Multispeaker Text-To-Speech Synthesis(SV2TTS)》的完成。SV2TTS 是一个三阶段深度学习结构,能够在 5 秒的音频中创立一个语音的数字表明,并运用它来调整一个经过练习的文本到语音模型,以推行到新的语音。

开源地址:

https://github.com/CorentinJ/Real-Time-Voice-Cloning

5、Weights and Biases 【Stars:1.3k】

一个在机器学习试验进程中用于可视化和盯梢的东西。它与结构无关,比TensorBoard更轻。每次运转一个装有 wandb 的脚本时,都会保存超参数和输出衡量。在练习进程中可视化模型,还能轻松比照模型的版别,还会主动盯梢你的代码、体系目标和装备参数的状况。

开源地址:

https://github.com/wandb/client

送礼时刻

2019年CSDN软件开发者大查询活动现已正式启动了!作为技能开发社区的一份子,咱们诚邀你参加咱们的大查询活动,重磅礼品狂送不断!

参加即有时机获赠,还等什么,快来试试吧~~此外,一切参加查询并提交有用信息的用户,都将第一时刻获赠“2019-2020我国开发者查询报告”电子版!

“如果发现本网站发布的资讯影响到您的版权,可以联系本站!同时欢迎来本站投稿!