2018年2月份Github上最热门的数据科学和机器学习项目

开源最前线(ID:OpenSourceTop) 猿妹 编译

链接:https://www.analyticsvidhya.com/blog/2018/03/top-5-github-repositories-february-2018/

GitHub项目仓库是一个很好的协作工具,能够帮助开发者更加方便快捷的跟进该领域最新的开发项目,同时,还可以与其他数据科学家的其他项目进行合作。


Analytics Vidhya每个月都会整理出GitHub上最热门的5个数据科学和机器学习项目,不多说了,一起来看下本月都有哪些项目:



1、FastPhotoStyle



FastPhotoStyle是NVIDIA开发的一个Python库。给定目标照片和样式参考照片,代码可以将样式参考照片的风格转移到目标照片。


开发人员举了两个例子来说明算法的工作原理。首先是一个非常简单的迭代 - 先将样式参考照片源的样式转移至目标照片,然后重新调整它们的大小,简单地运行照片级逼真的图像样式代码。在第二个示例中,使用语义标记映射创建风格化的图像。(项目地址:https://github.com/NVIDIA/FastPhotoStyle



2、Twitter Scraper(Twitter 爬虫)



如果你曾经从Twitter上爬过推文,你肯定使用过它自带的API,但它有其局限性,并不容易处理。这个python库正是在考虑到这一点的情况下创建的 - 它没有API流速限制(不需要身份验证),而且速度非常快。你可以使用这个库来爬取任何用户的推文


开发人员提到它可以用来制作马尔可夫链。但它目前只适用于python版本3.6+。(项目地址:https://github.com/kennethreitz/twitter-scraper



3、Handwriting Synthesis



这是Alex Graves撰写的《Generating Sequences with Recurrent Neural Networks'》论文中提出的笔迹综合实验的一个实现。可以生成不同风格的手写字迹。基于启动(priming)和偏置(biasing),启动控制样品的风格和偏压控制样品的整洁。


在GitHub页面还有更多迷人的多样性的样本,目前作者正在寻找贡献者来加强存储库,所以如果你感兴趣,可以深入了解下!(项目地址:https://github.com/sjvasquez/handwriting-synthesis



4、ENAS PyTorch



这个项目是对论文《Efficient Neural Architecture Search (ENAS) via Parameters Sharing(参数共享的高效神经网络结构搜索)》的实现。ENAS它们减少了计算需求,也就是GPU的神经架构搜索时间降低了1000倍。他们通过大型计算图中的子图模型之间的参数共享来完成此操作。


如何使用在GitHub页面上有完整的介绍。使用这个库的先决条件是:

● Python 3.6+

● PyTorch

● tqdm,imageio,graphviz,tqdm,tensorboardX



5、Sign Language



这是一个相对简单却十分吸引人的机器学习项目。开发人员在 python 中使用卷积神经网络构建模型,可以识别出手势,并将其转换成机器上的文本。


作者用 Tensorflow 和 Keras 共同构建了 CNN 模型。同时特别详细地说明了他是怎么创建这个项目的,以及每一步是怎么进行的。这个项目十分值得你一试。(项目地址:https://github.com/carpedm20/ENAS-pytorch


以上这些项目你觉得对你们有帮助么?或者你还知道哪些很好的其他GitHub项目,可以在下面的评论部分告诉我们!

推荐↓↓↓
人工智能与大数据
上一篇:写给技术小白的比特币入门指南 下一篇:核心代码从Python换成Go语言,提速30倍!