分类 数据科学 下的文章

人工智能的7大关键技术


企业使用AI的一个复杂因素是,这个主题包含了多个不同的底层技术。这些技术中大多数都能够完成很多替代功能。技术和功能的组合非常复杂,表中列出了7项关键技术,包括每项技术的简要描述,以及它们可以实现的一些典型功能或应用程序。

ae82bc5e225b4141b5012182df04921e.png

本文摘编自《数字时代的企业AI优势:IT巨头的商业实践》,将简要介绍这个表中的每种技术及其功能。本文作者托马斯·H. 达文波特(Thomas H. Davenport)是巴布森学院(Babson College)的信息技术与管理教授,同时也是德勤战略和分析实践部门的高级顾问。


学习数据科学的100天教程


100.JPG

Sharan 是一位数据科学专业人士,在高级分析和应用机器学习方面拥有十年的经验。他写了两本书。《掌握社交媒体挖掘》(Mastering Social Media Mining with R)是关于使用各种社交媒体API来获取数据并开发有趣的分析用例的,而《数据科学要领》(R Data Science Essentials)则是关于数据分析中必不可少的概念和技术的。How to Learn Data Science (A Step-by-Step Guide) 介绍学习数据科学的分步指南。


生物信息分析的三大数据科学工具


Bioinformatics

生物信息学(Bioinformatics)是利用应用数学、信息学、统计学和计算机科学的方法研究生物学问题的学科。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索、处理及利用。当前主要的研究方向有:序列比对、序列组装、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及创建进化模型。


数据科学十大清单


Mojeed Abisiga, Data Scientist & Machine Learning Engineer的《The List of Top 10 Lists in Data Science》一文为您提供了数据科学家所需的关键信息,这样您就可以有效地利用时间,灵活地探索数据科学的职业道路,帮助您找到穿越数据科学迷宫的方法。

site-logo.png

在这份列表中,作者多次提到Kaggle——Kaggle是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。这一众包模式依赖于这一事实,即有众多策略可以用于解决几乎所有预测建模的问题,而研究者不可能在一开始就了解什么方法对于特定问题是最为有效的。各种公司或平台将需要解决的问题挂在Kaggle平台上,通过悬赏找出最佳方案。对那些研究数据分析、机器学习领域的人来说,Kaggle就是一场“华山论剑”。


深度学习入门教材


编写Grokking Deep Learning旨在帮助您为深度学习奠定基础,以便您可以掌握主要的深度学习框架。它从关注神经网络的基础开始,然后切换其重点以提供对高级层和体系结构的深入了解。

Trask_GDL_hires.png

如果您已经通过了高中数学并掌握了Python的知识,那么您就可以开始学习本书了。


会撒谎的统计数字和统计图表


对于统计数据,我们似乎对其有着某种天然的信任感,认为其代表着客观公正,数据不会说谎乃至成为了我们的潜意识,在许多时候成为了我们评判事物好坏与否的标准。

xVVorWIX56RKGV8jAZPO.jpeg

但现实的悖论在于,许多聪明的人或机构就是抓住了我们对于数据的这种天然的信任感做起了文章,通过各种统计手段得出各种或好或坏的各种数据,进而影响普通消费者的判断。统计数字和统计图表撒谎的手段通常有:采用不同统计口径的统计数据、忽略规模基数的统计数据和图表扩大化造就视觉误差等。