分类 数据科学 下的文章

计算机先知的诚若所思


计算机科学在商业上的应用蓬勃发展,掩盖了其在大众眼中竞争情报上重要历史和现实意义。恰好接触到一篇Vannevar Bush于1945年7月发表于大西洋月刊(The Atlantic Monthly)的文章《As We May Think》(广泛翻译为诚若所思),关于信息的内容深刻的影响了情报学科。

856px-The_Memex_(3002477109).jpg

文章基于科学技术文献的爆炸式增长以及国家、社会、公众及科研本身对科技文献的大量个性化需求的背景,作者构想了 “memex”的概念,被视为当前数字图书馆的起源和雏形,提出了信息采集、信息存储以及信息检索的新方案,对后来信息系统的设计提供了参考,同时也为后来超链接产生提供模型。


人工智能的7大关键技术


企业使用AI的一个复杂因素是,这个主题包含了多个不同的底层技术。这些技术中大多数都能够完成很多替代功能。技术和功能的组合非常复杂,表中列出了7项关键技术,包括每项技术的简要描述,以及它们可以实现的一些典型功能或应用程序。

ae82bc5e225b4141b5012182df04921e.png

本文摘编自《数字时代的企业AI优势:IT巨头的商业实践》,将简要介绍这个表中的每种技术及其功能。本文作者托马斯·H. 达文波特(Thomas H. Davenport)是巴布森学院(Babson College)的信息技术与管理教授,同时也是德勤战略和分析实践部门的高级顾问。


学习数据科学的100天教程


100.JPG

Sharan 是一位数据科学专业人士,在高级分析和应用机器学习方面拥有十年的经验。他写了两本书。《掌握社交媒体挖掘》(Mastering Social Media Mining with R)是关于使用各种社交媒体API来获取数据并开发有趣的分析用例的,而《数据科学要领》(R Data Science Essentials)则是关于数据分析中必不可少的概念和技术的。How to Learn Data Science (A Step-by-Step Guide) 介绍学习数据科学的分步指南。


生物信息分析的三大数据科学工具


Bioinformatics

生物信息学(Bioinformatics)是利用应用数学、信息学、统计学和计算机科学的方法研究生物学问题的学科。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索、处理及利用。当前主要的研究方向有:序列比对、序列组装、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及创建进化模型。