2020年9月

生物信息分析的三大数据科学工具


Bioinformatics

生物信息学(Bioinformatics)是利用应用数学、信息学、统计学和计算机科学的方法研究生物学问题的学科。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索、处理及利用。当前主要的研究方向有:序列比对、序列组装、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及创建进化模型。


励志故事:从Python新手到认证TensorFlow开发者


因为新冠疫情宅家无事可做,毕业于印度尼西亚Universitas Pelita Harapan的应用数学本科学生 Grady Matthias Oktavian 在从未用过 Python 编程的情况下,仅用不到两个月时间就拿到了谷歌 TensorFlow 开发者证书,并在Medium撰文《How to go from a Python newbie to a Google Certified TensorFlow Developer under two months》介绍这励志故事。

1_4V7uvW0Rcnap8BiNAJvtcA.jpeg


数据科学十大清单


Mojeed Abisiga, Data Scientist & Machine Learning Engineer的《The List of Top 10 Lists in Data Science》一文为您提供了数据科学家所需的关键信息,这样您就可以有效地利用时间,灵活地探索数据科学的职业道路,帮助您找到穿越数据科学迷宫的方法。

site-logo.png

在这份列表中,作者多次提到Kaggle——Kaggle是一个数据建模和数据分析竞赛平台。企业和研究者可在其上发布数据,统计学者和数据挖掘专家可在其上进行竞赛以产生最好的模型。这一众包模式依赖于这一事实,即有众多策略可以用于解决几乎所有预测建模的问题,而研究者不可能在一开始就了解什么方法对于特定问题是最为有效的。各种公司或平台将需要解决的问题挂在Kaggle平台上,通过悬赏找出最佳方案。对那些研究数据分析、机器学习领域的人来说,Kaggle就是一场“华山论剑”。