我自己的硕士论文是用Python做数据分析的( )
这个回答,可能不是很适合题主。题主应该就是想稍微用一下Python. 我这里介绍的是系统性、偏重使用的。
1. 什么样的教程最好,最快、最适合入门 对于0基础的人来说,最简答的办法是从例子开始。比如说,一个实际的数据分析,然后你跟着走一边,从读入数据、画图,怎么解释数据,其实就都大概懂了。而不是先去学Python语言特性,然后再去看某些库的文档(Numpy, Matplotlib, Pandas等等)。
另外重要的,就是最好能有视频教程。因为你可能也不知道怎么安装、使用Python和相关的库,怎么使用Git, 用什么样的编辑器(IDE)来写代码等等。这些东西,如果有视频的话,其实就一目了然了。看起来比书快很多。
也就是说最理想的教程,应该是以
例子入手(而不是Python基础、要素入手),而且最好有视频 2. 具体教程 国内中文的教程不清楚;英文的话,目前没有碰到过特别优秀的,完全符合上述要求的
说说我熟悉的教程,都是英文的
①Havard CS109 Data Science
首推。内容包括最基础的概率、统计分析,到更深的Machine Learning。既包括理论内容讲解,也包括实际的编程(用的Python)。课堂讲解、程序均有相应视频(而且有英文字幕)。有案例作业,拿数据进行分析,可以仔细的学习参考答案里面的代码(也就是有编程案例)。完全免费。
不过,为什么还要学概率论这些一大堆东西?(这也是我最开始说的,这篇答案不是适合楼主的轻量级需求)
因为,你以为你想要学的是Python, 而实际上是分析数据的方法,这个是任何文档、编程的书无法教给你的。但却是最重要的。也就是背后的理论、思考等等。
这个教程唯一的缺点,就是没有书。很难去快速查询、复习。比如再学完这门课,碰到一个东西,想要查的时候。无从查起。
②Udemy, Learning Python for Data Analysis and Visualization
当时,按照我对于理想教程的要求,买的。Udemy上评价最好,卖得最好的教程
然而,并不好。不推荐。
为什么?因为这里的视频,仅仅是把文档重新讲了一遍,在最后才有一个例子。没有人需要先学习如何“查询数据”,如何“画柱状图”。这种东西大家都可以搜得到。真正缺乏的,是以问题为导向,把这些东西实际运用起来。
对我来说,这个教程最大的好处,是知道了Kaggle,可以瞻仰一下真正大牛们是怎样用Data Science来解决问题的
剩下的,就没有什么教程了。也就是我开始说的,缺乏系统性的教程。只是,再次强调一下,不学什么。
不从0开始学Python语言。 为什么?简单的If, For loop这些,其实大家都会。Python的基本语言,一看就懂,完全不需要在开始去系统的读Python的教学。真正缺的,反而是例子,而且是使用Pandas, Matplotlib等等库的例子。
这样子,能够在最短的时间内,见到学习效果。
只有当你真正发现,Python不会写。或者代码组织很麻烦。或者看到的代码不理解的时候,才需要去认真学Python语言。其实这个时候,也才真正学得进去。
或者,可以直接读《Data Science from Scratch: First Principles with Python》,里面Python Crash Course一部分,1个小时就足够了解Python的基本语法和一些特性。 这本书里其他的东西,就完全不要看了。因为是讲的是如何去实现Pandas, Numpy中的某些内容。而没有讲实际Pandas, Numpy等等的使用技巧。
3. 一些补充 就像上面说的,Python只是一门语言。一般的数据分析,Python, R, Matlab,甚至Excel都可以做。很多同学可能已经会Matlab了,那么其实直接用Matlab就行了