以下给出了各种数据分析、人工智能和机器学习相关的免费资源。您可以在线阅读、查看或者下载相关资料。
面试
1. 程序员面试全面指南[查看网页]
求职谷歌的程序员面试指南,使用用于各类职场人学习。
2. 技术面试手册[查看网页]
3. …
Python
1. Python – 100天从新手到大师[查看网页]
非常难得的中文版的Python全栈学习课程。
“目标是打造一个优质的Python交流社区,一方面为想学习Python的初学者扫平入门过程中的重重障碍;另一方为新入行的开发者提供问道的途径,帮助他们迅速成长为优秀的职业人;此外,有经验的开发者可以利用这个平台把自己的工作经验无偿分享或有偿提供出来,让大家都能够得到职业技能以及综合素质的全面提升。”
2. 学习Python3[查看网页]
用Jupyter notebooks学习Python 3。
3. Python项目(Project Python)[查看网页]
交互式电子书,用互动实例学习 Python 语法。
Project Python是一本免费的交互式书籍,它将教您使用Python编写代码,使用图形、动画和游戏。您还将学习解决经典计算机科学问题的方法、软件设计原则以及如何分析算法性能。不需要以前的经验;在第一章结束时,您将编写代码来绘制笑脸。
4. 用Python生成随机数(Generating Random Data in Python)[查看网页][下载网页的PDF版文件]
用 Python语言生成随机数,看这篇非常详细的介绍。
5. 提升Python性能的7个习惯(7 Habits to Improve The Performance of Python Programs)[查看网页][下载网页的PDF版文件]
Python在性能上并不出色,但是有了一些技巧,您可以尝试提高程序性能,避免不必要的资源浪费。
6. 用于教育领域的各种算法的Python实现(All algorithms implemented in Python for education)[查看网页]
这里的代码仅限于实现了算法,其效率未必满足生产需要。
7. Thonny:初学者的Python集成开发环境(Python IDE for beginners)[查看网页]
8. Mu:初级程序员使用的简单Python编辑器[查看网页]
9. Python3 在线基础课程
很基础但很全面的内容,适合初学者。不包含常用的扩展库。
10. 10 minutes to pandas[查看网页]
如果大家计划学习数据分析、机器学习、或者用 Python 做数据科学的研究,那么一定会用到 Pandas 库。Pandas 是一个开源、能用于数据操作和分析的 Python 库。这个链接给出了快速了解Pandas库用法的课程。
11. Python数据科学家手册在线版[查看网页]
基于upyter notebooks。
12. Python 语言的入门和初级应用免费电子书[查看网页]
13. 数据科学-原理与技术[查看网页]
基于Pthon的在线课程。
14. Python Machine Learning Projects[查看网页]
来自的DigitalOcean电子书。
15. 来自的DigitalOcean电子书:How To Code in Python[查看网页]
来自的DigitalOcean电子书。
16. Numpy操作可视化[查看网页][下载网页的PDF文件]
17. “Windows 上的 Python”文档[查看网页]
开始在 Windows 上使用 Python 进行开发,包括设置开发环境、脚本编写和自动化、构建 Web 应用和常见问题解答。
18. …
数据科学、机器学习与人工智能
1. 可解释的机器学习(Interpretable Machine Learning)[查看网页]
机器学习在改进产品,流程和研究方面具有巨大潜力。但计算机通常不解释他们的预测,这是采用机器学习的障碍。本书是关于使机器学习模型及其决策可解释的。
在探索可解释性的概念之后,您将学习简单的可解释模型,例如决策树,决策规则和线性回归。后面的章节侧重于一般模型不可知方法,用于解释黑盒模型,如特征重要性和累积局部效应。
这本书着重于结构化数据的机器学习模型,而较少涉及计算机视觉和自然语言处理任务。对于机器学习实践者、数据科学家、统计学家以及其他对机器学习模型具有解释性感兴趣的人,推荐阅读本书。
2. 预测:原则与实践(Forecasting: Principles and Practice)[查看网页]
免费的在线电子书。
本教材旨在全面介绍预测方法,并提供有关每种方法的足够信息,以便读者能够合理使用它们。我们并不试图对每种方法背后的理论细节进行彻底的讨论,尽管每章末尾的参考文献将填写许多细节。
本书是针对三个受众编写的:(1)当他们可能没有在该领域接受任何正式培训时,他们发现自己正在做商业预测; (2)本科生学习生意; (3)MBA学生做预测选修课。我们自己将它用于在澳大利亚莫纳什大学获得商业学士学位或商业学士学位的学生的第三年学科。
3. 基于模型的机器学习电子书[查看网页]
在过去的几年里,机器学习已经进入了技术世界的中心阶段。今天,成千上万的工程师和研究人员正在把机器学习应用到非常广泛的领域。然而,在实践中有效地利用机器学习可能是令人望而生畏的,尤其是对于这个领域的新手来说。当有人试图使用机器学习解决现实世界的问题时,他们经常会遇到挑战:
- “我被机器学习方法和技术的选择压得喘不过气来。有太多东西要学!”
- “对于我的问题,我不知道该使用哪种算法,也不知道为什么一种算法会比另一种更好。”
- “我的问题似乎不符合任何标准算法。”
对于新手来说,机器学习似乎令人望而生畏。
在这本书中,我们从一个新的角度来看待机器学习,我们称之为基于模型的机器学习。基于模型的机器学习有助于解决所有这些挑战,并使创建有效的机器学习解决方案的过程更加透明。
4. Machine Learning Yearning[查看网页][立即下载]
一本来自Andrew Ng的免费电子书,教你如何构造机器学习项目。这本书的重点不是教你ML算法,而是如何使ML算法工作。在阅读了机器学习的渴望之后,你将能够:
- 优先考虑人工智能项目最有前途的方向
- 机器学习系统中的错误诊断
- 在复杂的设置中构建ML,例如不匹配的训练/测试集
- 建立一个ML项目来比较和/或超越人的水平
- 了解何时以及如何应用端到端学习、转移学习和多任务学习
您可以访问这个网站,填表申请获得电子书;或者也可以在这里立即下载我们已经申请的这本电子书。
5. 概率论(Probability Theory For Scientists and Engineers)[查看网页] [立即下载]
本文阐明概率论的基本概念和操作,其最终目标是揭开在概率论中的计算及其在实践中执行这些计算的神秘面纱。首先介绍抽象集合论,接着介绍概率论,然后在没有任何解释干扰的情况下进行实际实现。在最后考虑概率论的经典应用和随后出现的理论解释之前,更彻底地回顾基于抽样的计算方法。
6. 15种回归[查看网页]
回归技术是用于预测建模和数据挖掘任务的最流行的统计技术之一。平均而言,分析专业人士只知道2-3种回归类型,比如常见的线性回归和logistic回归。但事实上,有10多种回归算法设计用于各种类型的分析。每种类型都有自己的意义。每个分析师都必须知道根据数据类型和分布使用哪种回归形式。
7. 哈佛大学数据科学课程[查看网页][查看网页]
来自哈佛大学工程与应用科学学院的数据科学课程。课程介绍数据分析的五个关键方面:数据整理、清洗和采样,以获得合适的数据集;数据管理,以快速可靠地访问大数据;探索性数据分析,以形成假设和直觉;基于统计方法的预测,如回归和分类;以及通过可视化、故事和可解释的总结交流结果。
课程使用Python完成所有编程任务和项目。
8. FaceBook机器学习视频[查看网页]
《Facebook机器学习领域指南》是Facebook广告机器学习团队开发的一个由六部分组成的视频系列。该系列分享了最佳的现实世界实践,并提供了如何将机器学习能力应用于现实世界问题的实用技巧。
机器学习和人工智能是当今世界的头条新闻,有很多资源可以教你算法的工作原理和最新前沿研究的演示。
9. 计算机科学速成课程[查看网页]
来自油管,转至 B 站的40集视频教程。
10. 50个机器学习数据集[查看网页]
给出50个可以用来训练机器学习模型的大型数据集。
11. 必读的免费数据科学电子书[查看网页]
这里给出了必读的数据科学电子书。包括:
Foundations of Data Science[立即下载]
UFLDL Tutorial
Python Data Science Handbook
Hands-On Machine Learning and Big Data
Think Stats
Think Bayes
EE263: Introduction to Linear Dynamical Systems
Convex Optimization – Boyd and Vandenberghe
Essentials of Metaheuristics
CIML
12. 标准的机器学习教程[查看网页]
Bloomberg 提供的课程涵盖了机器学习和统计建模的各种主题,主要目标是帮助学员深入了解机器学习专家使用的概念、技术和数学框架。它的设计是为了让那些有很强数学背景的人,包括软件开发人员、实验科学家、工程师和金融专业人士,更容易掌握有价值的机器学习技能。
本课程包括一套完整的家庭作业,每个作业都包含一个理论要点和Python支持代码的实现。Python正迅速成为学术界和工业界流行的数据科学和机器学习编程语言。这门课程也为专业课程的开设和进一步的独立学习奠定了基础。
13. 数据挖掘导论(Introduction to Data Mining)[查看网页]
- 提供所有数据挖掘主题的理论和实践覆盖范围。
- 包括大量的综合例子和数字。
- 提供教师资源,包括练习的解决方案和整套演讲幻灯片。
- 假设只有适度的统计学或数学背景,不需要数据库知识。
- 所涉及的主题包括分类、关联分析、聚类、异常检测和避免错误发现。
14. 统计学基础(Tutorial: Basic Statistics in Python — Descriptive Statistics)[查看网页][下载网页的PDF版文件]
“统计领域经常被误解,但它在我们的日常生活中起着至关重要的作用。正确的统计可以让我们从模糊、复杂和困难的现实世界中提取知识。如果使用不当,统计数据可能会被用来伤害和误导。对统计数据和各种统计指标的含义有一个清楚的认识,对于区分真伪是很重要的。”
我们将在本文中介绍以下内容:
- 定义统计
- 描述性统计
- …
15. TensorFlow简明教程(Simple and ready-to-use tutorials for TensorFlow)[查看网页]
这个存储库旨在为TensorFlow提供简单易用的教程。每个教程都包含源代码,其中大多数都有文档支撑。
16. 端到端机器学习教程(An end to end tutorial of a machine learning pipeline)[查看网页]
本教程来自哈佛大学。我们尝试做大多数在线机器学习教程没有做的事情。它不是一个30分钟的教程,教你如何“训练自己的神经网络”或“在30分钟内学会深度学习”。这是一个完整的学习流程,如果你真的使用机器学习,你需要做的-向你介绍所有的部分,所有的实现决策和需要作出的细节。数据集不是MNIST或CIFAR这样的标准集之一,您将使自己成为非常独立的数据集。然后你将经历两个传统的机器学习算法,最后进入深入学习!
17. 获得AWS认证:AWS 的 Machine Learning 培训[查看网页]
深入学习用于培训 Amazon 开发人员和数据科学家的相同机器学习 (ML) 课程。我们提供超过 65 项机器学习培训课程,总时长超过 50 小时,还提供最初为 Amazon 内部使用而开发的动手实践实验室和文档。开发人员、数据科学家、数据平台工程师和业务决策者可以通过这一培训来学习如何将 ML、人工智能 (AI) 和深度学习 (DL) 应用到他们的业务中,从而获得全新见解和价值。通过 AWS Certification.来验证您使用 AWS 云构建、培训、优化和部署 ML 模型的丰富经验。
18. 强化学习导论(Reinforcement Learning: An Introduction)[查看网页][立即下载]
19. 深度学习入门在线阅读[查看网页]
20. 面向机器学习的特征工程[查看网页]
21. 数据科学中的概率[查看网页]
以Python讲解概率知识。
22. 基础数学教程[查看网页]
23. 机器学习如何开始[查看网页]
24. 算法以及讲稿[查看网页]
Jeff Erickson提供免费的算法电子书以及教学过程中的讲稿。
25. 深度学习交互式教程Dive into Deep Learning[查看网页]
26. 。。。
SQL
1. 互动式的SQL教程(ByteScout SQL Trainer)[查看网页]
ByteScout SQL Trainer将通过对常用的SQL查询使用实时数据练习来帮助您学习SQL。
2. SQL格式化工具[查看网页]
Sqlfmt是一个在线SQL格式化程序。它的目的是格式化SQL语句,使其更加优雅。主要特征是:
- 理解PostgreSQL方言,以及任何CockroachDB的扩展
- 尝试以最佳方式使用可用的水平空间
- 无论编辑器配置如何,始终保持视觉对齐,以便在任何选项卡宽度处使用空格或选项卡
3. SQL开源教程[查看网页]
这是一本交互式的书,旨在成为学习SQL的最佳网站。它是免费的,没有广告,不需要注册或下载。它可以帮助您通过对真实数据集运行查询来完成重要的项目。它不仅仅是一个参考页——它传达了一个编写SQL的心理模型。每一章的设计时间约为30分钟。
4.q:对 CSV 文件使用 SQL 数据查询的工具[查看网页]
q是一个命令行工具,允许在csv/tsv(和任何其他表格文本文件)上直接执行类似SQL的查询。
5. …
自然语言处理
1. 自然语言处理初步(Getting started with Natural Language Processing)[查看网页][下载网页的PDF版文件]
自然语言处理(NLP)无处不在,这是一种可以神奇地理解自然语言的技术。比如情感分析,或者机器翻译,都是自然语言处理应用的领域。
现在,你想知道更多关于NLP的信息,但是你不知道从哪里开始。
好吧,这篇文章的目的是概述高质量的阅读材料和资源,让大家了解NLP。这不是一个技术性的帖子,虽然它包含了一些推荐给喜欢编码的人。
数据可视化
1. D3图论[查看网页]
图论(graph theory)应用于数据处理,在社交网络分析方面有着重要应用。这个教程本身就是采用可视化库 D3,把图理论变成了可视化互动教程。
2. D3 In Depth[查看网页]
D3在线教程。
3. colorbrewer2设计色彩模板[查看网页]
4. coolors设计色彩模板[查看网页]
5. 排版实务(BUTTERICK’S PRACTICAL TYPOGRAPHY)[查看网页]
6. 数据可视化基础(Fundamentals of Data Visualization)[查看网页]
这本书的目的是作为一个指导,使形象化,准确地反映数据,讲故事,并看起来专业。这是我在实验室里与学生和博士后一起进行数千种数据可视化工作的经验的结晶。多年来,我注意到同样的问题不断出现。我试图以这本书的形式从这些互动中收集我积累的知识。
7. 中国传统色系[查看网页]
8. 互动式D3教程[查看网页]
9. …
在线工具
1. 在线编程平台
支持Python,R,Julia的在线变成与执行平台。
其他
1. 免费的大学教材(Review the textbook online)[查看网页]
2. 怎样写技术文档(What nobody tells you about documentation)[查看网页][下载网页的PDF版文件][下载网页的PDF版文件(中文版)]
3.谷歌开发者文档写作指南[查看网页]
4. 600门在线课程[查看网页]
5. 艺术品电子图像[查看网页]
6. 一个网页工具,帮助用户去除图像里指定的颜色[查看网页]
7. 全套计算机科学自学课程[查看网页][下载网页的PDF版文件]
可以直接访问网页链接,或者在下载该网页的的PDF文件,里面有所有的课程以及可以直接点击的链接。