深度学习需要的图片哪里来_如何深度学习抽取图片特征并利用这些特征和已知数值建立模型进行预测

⑴ 深度学习是需要掌握什么基础，才能学习

关于编程基础

只会 Java 语言，不会 C/C++/Python 能学习吗？或者学过 C/C++/Python，但是没有实际应用过，或者基础不好，是否可以学？是否有 Python 学习教程推荐？如果 C++/Python 基础比较薄弱，是否可以学？

【回答】完全可以。

我们会跟随实际的代码编写，一步一步进行指导。在数据科学、大数据和机器学习（深度学习）领域，Python 被视作最为简洁和直接的脚本编程语言，被科研领域和工程领域广泛采用，因此本课程也会针对 Python 编程语言本身，跟随编程实战，与大家一起编程的过程中逐步讲解。

事实上 Java 编程语言在大数据处理和机器学习领域的应用也十分广泛，课程中涉及到真实工程代码的部分，我们会将 C++ 与 Java 版本一同展示和讲解。由于这不是一门教学编程语言的课程，更注重于实际应用的编写，因此编程语言特性方面的门槛较低。

本课程着眼于海量数据实时处理和深度神经网络架构和编程，编程语言这块不会是瓶颈。并且，大家会跟随老师一起，编写机器学习代码，也会因此熟悉 Python 编程，事实上这对未来的个人发展和工作具有非常大的帮助。

在课程后半段，我们将会使用前半段课程编写的实验程序，转化为实际的工业级代码和产品，这时将涉及 C/C++ 和 Java 代码的编写。由于 Java 在面向对象的基本结构上与 C++ 十分相似，因此这一块也应当不是问题。

正如前面所阐述的，我们也会同时展示 Java 版本的高层应用实现。最终，同学们会发现这些代码虽然由不同编程语言实现，但大体相当，并无过多区别。另外，针对编程语言方面的疑虑，老师也会手把手从最基本的代码开始编写，并尽可能详细讲解每一段重要的代码。

全课程不仅从理论方面会由浅入深的讲解，编程实战也同样会从最基础部分（包含语言的部分）开始讲解。希望能够打消同学们的疑虑。通过学习本课程，不仅对整个机器学习、深度学习和分布式大数据实时处理有一个全面的认识，而且在非常实际的工程实践，将来找工作和职业发展，都将会有非常大的提升。

如果有其他语言的基础，但是没有 C＋＋和 python 基础也是完全可以学习的，语言只是工具，有其他语言基础学习新语言很快，尤其是 Python 这种语言很简单，而 Java 和 C++ 相比之下可能需要花费更多时间去学习。但本门课程在工程实践环节也会针对编写的代码进行详解，尽可能确保打消大家对这一方面的顾虑。

这个课需要大数据基础吗?

【回答】不需要。

本门课程不仅会讲解机器学习领域的经典理论、算法和工程实践，还有一大特色便是讲解大数据或海量数据的高性能分布式处理，通过这两大领域的学习和碰撞，会为大家未来职业发展和规划起到如虎添翼的作用，这一点在其他课程中较难体现，也是本门课程的主要特色之一。

本课程的老师拥有多年云计算和分布式实时处理方面的经验，同时撰写了相关书籍以及开源的大数据处理框架，拥有丰富经验，以此基础上再讲解机器学习和深度神经网络，让同学们对这一领域的几个关键点都一个较为全面的学习和掌握。

关于数学基础

有的同学有数学基础，但是缺乏 C++/Python 编程语言；有的同学没有数学基础，是否可以学？数学基础需要到什么程度？如果提前学习是否有资料推荐？

【回答】首先学习本门课程并不需要特别高的数学基础，只需要掌握大学本科阶段学习的高等数学、线性代数和概率论等课程。

虽然从应用角度上来看：

如果想要深入研究深度学习，比如完全自己实现不同结构的网络，设计网络的层与参数最好能够熟练运用矩阵理论中的相关工具，但是我相信如果职业道路规划不是算法工程师，一般并不会深入到这一层面。
对应于不同应用领域，还需要不同的数学工具，比如和图像、信号识别相关的领域，图形学等相关的基础功底是必须要有的，但这个已经是复杂的现实应用问题了，并不在本门课程的教学范围之内，本门课程的应用领域还是相对较为简单的。

实际上，如果你是一个工科生，你会发现学习数学最难的地方就是不理解这些数学工具到底能帮助我们去解决什么问题，因为大学老师大多数都是数学专业老师，并不会从学生各自专业的角度来讲解数学问题。但是当你知道你需要用数学工具做什么，有一个明确目标后，你会发现你的动力和学习能力将会有一个突破，你不会觉得这些数学知识是枯燥乏味的。因此哪怕你的数学基础相对薄弱，有一个明确的目的，再去补充这些数学知识，相信学员自己一定能解决这个问题。数学也绝对不是学习这门课的障碍，但是如果你想以其作为职业，去打好这个数学的底子是不可或缺的。

最后，如果你是数学专业，或者觉得自己数学很好的学生，你们也更不用担心不会 1、2 门语言，因为计算机语言只是一种工具，最关键的还是训练自己的思维，这种思维的核心就是数学和算法。如果你数学很好，学习这些语言是很快的，而且本门课程中除了最后的 C++ 开发，也不会应用到什么特别的语法特性。

但是另一方面也不要忽视学习好这些工具的重要性，只是希望学生自己能够权衡。对数学好的同学来说，可能最致命的是一个误区，因为计算机的基础是数学，所以完全使用数学思维去解决计算机问题是没问题的，我这里只能说计算机有自己的思维模式，哪怕是那些基于数学原理的算法问题，所以数学专业的同学必须要学会认识到这种思维的差异并学会使用计算机的思维来解决问题，而机器学习则是计算机思维的一个典型代表，这个将会在课程中具体讨论。

至于需要的数学基础，肯定是希望同学能够学习高等数学中的微积分，线性代数和概率论的相关知识，对于没有实际编程经验的学生则推荐深入学习一下离散数学（无关乎是否精于数学）。本门课程需要的数学基础也就是这些了。

关于内容

深度学习和机器学习的关系是什么？很多同学以为要先学机器学习再学深度学习是这样吗？

【回答】机器学习肯定是深度学习的基础，因为深度学习就是深度神经网络，而人工神经网络则是机器学习的一大经典模型。但是我们要认识到机器学习领域包含的算法和模型太多，因此想要专精深度学习不一定要学会其他许多的机器学习算法和理论。所以我们会在课程中安排机器学习相关的内容，只不过都是机器学习中和深度学习相关的必备基础知识。

但是如果你想要以后往算法工程师发展，去学习熟悉其他的机器学习模型也是必不可少的，只不过本门课程并没有这种要求，所有需要的机器学习知识都会在课程的前半部分详细讲解。

Caffe 框架和 TensorFlow 框架都要学吗？

【回答】首先本门课程主要应用的是 Caffe，但是同样会讲解 TensorFlow 的基本用法，并会进行简单演示。在我们的日常工作中发现 TensorFlow 是目前最强大的机器学习框架，没有之一，而且有 Google 公司的支持，有最庞大的社区，一旦有什么新模型都会有 TensorFlow 的实现可以使用（得益于 TensorFlow 的架构设计）。用 TensorFlow 来进行快速实验是非常好的选择。

但是我们也发现 TensorFlow 有两个比较大的问题，第一个问题是 TensorFlow 的单机执行效率低，尤其是和 Caffe 相比，对于资金并不是很充足的创业公司，在有一定量数据的情况下，并无法支撑一个可以快速运行 TensorFlow 训练的集群，这个时候 Caffe 以及其各种改版往往是更好的选择，而我们日常工作的实验场景就被此局限，因此更偏向于实际使用 Caffe。

第二个问题是 TensorFlow 过于庞大，实际开发产品 SDK 的时候，我们希望训练出来的模型能够直接放到产品中使用，因此训练和产品 SDK 使用的深度学习框架往往是一致或者可以互相转换的。而 TensorFlow 过于庞大复杂，还需要使用专门的构建工具，在实际产品应用集成中往往要使用能够完全掌控的工具和框架并进行修改，TensorFlow 的复杂性正和这种要求背道而驰。当然也可能是我们的工作场景和人员限制导致我们没有人力对 TensorFlow 进行深度研究、裁剪和维护，这也就是我们产品中使用 Caffe 的原因。

关于就业

学习了课程，掌握了这个技能，能不能找到工作，是否有匹配的岗位？

【回答】肯定可以！

不过自己平时更多地去实践是成为某一领域专家的必经之路，这门课程的最大作用之一是让你知道该去学习什么，还有学习的思路、方法，以及平时难以接触到的大型企业实际的工程经验和架构方法，这将对同学们的未来工作和职业发展提供极大帮助。

通过学习本课程，可以匹配到以下几个岗位：

这个实际岗位在很多公司中往往是算法工程师
大数据分析和处理方面的岗位
云计算应用或平台的开发工程师
机器学习或深度学习应用或平台的研发工程师

而算法工程部门的工程师一般会有两类人（除去部门负责人等高级职位）：

一类是能够较熟练运用 1 到 2 门语言（比如 Python、Java 或 C++），数学功底好，熟悉机器学习和深度学习的人，他们的任务是不断优化机器学习模型，进行训练测试，调整参数等，这个过程中也需要编写相当多的脚本来帮助自己解决各种问题。最后要能够编写实际的产品代码，不需要有非常好的架构和设计思想，关键是能够高效地实现某种算法。

一类是有好的编程功底，同时又能够基本理解机器学习和深度学习的人，他们的任务往往是负责封装改良第一类人实现的功能模块，从时间、空间和代码质量上改良模块的实现，同时负责维护完整的算法 SDK，这类 SDK 往往要求能够快速迭代更新，能够配上完整的训练和测试流程，需要开发者具有较强的工程能力还有架构、设计思维。
至于岗位问题同学应该完全不用担心，尤其现在有许多以人工智能为核心的公司如爆发式增长，以及传统 IT 企业向海量数据处理、机器学习和深度学习领域不断加大投入，对这类工程师的需求量极大。

大公司还是小公司需要这种岗位？机器学习工程师的薪资待遇如何？

现在大公司和小公司都有，尤其是以人工智能为主的公司。至于岗位问题同学应该完全不用担心，尤其现在有许多以人工智能为核心的公司如爆发式增长，以及传统 IT 企业向海量数据处理、机器学习和深度学习领域不断加大投入，对这类工程师的需求量极大。

至于薪资待遇方面，由于目前以及可预期的未来很长一段时间，这类岗位的需求和缺口都非常大，相信同学们在学习完本课程后，再加上自己对该领域的实践和工作经验，能够获得高于市场的薪酬水平。

如果你想快速掌握各方面的专业技能，不落后这个人工智能的时代，这绝对是一门你无法忽视的课程。如果你的机器学习基础非常薄弱，没有在工程实践中使用过机器学习，没有实时数据处理的经验，那么，就是它了。

送你价值 200元本课程优惠码【FCXTG3BGYX】，仅限使用 10次

⑵ 深度学习作为输入的图像一般是矢量图吗

深度学习作为输入的图像一般为矢量图。
在电脑中，图像有两种表达方式，一种叫做位图，另一种叫做矢量图。
位图是把一幅彩色图像分成许许多多像素，用若干位数字来指定每个像素的颜色、亮度等属性。因此一幅位图就由许许多多描述每个像素的数据构成，这种表示方法很直观，而且能够很精细地描述图像。位图一般可以通过扫描仪、数码相机等设备获得。影响位图大小的因素是图像的分辨率和颜色数。
矢量图是由一系列电脑指令来表示一幅图，比如画点、画线的指令等，用数学表达式来表示一幅图。在显示图像时，电脑是一边计算一边显示的。矢量图文件的大小取决于完成图像绘制工作所需的指令条数。
矢量图容易做到对图像的移动、缩放和旋转等等。相同的或者类似的图像可以当作构成复杂图像的构件，把它们存放在图库中，以缩短绘图时间，减少矢量图文件的大小。对于一幅很复杂的彩色照片，则很难用数学表达式来表达，这时往往用位图来表示。一般位图文件比矢量图的文件要大。
位图是由像素组成的，在放大位图的时候，如果没有特殊的处理，位图会变得很粗糙，原因是图像的尺寸变大了，而像素的数量却没有改变。
矢量图在放大时，不会出现这种失真，因为矢量图中存放的是绘制图像的信息，不会因为图像大小的改变而改变。
希望我能帮助你解疑释惑。

⑶ 自己学习深度学习时，有哪些途径寻找数据集

如何让深度学习突破数据瓶颈
如果用现有的深度学习去实现这一点，那就需要大量的事故数据，但这方面的数据供给非常有限，而采集数据又难度很大。首先，没有人能够准确预测何时何地会发生何种事故，因此无法系统地提前部署以采集真实事故数据；其次，从法律上来说我们不能靠人为制造事故来采集数据；第三，也无法模拟数据，因为事故更多涉及实时的传感以及与物理世界的互动，模拟出来的数据与真实数据差距很大，这从 DARPA 机器人挑战赛就能看出来；最后，像 AlphaGo 那样，在规则定义明确的简单环境下自行创造大量训练数据的方式，在复杂的真实环境中难以发挥作用。

如果遇到数据量不足的情况，同时又很难通过之前那些行之有效的方式去增加数据供给，那就无法发挥出深度学习的优势。而更重要的是，我们还会遇到数据类型不一样的问题，物理世界中是不同传感器获取的实时数据流，而现在深度学习在信息世界中的应用，比如说图像识别，使用的数据都是基于图片的数据点，而非数据流，所以这也是将深度学习现有的成功延伸到真实物理世界应用的一个底层障碍。

基于这个原因，Demiurge 专注于开发一种系统方法从源头解决真实世界诸多领域中数据量严重不足的问题——既然很难有效增加数据供给，为何不设法大幅降低对数据的需求？

降低对数据量的需求、实现小样本学习甚至 one-shot learning，是目前深度学习研究中的关键问题，Yann LeCun、 Yoshua Bengio 等深度学习专家也多次在演讲中提到解决深度学习中 one-shot learning 问题的重要性。

在今年斯德哥尔摩的全球机器人顶级学术会议 ICRA 上，Bragi 在 Instry Forum 演讲中介绍了 Demiurge 的方法，从神经科学里寻找关键线索，“比起深度学习的点神经元，生物神经元所擅长的是从多模的实时数据流中提取多维度的时空信息来实现 one-shot learning，这是现有的深度学习很难做到的。生物神经元不仅能够做这种特征提取，而且是以一种非常高效的方式，效果和效率都很出色。”

深度神经网络的确从神经科学领域的研究中获取了一些灵感，但其工作原理与人脑截然不同（诚然，我们对大脑的工作原理还没有弄清楚），Yann LeCun 表示，他最不喜欢的对深度学习的定义就是“它像我们的大脑”，谷歌 Jeff Dean 认为深度神经网络是对大脑神经网络的简单抽象，并非是模拟人类神经元如何工作。神经科学专注的点包括计算的细节实现，还有对神经编码以及神经回路的研究。然而，在机器学习领域，人工神经网络则倾向于避免出现这些，而是往往使用简单和相对统一的初始结构，以支持成本函数（cost funcion）的蛮力最优化。

Bragi 从历史的角度分析了深度学习和神经科学的关系，“现在的深度学习从神经科学中获得的灵感非常有限，这是因为深度学习的理论基础是上世纪 80 年代基本定型的，那时之前的神经科学也发展比较慢，无法为深度学习提供更多灵感。而从 80 年代至今，神经科学的发展速度远远超过了之前，过去 30 年产生的神经科学知识是 80 年代以前的 46 倍，而且现在每年神经科学获得新发现的速度是 80 年代以前的 100 倍。所以，对于深度学习来说，如今的神经科学已经是一个非常巨大的宝库，为提升现有深度学习的学习能力提供重要线索。”

Bragi 表示，越来越多的深度学习专家开始研究如何从神经科学中获取更多的线索，“ Yoshua Bengio 做的非常前沿，一方面研究深度学习的反向传播算法在生物神经元上是如何实现的，另一方面研究生物神经元的 STDP 学习算法如何提升现有的深度神经网络的学习能力。位于深度学习与神经科学交汇的最前沿，我们很深刻地体会到现在正在发生着的转型，从深度学习和神经科学没有太大关系的这一代（深度学习1.0），过度到深度学习重新从神经科学获得重要启发的下一代

⑷ arcgis深度学习只能用一张图嘛

是的。
1、标注对象以一张图供深度学习。
2、导出训练数据进行深度学习。
3、训练深度学习模型。
4、使用深度学习检测对象即可。

⑸ 深度学习的具体步骤是什么

你说的这个不算深度学习的范畴，就是一个模式识别，提取图片的特征值文本，这个你用普通的图片识别算法就可以解决，这个已经很成熟了。

⑹ 如何深度学习抽取图片特征，并利用这些特征和已知数值建立模型进行预测

你这应该不是数字图像处理，应该是一种包含其它信息的特殊图片，我的方向是高光谱，如果是结合高光谱图像技术的话，要结合一定的化学计量学方法，具体是哪个化学分式影响水果糖度不同，主要应用的工程软件，MATLAB比较通用一点，也好沟通，特征提取后，建立一个数学的预测模型，把你的图片加载到MATLAB的算法内，一步步跑出来，这就是你的程序侧。
主要还是依靠算法实现，如果你要用深度学习去实现预测水果糖度，还是要了解一下食品检测的最新算法，目前我了解的，还是CNN开拓性比较大一些。算法要看你的侧重了，侧重在降维、特征提取还是回归模型的建立，还是全部的新算法。

⑺ 深度学习10张图片能出模型吗

不能出模型。
深度学习模型往往在大型监督型数据集上训练。所谓监督型数据集，即每条数据都有一个对应的标签。比如流行的ImageNet数据集，有一百万张人为标记的图像。一共有1000个类，每个类有1000张图像。创建这样的数据集需要花费大量的精力，同时也需要很多的时间。现在想象创建一个有1M个类的数据集。试想一下，对有100M数据帧的视频数据集的每一帧进行分类。该任务量简直不可估量。
无监督学习的目标是兼容小数据集进行训练的通用系统，即便是很少的数据。比较主流的无监督模型有：聚类学习、自动编码器、生成模型、PredNet。

⑻ 深度学习背景图片需要标签吗

写好内容，选好平台。
深度学习首先要精通内容，然后选择合适的题目，写好文章后，选择合适的平台，就可以发了。
区别于传统的浅层学习，深度学习的不同在于：
(1)强调了模型结构的深度，通常有5层、6层，甚至10多层的隐层节点；
(2)明确了特征学习的重要性。也就是说，通过逐层特征变换，将样本在原空间的特征表示变换到一个新特征空间，从而使分类或预测更容易。与人工规则造特征的方法相比，利用大数据来学习特征，更能够刻画数据丰富的内在信息。

⑼ 什么是深度学习如何保持深度学习

现在的科技发展速度非常快，对于智能设备将是一个发展方向，而其实我们以为的智能设备并不具备我们这样的学习能力，他们是通过无数图片，视频去发现其中的学习秘密，然后慢慢发展成为智能化的，其中大家最熟知的就是深度学习这个词了，但是很多人不知道什么是深度学习？如何保持深度学习？其实简单来说就是电脑芯片的深度挖掘，可以让芯片处于长时间的工作达到保持深度学习。

这里其实我们就可以看做平时挖矿人员，用显卡去挖矿，不是一张显卡就能搞定的，需要弄很多显卡成一个工作室，来同时不间断挖矿，但是这也是非常消耗芯片寿命的，这样的显卡一般寿命都无法保证，说个题外话，也不建议懂电脑的人去买矿卡，虽然便宜但是没有任何保证，说不定哪天打游戏就突然挂了，这是没有任何维修的，不要贪图这种小便宜。

⑽ 深度学习是怎么识别人脸的

深度学习是机器学习研究中的一个新的领域，其动机在于建立、模拟人脑进行分析学习的神经网络，它模仿人脑的机制来解释数据。

卷积神经网络(CNN)

局部连接

传统的神经网络是全连接，即一层的神经元与上一层的所有神经元都建立连接，这样导致参数非常多，计算量非常大，而CNN是局部连接，一层的神经元只与上一层的部分神经元建立连接，这样可以减少参数和计算量。

Technology-MachineLearning-FaceRegonition-CNN-LocalConnected

权值共享

给一张输入图片，用一个filter去扫时，filter里面的数就叫权重。用该filter对整个图片进行了某个特征的扫描，例如Edge detection，这个过程就是权值共享，因为权重不变。

Technology-MachineLearning-FaceRegonition-CNN-WeightSharing

人脸识别

多个CNN加其他层，遍历而成的人脸识别处理结构：

Technology-MachineLearning-FaceRegonition-CNN-Example

层提取到的信息的演进：

Technology-MachineLearning-FaceRegonition-CNN-Example2

人脸检测

传统算法

识别:滑动窗口+分类器

用一个固定大小的窗口去滑动扫描图像，并通过分类器去分辨是否是人脸。有时候人脸在图片中过小，所以还要通过放大图片来扫描。

Technology-MachineLearning-FaceRegonition-Window&Classifier

训练:特征+Adaboost

传统特征:LBP/HOG/Harr

图片原始的RGB信息，维度太高，计算量过大，且不具备鲁棒性，即光照和旋转，对RGB信息影响非常大。

利用LBP得到二进制值，再转换成十进制:

Technology-MachineLearning-FaceRegonition-LBP

效果图：

Technology-MachineLearning-FaceRegonition-LBP-Example

Adaboost

由于移动设备对计算速度有一定要求，所以用多个弱分类器加权叠加来完成一个强分类器，从而保证速度。

Technology-MachineLearning-FaceRegonition-Adaboost

深度学习

特征的选取是比较复杂的，可能需要大量的统计学和生物学知识积累，而深度学习不需要选择特征，这是其很大优势，另外通过GPU代替CPU等方式，可以得到一个更好的效果。

Technology-MachineLearning-FaceRegonition-DeepLeaning-Example

关键点检测、跟踪

传统算法

Cascade regression/ESR/SDM

传统算法步骤：

根据人脸检测的框位置，先初始化初始脸部轮廓位置;

进行上一步位置和图形特征检测下一步位置(一般是迭代残差);

进行迭代，最终得到相对准确的轮廓位置。

Technology-MachineLearning-FaceRegonition-KeyPoints

深度学习

深度学习算法步骤：

对图像进行轮廓定位态校正;

全局粗定位;

局部精细定位。

作者：YI_LIN
来源：简书

深度学习需要的图片哪里来

与深度学习需要的图片哪里来相关的内容