我通常会看到以下两种方式之一解释人工智能:通过媒体越来越耸人听闻的观点,或通过充满多余语言和特定领域术语的密集科学文献。{#718f}

这两个极端之间的宣传区域较少,我认为文学需要加强一点。关于"突破"的新闻,比如愚蠢的机器人索菲亚炒作人工智能类似于人类意识,而实际上,索菲亚与AOL Instant Messenger的SmarterChild一样复杂。{#dad8}

科学文献甚至可能更糟糕,甚至在经过几段无偿的伪知识分子垃圾之后,即使是最有动力的研究人员也会睁大眼睛。为了准确评估AI,一般人群需要知道它到底是什么。而理解基础AI所需要的只是一些中学数学。我可能容易过于简单化 - 我要求所有的数学,数据科学和工程学同事在我这样做的时候忍受 - 但有时这就是自命不凡的科学所需要的。{#59a5}

基本的AI和机器学习,变得简单{#4f3f}

典型的经典AI是模仿人类智慧的东西。这可能是从视频游戏机器人到索菲亚到像Deepmind的Alphago这样复杂平台。{#7af0} 忽略"深度学习" - 在这种情况下,它是一样的。图表: 地理空间世界

机器学习是AI的一个子集,它允许机器从实际数据中"学习",而不是按照一组预定义规则进行操作。{#223f}

但"学习"意味着什么?它可能不像看起来那么具有未来感。{#a1ec}

我最喜欢的解释是机器学习只是 y = mx + b 。如果你正在观看像 Black Mirror 这样的东西,很容易开始将现代AI视为一个有意识的实体 - 一种思考,感受和做出复杂决策的东西。这是即使在AI始终人格化,然后比喻为 终结者 的天网或 矩阵 媒体更普遍 {#1a15}

我们可以让计算机查看输入(x)和输出(y),并找出将它们联系在一起的内容。 {#8efd}

实际上,这根本不是真的。在目前的状态下,AI只是数学。有时候数学很困难,有时它需要广泛的计算机科学,统计学和其他领域的知识。但最终,现代人工智能的核心只是一个数学函数。{#41b8}

如果您不熟悉数学函数,请不要担心,因为您不记得或使用它们。要掌握这一点,我们只需要简单的东西:有输入( x ),有输出( y ),功能是输入和输出之间发生的 - 两者之间的关系。{#2ae9}

超简化AI是表示为 y = mx + b 的函数。我们已经知道了 xy ;我们只需要找到 mb 来理解 xy 之间的关系。例如,在下表中, x 是输入, y 是输出。{#fae2}图表: Kyle Gallatin

对于这种模式,为了从 x 得到 y ,我们需要将 x 乘以1(给出 m 值)并加1(给出 b 值)。因此,函数是 y = 1x + 1。 {#28fe}

你去吧我们发现 m = 1且 b = 1.我们只取了一些数据(上表)并创建了一个描述它的函数。从本质上讲,这就是机器学习。使用输入 x ,我们预测了所有示例的 y 可能是什么。{#fb1f}

花哨的部分是你如何教一台机器来学习最能描述数据的功能---但是当你完成后,你剩下的通常是某种形式的 y = mx + b 。一旦我们有了这个功能,我们也可以在图表上绘制它:{#ed87} 屏幕截图: Tecmath via Youtube

有关函数的更多解释, Math Is Fun有一个直观而直接的网站(即使名称是一个潜在的红旗,网站看起来像他们的网页设计师在21世纪初的某个时候退出)。{#faab}

人类无法做数学机器{{3327}

显然, y = 1x + 1 是一个非常简单的例子。我们拥有机器学习的全部原因是因为人类无法查看数百万个数据点并提出了描述输出的复杂函数。相反,我们可以训练计算机查看输入( x )和输出( y )并找出将它们联系在一起的内容。{#3548}

在任何情况下,必须有足够的数据才能找到正确的功能。如果我们只有一个 xy的 数据点,我们和机器都不能只预测一个准确的函数。在 x = 1y = 2 的原始示例中,函数可以是 y = 2xy = x + 1y =([x + 1] * 5--9)⁵+ 1 ,或任意数量的可能性。如果我们没有足够的数据,当我们尝试在更多数据上使用时,我们机器创建的功能可能会出现大量错误。{#8308}

而且,现实世界的数据并不总是如此完美。在下面的示例中,一台机器确定了几个适合大多数数据的函数---但有时这些线不会通过每个点。与数学类中的旧表不同,从现实世界收集的数据更难以预测,永远无法完美描述。{#341b} 线性回归gif的图像结果这是机器学习最能代表数据的函数的基本示例。图表通过数据科学

最后,人类不能做的最后一件事就是看一堆变量。只用 xy 很容易,但是如果不只有一个输入变量怎么办?如果 y 受x 1,x 2,... x 15的影响怎么办?很快,功能变得越来越复杂(对于人类而言)。{#fe45}

现实世界中的机器学习和人工智能{#e205}

让我们看一个现实世界的例子。我从事药物研究工作,所以假设我们有一个癌症相关的数据集,其中有两个关于肿瘤大小的输入变量 - 半径和周长 - 以及两个潜在的输出,无论肿瘤是良性还是转移(可能是生命 - 威胁)。它可能看起来很复杂,但我们只需要应用熟悉的 y = mx + b 概念:{#5d3d}

  • y 是诊断,可以是0(良性)或1(转移性)。{#8121} {#8121}
  • x1 是半径。{#a6c4} {#a6c4}
  • x2 是边界。{#11d4} {#11d4}
  • 每个 x 都有一个未知的 m ;让我们称他们为"某事。"{#0efc} {#0efc}
  • b 与未知常数保持一致。{#d8b5} {#d8b5}

当然,即使是最详细,多因素的数据也不是完美的,因此我们的机器学习模型也不是。 {#3656}

我们的线性方程现在看起来如何?与上面的例子没什么不同:{#e73b}

诊断=(某事1 *半径)+(某事2 *周长)+ b {#9219}

正如我上面解释的那样,我们已经脱离了人类能力的领域。因此,而不是看数据,并试图找出什么 东西 ,我们还通过乘以我们的变量来获得 诊断 的准确估计,我们的机器为我们做。 就是机器学习!{#8def}

当然,即使是最详细,多因素的数据也不是完美的,因此我们的机器学习模型也不是。但我们并不需要百分之百的正确时间。我们只是需要它来提供它能够在大多数情况下正常运行的最佳功能。{#266c}


这篇文章只是涉及机器学习中令人难以置信的数学和计算机科学的表面。但即使在复杂的层面,这个概念也是一样的。无论机器学习和人工智能看起来多么令人印象深刻或荒谬,这一切都源于机器学会最好地描述数据的功能。{#5dfc}

查看英文原文

查看更多文章

公众号:银河系1号

联系邮箱:public@space-explore.com

(未经同意,请勿转载)