人工智能的采用开始得相当缓慢,大多数人甚至不知道它的存在,即使知道,也似乎还需要 5 到 10 年的时间,但后来机器学习、深度学习等东西出现了,我们开始看到一些应用,然后基础模型出现了。
AI
人工智能,基本上就是试图用计算机模拟某种东西,以匹配或超越人类智能。
什么是智能?倾向于认为它是学习推理和推理的能力。
如果我们看看人工智能的时间线,它实际上是在这个时间范围内开始的,在那个时候,它还很不成熟,大多数人甚至都没有听说过它,它基本上是一个研究项目,人们会使用像 LISP 或 PROLOG 这样的编程语言,这些东西是后来成为专家系统的前身。
这是一种技术,其中一些东西以前就存在了,但那时它真的达到了一种关键的程度,大规模并变得更加流行,所以专家系统在 20 世纪 80 年代可能在 90 年代出现。
Machine Learning
机器学习,顾名思义,我不需要对它进行编程,我给它大量的信息,让它观察事物。
例如,如果我开始给你正方形、圆、三角形,然后让你预测接下来会发生什么,你可能会得到正方形,可能不会,因为你有非常有限的训练数据。
但如果我给你一个正方形,然后让你预测接下来会发生什么,你可能会说圆、三角形、正方形,然后你认为你已经弄清楚了,然后突然给你一个曲线。
事实上,机器学习算法非常擅长观察模式并发现数据中的模式。你给它的训练数据越多,它在预测方面的信心就越大。预测是机器学习特别擅长的事情之一。
另一件事是发现异常值,比如这个曲线,然后说它不属于这里,它看起来与其他所有东西都不一样,因为序列被破坏了。这在网络安全领域特别有用,因为要寻找异常值,寻找那些以不该的方式或不通常的方式使用系统的用户。机器学习真的出现了,并且在 20 世纪 10 年代变得更加流行。
Deep Learning
深度学习,是我们使用这些称为神经网络的东西,神经网络是计算机模拟和模仿人类大脑如何工作的方式,至少在我们理解大脑如何工作的范围内。
它被称为深度,因为我们有多层神经网络,有趣的是它们将模拟大脑的运作方式。
但人类的大脑可能有点不可预测,你输入某些东西,你并不总是得到完全相同的东西。深度学习也是一样,在某些情况下,我们实际上无法完全理解为什么我们会得到这样的结果,因为神经网络有太多层,很难分解并弄清楚里面到底是什么。但这已经一个非常重要的进步,在 2010 年代,也获得了一定的知名度。
Generative AI
人工智能领域的最新进展都属于这个领域,即生成式 AI。
我们称所有这些技术都是生成性的,因为它们正在生成新内容,有些人认为生成性人工智能并不是真正的生成性,这些技术实际上只是重新整理现有信息并将其以不同的格式呈现。打个比方,以音乐为例,每个音符都已经被发明出来了,所以从某种意义上说,每首歌只是对已经存在的音符进行重新组合,只是将它们以不同的顺序排列而已。我们并不是说新的音乐不存在,人们仍然在根据现有信息创作新歌。
基础模型是我们获得这些内容的地方。
基础模型的一个例子是大语言模型,我们采用语言,对其进行建模,然后利用这项技术进行预测,如果我看到某些类型的单词,那么我就可以预测下一组单词是什么。这有点像自动补全,当你开始输入某些内容时,它会预测你的下一个单词是什么。但大型语言模型不是预测下一个单词,而是预测下一个句子、下一个段落、下一个整个文档,因此这些东西所能做的事情正在以惊人的指数级飞跃发展。
其他类型的生成模型包括音频模型,视频模型等。事实上,我们可以用它们来制作深度伪造。我们可以拿一个人的声音来重现它,然后让它听起来像是这个人说了他们从来没有说过的话,这在娱乐场合非常有用。或者如果有人失声了,那么你可以捕捉他们的声音,然后他们就可以打字,你就可以听到他们的声音,但也有很多情况下这些东西可能会被滥用。
聊天机器人来自大语言模型,深度伪造来自音频视频模型,但它们都是生成人工智能的一部分,都是这些基础模型的一部分,这也是真正引起我们所有人真正关注人工智能的领域。它有可能生成新内容,或者在某些情况下总结现有内容,给我们一些简短易懂的东西,这就是引起所有人关注的地方。