关键点:
- 控制论关注具有封闭信号回路的复杂系统的循环因果关系中的反馈机制的作用。
- 术语“控制论”始于1948年,由美国数学家诺伯特·维纳提出,用来描述他称之为“无论是机器还是动物的控制和通信理论领域”。
- 使系统成为控制论的一部分需要:1)提供一种表示当前状态的方式;2)提供一种表示目标状态的方式;3)提供从当前状态到目标状态的方法。
什么是控制论?- 完整解释
控制论是对目的性系统的研究,包括有机体和无机体,并研究它们自我调节的方式。它主要关注具有封闭信号回路的复杂系统中的反馈机制的作用。
在这类封闭系统中,自发的行为会触发对系统环境的转变,进而导致系统本身的变化。行为及其反应均发生在系统内部。
控制论特别关注信息在系统中的流动以及系统如何利用这些信息来帮助自我控制。我们可以将其描述为组织科学,特别强调被组织的系统的动态特性。
在现代英语形式中,单词“控制论”首次由美国数学家诺伯特·维纳于1948年使用,用来描述他称之为“无论是机器还是动物的控制和通信理论领域”。它与克劳德·香农的信息论一起发展,该理论旨在改进信息传输,并在数字自动控制系统的工程中利用了反馈的概念。
控制论源自希腊单词“kubernetes”,意为“舵手”。英文单词“governor”来自该希腊单词的拉丁翻译。
在古希腊时代,kubernetes负责控制希腊的长船。这些船必须应对各种不可预测的力量,包括风、浪、暴风雨、洋流和潮汐。希腊人发现,通过将舵柄指向远处的固定物体(如灯塔)并实时调整,他们可以忽略所有这些因素并控制船只。
作为一门科学,控制论是反传统学科或跨学科的。它研究由系统过程引发的各种战略行为,包括信息处理和存储、适应性、自我复制和自组织的调节系统。控制论的视角为许多其他理论领域提供了跳板,例如:
- 系统理论
- 博弈论
- 通信理论
- 系统心理学
- 决策论
诺伯特·维纳坐在他的办公室里。单词“控制论”是由诺伯特·维纳首次使用的,用来描述他称之为“无论是机器还是动物的控制和通信理论领域”。
©konrad jacobs, cc by-sa 2.0 de, via wikimedia commons – 许可
控制论:精确定义
控制论是一门涉及有机和无机系统、机器和生物的控制过程的跨学科科学,其重点在于通过反馈的循环因果关系实现自我调节。
控制论是如何工作的?
简化来说,任何控制论系统的目标是组织系统,使其行动与其所选择的控制信号(称为参考信号)相一致。它通过基于反馈的自动控制系统来实现这一目标,该系统确定需要监测哪些行动,需要调整哪些行为,如何将行动与参考信号进行比较以及如何最佳调整相关行为。
自然控制论系统演化或自组织这种调节系统。人工控制论系统则响应人类提出的自动控制系统。
控制论系统由控制器和其控制的对象两个基本部分构成。自然和人工控制论系统通常从被控制的对象开始,该对象具备其功能所需的所有能力,然后在准确地对对象进行建模后开发控制器。
一旦将这两个部分链接起来,系统就开始展现以目标为导向的行为。其目标是使系统的所有相关特性与参考输入保持一致,而不受系统中的任何干扰的影响。为了实现这一目标,控制器需要能够激发系统执行相关行动,以操纵相关变量。
当控制论系统的调节系统检测到系统行为异常时,它会通过检查其假设目标与异常行为之间的差异,并调整系统以弥补这种差异来尝试纠正问题。当具有目的性的系统开始朝着目标迈出初步的步伐时,这个错误检测和修正的过程会重复进行。
在被控制的对象和其控制器之间来回流动的信息很快失去了任何层级的相似性。这个闭环中的每个链接都在控制整个系统中发挥作用。每个部分对其他每个部分都有某种控制效应。随着系统的进展,被控制和控制器之间的区别开始消失,循环因果关系开始出现。
如何创建一个控制论系统?
要使任何系统成为控制论系统,您需要赋予它三个基本的概念组成部分:
- 表示其当前状态的方法
- 表示其目标状态的方法
- 关于如何从当前状态到目标状态的策略方法
可以使用任何类型的感知机制来确定和表示当前状态。像相机这样的光学传感器、声纳这样的回声定位传感器或gps这样的位置传感器可以在教育系统了解其当前状态方面很有用。
目标状态可以来自系统内部或外部。自然控制论系统会提出自己的目标,通常优化为生存和稳态。在人工控制论系统中,目标状态可以从外部输入。您恒温器上的旋钮和gps上的目的地输入都是从系统外部输入目标状态的方式。
现在,您的系统具有了识别自身位置和目标位置的能力,它成为了一个有目的的系统。它可以比较这两个状态并检查它们是否匹配。如果它们不匹配,系统需要最后一个组成部分,即一套行动策略,以使其达到目标位置。
在一个二维的控制系统中,比如恒温器,行动策略是二进制且简单的。为了帮助您形象地理解这一点,我们可以看一下詹姆斯·瓦特在18世纪设计的调节系统,用于控制新颖的蒸汽机。
瓦特通过设计一个离心调节器,将蒸汽机转变为一个控制系统,使任何用户都可以在一定范围内设置蒸汽机的输出,并让机器保持在该范围内。他通过将蒸汽输出连接到一个控制阀,并将控制阀连接到基于离心力的传感机制上来实现这一点。传感器由一个顶部连接着两个铅球的旋转杆组成,就像一个重型系球游戏套装。蒸汽输出越多,旋转杆旋转得越快,铅球旋转得越高。如果铅球旋转得太高,连接杆将开始关闭控制阀,直到达到用户定义的速度范围的平衡点。
在具有多个自由度的系统中,例如基于gps的导航应用程序,行动策略会更加复杂,但一般思路保持不变。系统必须尝试各种行动,并在每个行动后评估其新的当前状态,以发现其行动产生的变化。它重复这个循环的次数越多,就越能理解哪些行动能让它更接近目标状态。
控制论的起源是哪里?
控制论在1948年迈向现代世界,当时数学家诺伯特·维纳出版了他的第一本关于这个主题的书《控制论:动物和机器中的控制和通信》。
诺伯特·维纳的控制论著作
维纳在孩提时代就展现出了数学天才的才能。他的父亲是哈佛大学的文学教授,从小就鼓励小诺伯特投资于他的教育。仅仅14岁时,诺伯特·维纳就获得了塔夫茨大学数学学士学位。四年后,他在哈佛大学获得了博士学位。在哈佛之后,他前往剑桥大学在伯特兰德·罗素的指导下研究数理逻辑,然后前往德国的哥廷根大学,在数学家大卫·希尔伯特的指导下学习。
二战爆发后,维纳开始研究将武器瞄准运动目标的困难数学任务。他参与了创建电子瞄准系统,可以实时识别导弹与目标的位置,并在飞行过程中引导导弹进行必要的改变方向。他在弹道物理学和制导导弹技术方面的工作激发了他对研究反馈控制系统的热情,我们现在称之为控制论。
正是在研究这些弹道定位系统时,维纳首次意识到反馈的跨学科原则对于存在的一切有目的的系统,无论是生命还是纯粹的机械系统,都是多么重要。在他的1948年的著作“控制论”中,维纳将这一观念从他一直在使用的狭义电子应用中推广到了更广泛的普遍原理,该原理可以在生物学、经济学、政治学、心理学等领域找到。
安装在飞机机翼上的空对空导弹。控制论的第一个分支专注于机器控制系统。控制论系统使得航天器导航、计算机、制导导弹和雷达等新技术和改进成为可能。
©nedelcu paul petru/shutterstock.com
控制论的应用是什么?
控制论退后一步,将系统看作是动词而不是名词。它不试图准确定义一件事物的边界在哪里,而是通过它的行为和能力来定义一件事物。
从行动潜能的角度看世界,控制论在许多传统学科中具有有趣的应用。在生物学、技术学、社会学和许多其他领域中,有许多可以根据它们的行为来定义的系统。这就是为什么我们认为控制论是一种跨学科语言,帮助我们理解和修改各种科学中的过程。控制论在自然科学和政治科学、教育、企业管理等领域都有应用。
简单的自控机器
控制论的第一个分支专注于机器控制系统。通过学习如何设置可接受的范围,然后放开手中的控制,我们得到了新的技术和改进,包括航天器导航、计算机、制导导弹和雷达。二战期间,发明家们利用反馈原理,通过使用雷达设备的信息来提高新型智能武器的准确性。
战争结束后,控制论的思想被应用于无线电和电话技术中。通信工程师能够利用反馈原理创建噪声过滤器,改善许多通信设备的音质。如今,控制论的第一个分支的原理成为机器学习领域的基础,我们继续学习为我们的机器设置可接受的范围,然后越来越多地放开控制。
复杂的自组织系统
控制论的第二个分支专注于了解自组织系统如何通过适应环境来调节自身并存活的复杂过程。
例如,在经济学中,供求模糊的系统与价格的无定形系统相关。不确定在任何给定时间哪个控制哪个,但如果供应大于需求,价格开始下降,反之亦然。当供应与需求几乎相等时,我们的经济系统达到了舒适的平衡状态。
具有较少供应或需求的利基商品往往具有较高的利润率。大众市场商品不需要高利润率,因为牙膏、面条、鞋子等商品总是有充足的供应和需求。定价系统帮助我们思考和影响更大更抽象的经济子系统,而不需要深入细节。
价格使制造商和销售商能够用简单的方式与顾客沟通,而消费者是否愿意支付这些价格则允许最终用户进行反馈。这种复杂的交互影响了整个经济系统的特征,形成了一个让整个星球都在进行反馈的贸易循环。
现实世界中的控制论实例
在你的脑子里
我们可以在我们身体内找到控制论的最佳例子,特别是在我们的神经系统中。
在这种情况下,调节你的有机体的自动控制系统可能就是你的大脑。它从光学传感器即你的眼睛接收信号,估计你想要的物体与你的手之间的距离。
你的传感器发送给控制器的信息就是我们所说的反馈。当你的控制器向你的伸手发出行为指令以成功拿起物体时,它会考虑这些信息。
你的gps应用
另一个简单的例子是当你使用智能手机导航时。当你打开gps应用程序时,它使用卫星传感器三角定位你的当前位置。当你输入目的地时,系统现在有一个当前状态和一个目标状态,因此它可以使用路线和交通算法计算出最佳的行动策略。当你向目的地前进时,它会不断检查反馈并相应地更新行动策略。