自主系统和将人从中间件提升：Turbonomic首席执行官Ben Nye的问答

内容

没有错误，没有压力-在不破坏生活的情况下创建可改变生活的软件的分步指南

带走：

我们与Turbonomic首席执行官Ben Nye的对话。

也许您听说过自主计算。它是指计算机或系统进行自我组织和自我管理的能力。而且，直到最近，这仍然是一个未来派的梦想。我们想更多地了解自动系统的工作原理，因此我们采访了Turbonomic首席执行官兼贝恩资本风险投资公司董事总经理Ben Nye。 Turbonomic（以前称为VMTurbo）最近进行了重新命名，以更准确地描述其软件的功能。新名称在其应用程序管理平台中结合了Turbonomic的核心主题：Turbo（实时性能），自主控制（自我组织和管理工作负载）和经济原则（供应和需求）。 Ben在这里讨论了自治系统以及自动化在日益复杂的数据驱动环境中的重要性。

技术百科： Youve曾多次出现在《福布斯》（Forbes）Midas榜单中，被评为顶级风险投资家（VC）。作为风险投资家，您有一个有趣的视角，可以看到整个技术格局以及这些年来世界发生的变化。当您回顾数据中心发生了多少变化时，有什么让您感到惊讶的？

本·奈： 简短的答案是，我认为数据中心的变革步伐确实已经超越了人们的视野。发生的事情是这种软件定义的数据中心的发展，从根本上说，是对硬件的抽象。这就为软件要素打开了整体增长动力。

因此，现在，它不再需要处理硬件供应商（长期以来几乎一直充当数据中心的守门员）的刷新周期，而实际上是开放了您可以快速创建想法的要素-因为软件，确实是想法。在没有产生想法的限制的情况下，这是一个非常令人兴奋和有趣的时刻，但是数据中心的变化步伐甚至是数据中心的定义都比以往任何时候都发生了实质性的飞速发展。

我发现非常有趣的一点是，当我们进入软件定义的数据中心时，硬件世界中的所有控制器，API和旋钮都在软件中进行了重新定义。我们所做的只是考虑一种新的方式来提高性能和生产力，这就是将应用程序和对该应用程序的需求变化，并将它们与软件中重新定义的控制器绑定在一起，因为最终，它是软件。

这样做之后，您现在可以从应用程序层和基础结构层之间删除人工中间件，因为现在，您第一次可以将它们直接绑在一起-这是一个重要的词- 自主地，意味着从字面上允许应用程序进行自我管理和自我组织。

从现在的需求正在寻找供应的意义上讲，这也使其具有经济意义，而我们专注于IT的消费模型，这是一种经济模型，而不是基于分配的模型或基于供应的模型。这是IT或技术行业管理模型应该如何运行的故事中的一个非常根本的转折。而且，它带来了更好的性能，并提高了成本效率。它还使客户更加敏捷和有弹性，并更好地利用市场上的劳动力

讽刺的是，每个软件定义的数据中心在2016年发生了什么。首先，您正在监视硬件以发现应用程序何时中断，这意味着它们违反了服务质量或SLA，但是当我们使用软件查找错误时，我们将返回硬件以获取机器生成的警报。第二个提示是，我们允许运行业务的应用程序中断，然后第三个提示是，我们将这些重复的机器生成的警报处理并交给这些警报 对人民。

没有错误，没有压力-在不破坏生活的情况下创建可改变生活的软件的分步指南

当没有人关心软件质量时，您就无法提高编程技能。

这一定是倒退的。

因此，我们希望将IT管理模型从分配或猜测更改为基于需求，基于消耗的模型。
阅读：需求驱动的数据中心-系统管理员可以从华尔街中学到什么

技术百科： 既然您已经提到了，是的，我们正在制作软件定义的任何内容，但是警报只是发送到流程的最慢部分，正如您所说的，它是人类中间件。

您提到了自主的术语。您能否再谈谈自主系统在IT中的重要性？鉴于名称从VMTurbo更改为Turbonomic，我想它的重要性比大多数人意识到的重要。

本·奈：绝对。首先， 自主性应用于计算时，它围绕可以自我管理，自我组织的系统。

所以想想贝叶斯网络，想想搜索算法，想想大数据，人们现在称之为“深度学习”。这些是人工智能的形式。我认为Turbonomic最有趣的是，它是人工智能的终极形式，因为应用程序工作负载会在软件中自主决定应运行的基础架构元素以及何时移动，调整大小，启动和停止自身的时间，克隆自己。这确实非常有趣–我们通过利用虚拟化，容器或云提供的抽象性和流动性来做到这一点。

然后，对所有不同形式的需求进行类似的抽象-因此您可以拥有虚拟机，容器，可以有JVM-我们正在研究所有这些需求形式以及所有这些供应形式，并将它们抽象化。因此，让需求随即挑选或匹配供应。然后，如果它们位于一台物理主机上，并且开始变得拥塞，而不是开始使其失败并生成警报并使应用程序崩溃，为什么不仅仅让它做出移动决定本身？只要您在决策中定价-搬迁和搬迁的成本-那么您实际上可以做出更有趣的资源分配决策。

技术百科： 我喜欢供需类比。在经济学理论中，供应来源在短期内是固定的，并且只能在很长一段时间内发生变化。在您所描述的范围内-如果您保持这种经济比喻-您正在改变整个范例。也就是说，您可以在短期内更改供应量，对吗？您具有完全的灵活性，实际上可以提高效率，并考虑到资源利用作为一个市场，实时拥有近乎有效的市场吗？

本·奈： 你说得很对这是一种经济模型，它成为围绕需求寻找供应的原则，但是IT是根据经济原理进行管理的。正如约翰·梅纳德·凯恩斯（John Maynard Keynes）所说：“从长远来看，我们都死了。”

技术百科： 我认为您现在不会遇到尚未搬迁或没有认真考虑将更多资源存储到云中的CIO。您如何看待未来几年的行业发展趋势？

本·奈： 我认为您会看到很多变化。对我们来说很明显，这不会是对技术的全面改造。就像大型机还在这里一样，我认为您不会看到100％的重新平台。您很有可能会看到一个混合世界。您将拥有私有和公共云，但是我认为公共云实际上将是公共多云，而不是公共单一云。在这里查看最大的参与者时，只有少数几个。但是，当您去欧洲或世界其他地方时，会看到很多承运人也都是乌云密布的，所以我认为这不是一个很大的飞跃，对吗？但是，真正的问题是，客户如何获得合适的云来运行其工作负载？我们公司的理论依据是任何工作负载都应该能够继续运行任何基础设施 任何地方。意思是上班还是下班，在任何时候都是因为记住时间是需求的替代。

因此，当需求发生变化时，您可能想要突如其来。或者，如果您要将这些工作负载永久移动到云中，那么您将要拉回哪些工作负载？因为现在您的数据中心具有容量。为什么要支付两次？因此，我们今天与Verizon Intelligent Cloud Control以及与其他环境一起进行的一件事是，使客户可以决定在何处运行这些工作负载，不仅取决于价格，因为价格会锁定您，而且更重要的是关于应用程序性能。然后，您可以考虑其他因素，例如价格，法规遵从性，数据主权或安全性，以及其他资源，这些资源在我们描述的这个市场上只是可交易的基本资源。

技术百科：那是经济模式吗？

本·奈：是的。因此，一切都回到了经济模式。只要考虑一下这是多么合乎逻辑。顺便说一句，这不仅仅是一个类比，实际上是模型的工作方式。工作负载有预算，工作负载着眼于排队理论和拥塞，因此它的扩展范围更大。开始出现拥堵时，价格并不是线性上涨；它成倍增加，迫使预算受到影响，因此需要做出决定的工作量。

只要您已经消除了数据中心中的所有复杂性，现在就可以交易XtremIO盒，Pure Storage盒，Compellent盒和3Par盒的IOPS，因为它们都具有不同的IOPS特性，但是应用程序可以因此，可以自行选择购买这些资源。与查看CPU或vCPU，MEM或vMEM没什么不同，对吗？它们都可以交易，所以我应该在这里还是在这里跑步？没关系！这里常见的商品是基础设施供应。

这里常见的商品是基础设施的供应，重要的原因是-我要用一个比喻-如果您还记得

早在1978年，我们就取消了对航空公司的管制。在此之前，每个席位都是相同的，我们对它们的定价都相同，这是合乎逻辑的，但是这是错误的，因为在消费方面，支付意愿差异很大。因此，席位是一种商品，但是通过将重点转移到需求上，即使席位相同，每个席位的价格也可以确定不同的付款意愿。因此，我们要做的就是获取代表普通商品的资源，并在网络上发布-首先是Sabre和Apollo，然后又变成Travelocity，Kayak和Priceline。

突然之间，当您让需求来选择供应时，您会发现整个行业都在发生变化。负载因素增加了，但飞行成本却下降了，我们在这个国家拥有的整个航空公司基础设施都实现了现代化。这是一个很大的进步。哦，顺便说一下，如果今天看一下Priceline，它的价值为700亿美元。这比任何一家航空公司都多，而且他们没有一架飞机。

技术百科：有趣。我从来没有那样想过...

本·奈： 他们没有飞机，没有登机口，没有座位，没有雇用飞行员，对吗？然后您说：“但是，我们还有其他一些以供给为中心的经济例子吗？”让我们切换一下。酒店是基于供给的，对吧？您有酒店，不能搬家。您有这些房间但是，您如何为这些房间定价？Hotels.com，Expedia和Travelclick等也发生了同样的事情：您在餐馆里看到了OpenTable，在黄页上看到了。您在报纸上看到的分类广告被eBay或Craigslist取代。

我最喜欢的例子之一是Uber。如果您在任何城市中走来走去，都会看到一排出租车在等人，然后您便到达同一城市的另一部分，那里有一排人在等出租车。而且您认为，这不可能是对的。随后出现了优步，它使用智能手机让需求驱动供应。现在，有了Uber，您在10分钟内就满足了90％的需求，而在出租车世界中，在10分钟内没有满足90％的需求，这就是Uber上一轮融资达到620亿美元的原因。请记住，他们没有出租车或汽车！

技术百科：因此，在典型的数据中心中，我们实际上在做与在出租车上做相同的事情，对吗？

本·奈：因此，请这样考虑：工作量是预算的持有者，因为这就是我们构建数据中心的原因。因此，在此示例中，他们实际上是您的人。然后，我得到了这个资源，这个公共资源，都被完全抽象了。这就是所谓的供应，它可以无处不在-从服务器和计算机环境到网络，再到存储，它满足了应用程序的所有需求。现在，我们要确保这是一个有效的市场。因此，那些预算持有人必须能够自主采取行动， 自主和实时的意思 给定对工作负载本身或在这种情况下对应用程序的需求变化量。这就是为什么这与寻找需求供应非常相似的原因。使用该系统，您无需等待人工瓶颈来响应机器生成的警报，就可以为应用做出更好的护理，从而获得更好的应用性能。您可以实时进行操作。您正在大规模地这样做，因为这些机构，这些客户每天要运行数千个应用程序，并且它们必须执行。

因此，首先，您将获得更好的性能体验。此外，您没有别人花时间做事。取而代之的是，他们回到了思想家的手中，他们不仅在获取机器生成的警报，还在考虑他们实际上可以为企业提供帮助。他们正在考虑微服务策略，混合和多云策略以及软件定义的网络，网络功能和虚拟化-所有这些实际上促进了业务发展，并使它们脱离了故障修复应用程序维护和馈送的世界，或者警报响应。

实际上，我们发现40％到60％的数据中心资本都被超额配置了，我们可以负担很多可以重新分配的资金-因此，避免购买新硬件-或退役，原因是重要的是-

技术百科：对不起，让我检查一下，40-60％？抱歉，这个数字太惊人了。

本·奈：是的。而且更重要的是，该国14％的电力被数据中心消耗。

技术百科：如果我们不过度配置数据中心，那么我们可以节省全国总用电量的5-8％？

本·奈：让我给您一些备份，向您解释原因，好吗？它可以追溯到以供应为基础的经济世界。首先，当您拥有新应用程序并且正在运营IT商店时，如何调整它的大小？

技术百科：是的，您去找建筑师，他们有点猜测吧？然后他们等到它破裂。

本：是的。您去了业务部门，开始了交谈，他们对您一无所知。因此，他们在猜测，而您在猜测，我们一起尝试猜测大小应该是多少。

因此，您将分配四个或八个VCPU。现在，有趣的是分配包括物理脚或物理服务器上的虚拟脚。每次来自该应用程序的请求都会被排队为四个或八个VCPU。从本质上讲，这就像去一家餐厅，说您是四八人的聚会，即使您可能只是一个人的聚会。您将永远不会坐下。

我们用猜测来分配过多，这意味着我们会得到最差的性能，而且价格昂贵。那是第一个问题。第二个问题是，现在您无法精确调整应用程序大小，这引出了一个问题：如果无法调整应用程序大小，该如何放置？

您又在猜测。好的，所以现在我们猜测第一件事，我们猜测第二件事，然后就是所谓的VM蔓延，或者是没有需求的VM。它保持其状态而不是被移除，并且还保留了硬件。然后，我们要做的就是尝试将所有这些东西放到基于人类的历史能力模型中，并且由于我们每年只运行一次或两次，因此我们必须建立另一个对冲，所以说20％至30％对冲，因为需求可能在所有这些应用程序上都增加了，然后我们将“关闭群集”，因为我们认为那一堆主机“已满”。现在，您已锁定了多达一半的数据中心容量，并且已超量配置。

技术百科：就像您要失败一样，就像旧的范式中实际上没有过度配置或蔓延...

本·奈：如果您所看到和管理的只是基础设施供应，那么您如何才能知道，如果您没有看到并了解需求并实时与需求挂钩，那么您是否有足够的供应来保持弹性？如果您所看到的只是供应，您怎么知道您是否足够？你怎么知道你有太多？

技术百科：好吧，您可能会雇用更多的负责人来猜测更多。您花更多的钱来研究这个问题，不是吗？

本·奈：您仍然会从根本上过度调配，将其称为一半，并且您不必要地购买硬件。虚拟化在其第一个实例化中的整个概念都是无处不在，而不是为每个应用程序都配备专用的硬件堆栈，我将能够在专用堆栈之间移动这些工作负载，因此，整个思想是配置硬件达到峰值的平均值，而不是所有硬件资本的峰值总和。

但是，当您现在进行实时自主控制，性能控制，VM或容器或云的消耗方面时，您会想到同一件事；我们做什么？我们走出去，对每个应用程序进行压力测试，结果有成千上万个-根据客户的规模，在一个环境中有成百上千个应用程序-因此，我们对CPU，vCPU，MEM， vMEM，等等，所有不同的元素或资源对吗？然后，我们再次根据峰的总和进行配置。所不同的是，如果您没有与劳动相关的滞后或瓶颈，并且现在可以准备高峰的平均值，那么您猜我们能做什么？我们可以主动管理该环境，因为所有应用程序一次都不会出现峰值。

技术百科：哇。那真的就回到了虚拟化本来应该具有的意义。

本：这是虚拟化或容器化2.0：实时，自主的性能控制。

技术百科：因此，如果旧的中断修复循环是一种过时的思维方式，您如何向第一线的普通人解释这一点？

本·奈：让我问一个简单的问题：为什么要监视一个？

技术百科：那么，您想知道哪里出了问题或什么时候出了问题，对吗？

本·奈：好。是的您想知道它何时断裂。但是为什么要让它打破呢？这就是整个问题。看，您不可避免地要对数据中心的某些部门或部分进行一些监视，但是从根本上说，如果我可以确保我的应用程序在我们所谓的期望状态下运行正常，这是需要的适当资源量实时支持他们，这比等待监视，警报和尝试响应的情况要好得多。

当虚拟化首先带来了软件定义的数据中心时，这确实是一个有趣的进步，但是他们走了一步，因为他们称自己为未来的数据中心操作系统，而且是直接使用的，对吧？但是，如果您实际上去查找操作系统应该做的五件事，那么第一件事就是性能管理。那么，让我问你，管理程序是否进行绩效管理？

技术百科：当然不是。

本·奈：没有权利。然后，它要做的第二件事是资源分配。那么，系统管理程序是否进行资源分配？没有。

工作安排怎么样？预订怎么样？计划如何？不，不，不。因此，您突然意识到他们实现此目标的方式是，它们会生成警报，并且警报的数量会随着我们在更高级别上使用资源以及随着我们创建更多应用程序，更多形式的工作负载以及更多地点而增长并增长他们可以在其中运行。突然之间，我们通过所有这些警报粉碎了人们。

但是最大的是，我们正在通过人类追赶那些警报来改变人们进入了现代数据中心操作系统，这很奇怪，因为事实证明，人们在睡觉。人们有家庭，人们休假，所以人们不能成为操作系统，这就是为什么我们要做的是我们创建了此应用程序性能控制系统Turbonomic，以便能够准确地完成这五件事。我们同意虚拟机管理程序是一个伟大的发明，它是容器，云，但是我们将它们视为流动性的提供者。它们不是操作系统。操作系统的其余部分来自拥有应用程序性能控制系统。它会做这些事情，它会执行绩效管理，资源分配，作业计划，预订和计划-这就是我们所拥有的全部价值。这就是为什么我们存在于市场中。

技术百科： 告诉我，在接下来的两到五年内，您认为机器学习或AI在其中扮演什么角色？具有人工智能的Turbonomic如何改变数据中心？

本·奈： 在各种不同的环境中可以做出一些令人难以置信的有趣的推断。我要说的是，做的事情要比这要精确得多。请记住，大数据集的问题之一是您需要时间来开发该数据，然后将其关联起来并根据该数据得出推论。

有时，您会得出错误的推论，并且很难知道大数据集要花多长时间才能学会该推论，无论对错是对的。最后，它仍然是由人类或某种形式的静态人工组成的，它实际上是在采取行动。在我们的案例中，这就是自主智能。它不仅是人工智能，而且这些工作负载实际上是在模型中自行做出决策，而且您可以以一定的精度进行决策。它远远大于仅使用大数据数据集即可完成的工作。

技术百科： 如果您可以让一位普通的系统管理员，一位普通的数据中心架构师，一位普通的CIO任职，那么明年或两年后情况将会如何？人们现在没有意识到他们需要了解2017年，2018年及以后的事情是什么？

本·奈：我认为最重要的是记住我们为什么进入技术领域。因为我们从根本上是好奇的，并且我们希望使美国经济-或任何经济体-事半功倍。这就是企业运行和滚动的方式。当它要求我们以大约超额配置的大约50％的数量运行，并且在中断修复的应用程序环境中运行时，我们坚持使用昨天基于分配或供应模型的方法是不正确的从思想者到行动者的劳动。

有个更好的方法。更好的方法是接受来自新供应商的新思想和新技术，这些新思想和新技术将使您有机会查看等式的需求方面，VM，容器，云的消耗方面并在以下方面更高效地运行借助更智能的人工和更高的资本效率，以及在整个运营的敏捷性和灵活性方面的灵活性，实现更大的规模。

这就是为什么我发现这个机会如此引人注目以至于我想经营它的原因，以及为什么我如此完全地相信它。

如果您要免费试用Turbonomic的应用程序性能控制平台，可以在此处下载。