11月22日,Databricks的联合创始人兼首席执行官Ali Ghodsi在The Logan Bartlett Show展开了一场关于AGI的对话。访谈中,Ali Ghodsi对Scaling Law持有审慎怀疑态度。他坦⾔,随着模型复杂度指数级攀升,训练成本呈⼏何级数膨胀,调校和应⽤难度愈发凸显,单纯追求参数规模已难以为继。相较之下,构建复合AI系统更具潜⼒:专注于提升特定场景下的性能表现,结合经典机器学习等⼯具,优化整体系统质量,这将是未来的主旋律。Ghodsi指出,真正驱动AI落地的是垂直领域数据优势,⽽⾮通⽤模型。唯有将前沿算法与⾏业数据深度融合,才能孕育出颠覆性的智能应⽤。
关于AGI的对话
对于超级AGI的憧憬,Ghodsi也泼了⼀盆冷⽔。他直⾔不讳地指出,AI研发正⽇趋专业化和细分化,需要投⼊更多⽽⾮更少的资源和⼈⼒。模型训练如同登天之难,验证和应⽤更是困难重重。没有⼀个递归⾃我改进的闭环,单单依靠更⼤规模堆砌参数,很难实现质的飞跃。Ghodsi展望未来,AI⽣态将涌现出打造垂直场景智能应⽤的创业公司,它们依托领域数据优势,对传统⾏业形成"螳螂捕蝉⻩雀在后"之势,撼动现有商业格局。这种去中⼼化创新趋势,恰与超级AGI的集中式研发形成鲜明对⽐。
Ali Ghodsi:Databricks的联合创始人兼首席执行官,拥有超过十年的人工智能领域经验。他在伯克利大学从事AI研究期间,参与创建了Apache Spark项目(开源的分布式计算引擎)。
Databricks:一家领先的数据和人工智能公司,致力于通过其统一的数据智能平台,帮助企业处理、分析数据并构建人工智能应用。该平台支持湖仓一体化架构,提供协作环境,利用生成式人工智能技术,帮助企业快速实现数据和人工智能的成功。Databricks的使命是简化和民主化数据和人工智能,助力数据团队解决世界上最棘手的问题。
The Logan Bartlett Show:Logan Bartlett是Redpoint Ventures的软件投资者,RedpointVentures是一家总部位于硅谷的风险投资公司,资产管理规模达60亿美元,投资对象包括Snovwflake、Draftkings、Twilio和Netflix。在每一集中,Logan都会与世界级的企业家和投资者一起走进幕后。
以下是对话实录:
01 质疑超级AGI的幻想泡沫
Logan Bartlett:人们都在说,我们即将破解密码,实现超级AGI。我对此表示怀疑。模型开发正变得日益昂贵和复杂,需要投入更多资源和人力监管,而不是更少。欢迎收听The Logan Bartlett Show。今天,我们邀请到了Databricks的联合创始人兼首席执行官Ali Ghodsi。Databricks这家公司正处于AI革命的核心。我们将讨论AI的现状,Ali对模型未来的展望,以及Databricks的创立故事。
02 洞悉AI浪潮:15年创业历程的启示
Logan Bartlett:您从2013年就开始在Databricks从事AI方面的工作了?
Ali Ghodsi:是的,在Databricks。在此之前,我们还在伯克利从事AI研究,大约从2009年或2010年开始。Spark最初的创建实际上是为了参加Netflix Prize竞赛,专注于电影推荐。
Logan Bartlett:所以您在这个领域已经深耕15年了。它最初是一个小众的学术追求,现在显然已经发生了翻天覆地的变化。ChatGPT的出现及其带来的AI主流应用是否改变了您的看法?
Ali Ghodsi:并没有。从2013年起,我就对人们对AI缺乏更广泛的兴趣感到困惑。早在2014年,我记得我曾主张将我们的工作称为“AI”,而其他人则坚持使用“机器学习”,因为他们认为AI只是关于机器人技术。我一直觉得AI的潜力被低估了。ChatGPT的出现证实了我的观点,尽管它的影响程度确实令人惊讶。
Logan Bartlett:在这15年中,有没有哪些对您来说意义重大但被主流忽视的突破性时刻?
Ali Ghodsi:最初,机器学习主要用于广告技术。2014-2015年前后发生了一个转变,大型企业开始将机器学习用于更复杂的应用。例如,Expedia利用它来优化酒店排名,从而显著提高了收入。Regeneron利用AI识别疾病的遗传标记,为药物开发铺平了道路。在2018-2019年前后,我们开始看到自然语言处理的突破。随着GPT-2等等的出现,它已经非常令人惊叹了。很明显,在几年后左右,图灵测试很快就会被打破。但是,谁会想到全世界会以这种方式觉醒,还会成为每天的头条新闻。
03 ChatGPT开启AI应⽤元年:iPhone时刻的历史类比
Logan Bartlett:您曾将ChatGPT的出现比作iPhone时刻。您能详细说明一下这个比喻及其对应用程序和企业应用的影响吗?
Ali Ghodsi:当iPhone问世时,每个人都意识到了智能手机革命的到来。紧接着发生的事情是,地球上的每家公司都说,我们必须开发大量的应用程序。我们必须构建自己的iPhone应用程序。因此,出现了一阵活动热潮,所有公司都在开发应用程序。但是,这些应用程序真的有意义吗?他们开发的很多应用程序,我有点拿它开玩笑,我说这有点像为你的iPhone开发手电筒应用程序。几年之后,iPhone就内置了手电筒功能。我认为2023年是每个人都想说,“嘿,我是我们公司AI的负责人。我是AI领导者。我是生成式AI”的一年。因此,有很多聊天机器人在构建中,就像2007年或2008年“总有一款应用适合你”一样,现在将是“总有一家AI公司适合你”。
例如,为HR文档构建聊天机器人。你可以问,你们的陪产假或产假政策是什么,然后公司会为此构建聊天机器人。但公司自己构建这个是没有意义的。更合理的做法是,有一个SaaS应用程序可以做到这一点,然后每个人都购买它。我们现在正处于这样一种状态:很多公司都在说,“我们要构建自己的手电筒应用程序”或各种各样的聊天应用程序。现在我们慢慢地看到,一些公司和应用程序正在被构建出来,它们将专注于特定领域,而我们都将利用它们。我认为我们才刚刚开始。
04 垂直场景数据制胜:AI原生公司的必由之路
Logan Bartlett:更进一步地推演这个比喻,您认为最终终端客户和人力资源系统之间会不会出现去中介化?原生AI企业会以自然语言界面作为交互方式,而不再需要Workday、ADP或其他后端系统作为用户界面?
Ali Ghodsi:有可能。我认为在AI时代,数据至关重要,这也是为什么不应该每个人都构建自己的聊天应用的原因。你应该真正问问自己,你的公司有什么竞争优势?你有什么独特之处是行业内其他公司无法做到的?每个人都可以调用OpenAI的大语言模型。所以,仅仅调用GPT-4或GPT-5或GPT-6是不会有帮助的。你的优势通常归结于数据或某种客户关系,但通常是数据,你必须拥有其他人没有的数据优势。所以最终会归结到这一点。大公司、老牌企业,他们拥有这种数据优势,对吧?他们拥有客户,并且正在收集大量数据。
所以问题是,他们能否利用这种数据优势,整合AI,并进行必要的创新?另一方面,我们之前也看到过,在这些浪潮中,会有一些聪明的创始团队,他们完全颠覆性的,以不同的方式思考问题,他们会崛起,他们会以大公司根本没有意识到的方式做事,而后者只是在方向盘上睡着了,他们不会那样做。我认为我们会看到这两种情况。我认为我们会看到一些,我们会看到很多初创公司失败,就像1999年互联网即将到来的时候一样。但我们也会看到一些公司成为下一个谷歌、Facebook等等。
Logan Bartlett:但我认为我们也会看到一些老牌企业,它们实际上找到了如何利用他们拥有的数据,并进行必要的投资来破解这方面的密码。我们会看到这两种情况。这究竟如何发展,我可能会更看好初创公司,说实话,而不是大公司。
Logan Bartlett:有意思。
Ali Ghodsi:大公司的行动太慢了。而且,如果你有一个杀手级应用,你就可以获得数据飞轮,收集数据并增加使用量,然后你就会有足够的数据优势来做到这一点。如果大公司没有注意到这一点,他们的行动太快了,在你意识到之前,就已经来不及做出反应了。
05
复合AI系统破局:Scaling Law遭遇瓶颈拐点
Logan Bartlett:您认为我们现在处于AI炒作周期的哪个阶段?
Ali Ghodsi:我认为我们会看到这种情况。我不认为,嘿,我们正处于幻灭的低谷。坦率地说,我认为它就像在顶峰的某个地方。我们将很快看到越来越多的公司表现不佳。我认为会出现一种说法,“嘿,这AI的事情完全是……言过其实,什么都没有。模型的质量不够,它们根本不起作用。这东西行不通。所有这些公司等等。”所以我认为我们很快就会走向这个方向。但我认为在那之后,我们将看到那些公司开始推出完全改变人类的应用程序。
Logan Bartlett:好消息是加密货币又回来了。所以人们可以在两者之间来回跳跃。我很好奇,在我们录制这段内容的时候,我想是2024年11月初,有很多关于Scaling Law的报道,也许我们正达到一些外部限制,并且Scaling Law的回报正在递减。您对我们目前在Scaling Law方面的进展有什么看法?
Ali Ghodsi:我们实际上发表了一篇研究论文,我的联合创始人Matei Zaharia,它是关于复合AI系统的,我们这样称呼它。它大概在六个月前或者更早之前发表的。它预测了这一点,它基本上是说,为了真正榨取最后一点质量,真正更上一层楼,我们需要构建这些代理系统,其中有许多部分、许多组件协同工作。特别是,能够评估整个AI系统在您想要执行的特定任务上的质量将变得非常重要。就像我举的HR文档问答的例子,你如何很好地回答员工关于HR文档的问题?而不是你如何通过律师资格考试或医学考试?不是通用智能,而是这个特定的方面。只有当我们有了这个评估,我们才能开始构建这些代理系统,我们可以开始进行持续优化。
所以不断提高特定任务的质量。我们称之为复合AI系统,这些系统还将利用很多工具,它们还将利用经典的机器学习,因为经典的机器学习具有更好的计算能力。它更擅长处理数字等等,计算器,天气预报等等,这就是我们所说的复合AI系统。
它们的美妙之处在于,当您运行它们并且它们出错时,您可以调试哪个代理出错了,推理步骤在哪里出了问题,然后您可以改进它,从而可以变得越来越好,您可以进行这种逐步优化,并不断提高模型或AI系统的质量。Scaling Law,您预先构建这些巨大的模型,您等待六个月,模型出来,也许它不擅长预测某些东西,也许它的计算能力不好,你甚至不知道它为什么不好,我们没有办法知道,嘿,它为什么把这件事搞错了?
我不知道。你做了一堆矩阵乘法,一堆注意力层,然后一些东西蹦出来了。训练一个更大的模型,堆数据更多似乎更容易。而现在在推理时执行这种更具主动的工作流程很有意义,可以有很多创新。我认为现在每个人都在关注这个。
Logan Bartlett:您认为这会导致不同模型类型和不同功能的联合,人们分别擅长这些模型和功能吗?
Ali Ghodsi:是的,我认为您将构建非常擅长特定任务的AI系统。我们一直都能看到我们的客户,他们通常想一遍又一遍地做同样的事情。比如他们有海量数据,比如他们有包含SEC文件的数据库,对吧?或者他们是一家保险公司,他们有所有这些保险文件。他们想在海量数据上重复地一遍又一遍地做同样的任务。所以对他们来说,归结为我能在这个特定任务上做到最高的质量是什么?
我不需要擅长AGI,通用人工智能。我如何能一遍又一遍地做好这件事?你能给我最低的成本吗?因为我要大规模地做这件事,这将花费我很多钱。因此,专门构建一个非常擅长于此的系统是有意义的。拥有一个通用的、巨大的模型成本太高了。实际上,即使它真的很聪明,它在那个特定任务、重复性任务上的表现也不会那么好。所以我们一直都能看到这种情况。就像数据……令人惊讶的事情之一是,我们有各种规模的模型。
您可以使用400亿参数的LLaMA,但总的来说,我们从小型模型中获得的收入更多。这让我很惊讶,因为,每个模型,你在更大的模型上赚的钱更多,它使用更多的GPU等等。但是客户希望采用大型模型,提炼出尽可能小的模型,使其能够获得足够好的质量,然后只使用它,因为这样可以节省他们的钱。
实际上,总的来说,我们在这方面赚的钱更多,我认为我们会看到这种情况,你在生活中也能看到这种情况。人类正在做的所有任务,所有正在发生的工作,他们……你需要陶哲轩来完成每项任务吗?你是否让地球上最聪明的人来做这些事情?或者很多工作都是重复性的,有些事情,足够好了,你想为此付出特定的代价。所以,你有一个专门的小型模型是有意义的。
Logan Bartlett:您如何看待一般推理的概念,或者说通往也许不是AGI,而是更全面理解和推理的道路,这种理解和推理是这些不同模型的基础?您认为我们正在接近飞跃式的进步,或者您认为我们已经达到了某个平台期,现在是关于数据和不同功能领域的问题?
Ali Ghodsi:我的意思是,看,Scaling Law它就像一个对数刻度。所以向右移动,意味着我们将获得改进的智能。但是,接下来的千倍改进不会像之前的千倍改进那样产生那么多收益。另外,我们的一位研究人员提出了这一点,在过去的11年中,我们已经将计算能力提高了1亿倍来解决这个问题,我们无法在接下来的几年中获得同样的提升。我们会改进它,但不会那么多。没有足够的能量计算来投入其中。我们也没有足够的数据,比如,LLaMA是在15万亿个token上训练的。这是是Web互联网大小的10倍。我们是否还会增加100倍,1000倍的数据来做这件事?获取那么高质量的数据,似乎变得越来越昂贵。但构建这些复合AI系统,这些代理系统要容易得多,你可以继续调试并让AI真正擅长任务。
所以,我认为会有一个放缓。我也觉得很多人认为我们能够真正破解代码,开发出那种超级AGI,但实际上这可能需要某种递归的自我改进循环。我不认为这会发生,因为下一个模型会更昂贵,并且需要更多的人力投入。你必须更加小心。如果我说GPT 5的成本是1毛,创建只需要1秒。如果我们朝这个方向发展,你就能看到进步,我们只需要应用遗传算法,做很多次,然后选择最好的算法,等等。
但现在我们正朝着相反的方向前进,建立一个非常专业的数据中心,在一年时间内构建一个模型,我们会非常小心。这有大量的人员参与。我没有水晶球,但我猜测,在未来很多年里,我们需要人类参与其中,我们需要这些东西是可验证的,就像我们看到的汽车或飞机上的自动驾驶仪一样,我们希望有人参与其中,以验证它没有偏离错误的方向。它只是加速了他们今天的工作。我认为为此,我们将使用更多这些代理系统。
Logan Bartlett:所以听起来有很多“铅弹”。目前您还没有看到任何“银弹”。当您听到人们谈论500亿美元的模型,或者,投入所有这些对您的业务非常有利,我确信当人们考虑这个问题时。但是您是否认为,我们刚刚谈论的所有这些东西,这意味着这有点不切实际,而且对于人们在谈论这种规模的模型时所提到的收益递减来说,过于雄心勃勃?
Ali Ghodsi:好吧,再说一次,我没有水晶球,也许他们是对的。如果他们是,那就太棒了。
Logan Bartlett:您在历史上一直很擅长预测其中一些事情。
06 从幻灭的低谷到AI的巨大潜力
Ali Ghodsi:我认为,他们的推理是有道理的,那就是,嘿,我们正在创造AGI。它值得付出任何代价。无论成本如何都无所谓。无论你的经济模式如何稀释,我都无所谓,因为看看我们正在创造什么。如果你真的实现了它,这对我来说是有意义的。但是,我可能会更倾向于怀疑的态度,花那么多钱。我猜我太像一个运营者了,经营一家公司需要考虑,增长率,LTV,CAC等等,运营利润率,我认为如果你要花那么多钱来生成一个模型,然后你必须对该模型进行推理,为了让它收回你训练该模型所需的投资。现在的情况似乎是,在你还没有收回训练模型的成本之前,它就已经商品化了,而且有人在某个地方有更好的版本。因此,从经济上讲,现在这样做是不可行的。似乎对于那些特定任务,创建这些复合代理系统的成本是值得的。而且投资回报率就在那里。为什么不这样做呢?它可以带来很多价值,并继续这样做。然后,当这些实验室中的一个提出超级模型时,我们可能会感到惊讶。但我持怀疑态度。我认为会有一个障碍。我们必须克服一些障碍才能达到完全自主,才能获得正确的准确性。而且它是可靠的。
Logan Bartlett:如果我们现在冻结模型开发,您是否认为我们目前拥有的AI能力足以在某个时候赶上所有的工具和应用程序等等,以及我们所看到的兴奋和承诺?或者您认为我们正在谈论的这些在更利基的专业模型中的渐进式改进,我们需要继续改进以赶上,我们实际上可以实现的潜力?
Ali Ghodsi:绝对是这样。我认为,人类是这里最长的杆子。如果没有人使用这些东西,它就绝对没用。你甚至无法想出那个超级AGI的东西,如果没有人使用它,那就没关系。人类需要很长时间才能改变他们在这些公司中的所有行为、习惯、流程等等,这非常非常困难。所以我认为就我们现在拥有的东西而言,还有巨大的未开发的潜力,它还没有应用到每个工作场所、每个职能、每个流程以及我们正在做的每件事中,我认为我们甚至可以通过我们讨论的那些技术来改进我们今天拥有的东西。所以我认为,即使我们冻结它,然后说,嘿,就是这样。实际上,我们不知道如何创建一个更好的单一模型,这是我们在未来20年内将看到的最好的模型,我认为这将对经济产生巨大影响,以及我们能做什么等等,所以我仍然非常看好这一点。这对我相信的东西来说是真实的。
Logan Bartlett:从您的位置和您的视野来看,您是否看到了也许对普通听众来说不直观的东西,他们关注所有这些东西,但您能够非常清楚地看到,就像您可能在10年前那样,您当时的想法是,“嘿,为什么有人关心这个AI的东西?”是否有另一个见解,也许没有那么重要,但您看到的其他一些东西,您觉得可能在几年后会成为主流或被很好地理解,但在今天却被低估了?
Ali Ghodsi:是的。我的意思是,我认为这是因为你专注于任务,你把任务集中在那些重复性的事情上,而这些事情今天花费你很多钱,如果你能在这类特定任务上提高可靠性,这对这些组织来说就是巨大的改进,而且是相当具有颠覆性的。我们还没有真正收获这些成果,这些用例现在正在进行中,人们正在构建它们,它们还没有投入生产,它还没有对所有使用这些东西的公司产生影响,但它就在眼前,保证它会出现。我们可能需要两三年才能看到它,然后我们才会看到它的影响,实际上,我担心或者,我怀疑在那之前我们可能会遇到这种幻灭的低谷,然后这些用例才会落地,我们才会看到正在这样做的公司。所以你可以看到它已经在酝酿之中了,只是还没有投入生产。
Logan Bartlett:您是否看到过一些用例,人们使用databricks或其他系统让您特别兴奋,回到您10年前所说的regeneron的例子,也许是今天的某些东西,你们在现场看到的一些让您兴奋或让您,特别期待未来可能发生的事情的东西,在每个垂直领域,每个行业?
Ali Ghodsi:我们看到很多很多用例,比如金融服务,有很多财务顾问,他们基本上现在我们为我们的一个客户,一家大型银行自动生成,他们应该给你的建议是什么,它是定制化的,他们了解你的一切,你的财富状况等等,他们可以给你定制化的建议,它会影响,成千上万的这样做的,对,在保险行业,筛选大量的,文档,以评估风险,对,就像他们可以做到,顺便说一句,人们低估的一件事是,模型阅读数据的速度非常快,而生成文本的速度却很慢,对,他们要慢得多。我的另一个见解是,这令人惊讶,人们使用模型阅读东西与生成东西的比例至少是10比1。所以当他们使用其他书籍时,他们使用我们的次数是生成文本或数据的10倍或100倍,有时甚至更多,而人们关注的是输出的结果,但这通常比我们看到的要小得多。所以,承保是我们看到的另一个,有很多,浏览所有scc文件,并弄清楚发生了什么,提取信号,所以弄清楚alpha,我们在所有金融领域都看到了它。所以在医疗保健领域有很多用例,电子病历,有很多这样的用例,它们都是手写的,能够在其中找到结构,这本身就是一个宝库。所以用例就在那,所以有很多很多这样的用例,你在每个行业都能看到,它们只是还没有产品化,还没有被员工充分利用。
Logan Bartlett:您认为这种读写比例……您认为这种比例会保持在……您是否看到了某些趋势,即阅读量相对于写作量在上升,或者您认为在某个时候,写作和创作会赶上阅读和总结?
Ali Ghodsi:我的意思是,很难看到这一点,因为,作为人类我们能读多少?我的意思是,有很多……总的来说,我们实际上并不阅读,我们不……我们不阅读所有这些,我们只阅读这么多,而且我们阅读得很慢,对,而让AI处理大量信息,嗯,所以它有这样的背景,这很有道理。所以,如果有任何东西可能会增加,如果我们能做得更快,所以,这就是趋势的方向,我们看到的越来越多,当我们查看我们的数据时,比我们开始时看到的更多。
Logan Bartlett:当您为客户提供咨询时,无论是大型企业还是小型企业,关于如何找到人工智能和自动化?如何继续深入研究这段旅程,您是否有一些关键要点或收获,您觉得,“嘿,如果您可以告诉所有客户,这就是如何组建团队,或者这就是如何思考这个问题,”您想到的任何框架、基本原理或其他什么?
Ali Ghodsi:首先,你必须制定正确的数据战略。很多公司现在都想跳过这一步,直接跳到人工智能。而且,数据团队一直在努力,试图将公司的数据组织起来、保护起来,将数据集中到一个地方,这样他们才能真正访问数据,而不是分散在不同的孤岛中。这是一个旅程,而且这项工作还没有完成。这项工作还没有出现在财富500强CEO的关注范围内。它一直是一个深奥的话题。也许IT部门有点担心这个问题。现在,在ChatGPT之后,CEO们都醒悟过来了,他们说,我需要AI。它改变了游戏规则。我现在看到了。我自己也用过它。给我AI。他们有点跳过了这一步。所以回到基础非常重要。数据非常重要。所以你必须把它放在一个好位置。如果你没有把它放在一个好位置,你实际上将无法在AI方面取得成功。第二件事是,将你想做的AI用例集中在你拥有数据优势的地方。所以,对于你的公司来说,你的数据优势是什么?坦率地说,我经常发现自己在与客户交谈时告诉他们,也许不要做这个项目。我说,为什么不呢?我们对此非常兴奋。我们要做这个和那个。我们已经准备好开始了。我们会为此支付你很多钱。然后他们会说,是的,但是你在这方面的优势是什么?其他人会为此开发一个应用程序。所以,让我们关注那些你相对于你的竞争对手拥有竞争优势的地方。它通常必须回到你围绕数据拥有的某些东西。而且你确实拥有它。所以,让我们关注这些用例。因为我们希望我们的客户取得成功。只有这样,从长远来看,我们才能取得成功。所以我想说这是我说的第二件事。第三是,有很多人的问题。在大型组织中,现在有很多人在争夺AI的所有权。我是我们公司AI的负责人等等。所以,找到一种方法,让你……能够在大公司中协调战略,我知道这很无聊,但这是最难的部分。一个大型组织,有这么多不同的人朝着不同的方向奔跑,对使用哪个供应商、使用哪种模型、招聘哪种人、做哪个项目有很多想法。
Logan Bartlett:是的。
Ali Ghodsi:是的。所以,如果你能将决策权集中到组织中的一个人身上,而不是让很多部门为此进行政治斗争,它就能简化并加快事情的进展。通常情况下,你实际上会让该部门的负责人成为变革推动者。这是一个不会做每个人都会喜欢的事情的人。他们会进来做出艰难的决定,简化数据处理、周围的安全性、周围的隐私,因为每个人都担心这些。然后专注于那些对该组织真正重要的用例。这与技术一样重要。我非常关心技术,并且沉迷于此,但这同样重要。项目将得不到资助,或者它们卡在安全方面,或者它们毫无进展,因为不同的部门正在互相争斗。所以我们也需要克服这些问题。这就是为什么我说,在我们看到这些东西的影响之前,这将需要几年的时间。
Logan Bartlett:当您考虑这个领域以及您之前用来谈论的术语,它是复合……什么是复合数据等等?
Ali Ghodsi:复合代理系统。
Logan Bartlett:您如何考虑可能追求的领域?有很多风险投资公司在推理或评估或其他领域。当您考虑Databricks作为一家企业可能进入的不同领域时,您如何评估,没有双关语的意思,我想,这些市场可能会追求?
Ali Ghodsi:是的,这很有道理。看,对我们来说,如果你已经将所有数据都放在Databricks上,这很有道理。你已经信任我们,相信它是安全的。我们能够处理安全性和隐私性。所以问题是,与之真正相邻的是什么?对我来说,作为CEO,我们可以在哪些方面为客户带来额外的价值,而这些价值是他们无法从其他地方获得的?通常会回到他们已经与我们一起拥有的数据。因此,通常伴随着对该数据的治理,对该数据的保护。你不想构建……这实际上发生在一个客户身上。他们有一个聊天机器人,如果你问它,我能买到的最好的车是什么?如果这是一家汽车制造商,它推荐了竞争对手的汽车。那么你如何设置保护措施呢?你如何处理PII数据(Personally Identifiable Information,简称PII)?你如何处理即将出台的AI法规?我们可以将很多这些内容在Databricks中标准化。所以这是有道理的。我们可以自动生成文档,这样你就符合即将出台的法规。我们可以设置保护措施,这样它就不会做这些事情。而且由于我们拥有数据,我们可以创建这个数据循环,这样当你使用模型时,我们就会创建评估,并自动将其反馈到使这个模型变得越来越智能,并做到这一点。看起来我们可以做到这一点,因为他们已经拥有了我们的数据。所以对我们来说这样做是有利的。我认为在这个领域,对于初创公司来说,他们应该专注于应用程序。我认为应用程序将是未来AI领域大量价值积累的地方。我们很乐意成为他们的基础设施。因此,他们将我们用于他们的数据处理、治理和AI。应用程序,我的意思是,有很多创造力。你看到很多事情正在发生。我无法预测哪些应用程序最终会胜出。这有点像在2000年试图预测Facebook或Twitter。没有人能够做到这一点。没有人会说,会有一家公司做140个字符的推文。现在也会是同样的情况。所以我们只想成为他们的基础设施,这样他们就可以在我们之上构建他们的AI系统。我们帮助他们建立数据飞轮。
Logan Bartlett:我们能否稍微回顾一下Spark最初的早期阶段?所以我们谈到了Netflix竞赛等等。我听说,也许您在早期曾试图出售这项技术,但并没有真正的买家。您能回到那个早期,早期的故事吗?比如,您看到了什么,您是如何将它从地面发展成某种商业实体的?
Ali Ghodsi:是的,我的意思是,真正发生的事情是,我们看到硅谷的科技公司正在利用AI。这是2009年或2010年。我们看到Facebook在做什么。我们看到谷歌在做什么。很明显,对数据进行AI分析将是最重要的事情。当时,每个人都停留在做基本的分析,回顾过去。我们称之为BI,商业智能,它是回顾过去的。比如,我上周的收入是多少?他们很兴奋,因为他们可以非常非常快地做到这一点。但我们在问,嘿,你的下周收入会是多少,AI?当时人们对此并没有太大的兴趣。我们四处走动,试图推广这项技术,因为我们只是想做研究。但很难真正让任何人看到这一点。你可能还记得这句话。那是Hadoop大战,Hadoop时代。不可能让任何人关注这些东西。所以有点出于绝望,我们创办了一家公司,然后说,如果我们自己不做,就没有人会做。我记得实际上我们的第一批客户之一,我们说,嘿,这是开源的。拿去吧,因为我们不想以此赚钱。然后他说,不,你必须向我们收费,因为我们想要一家支持它的企业。那时我们才意识到,好的,需要有一家企业。没有其他人会这样做。我们可能必须自己做。
Logan Bartlett:是这些供应商纯粹的关注点问题吗?或者从数据结构的角度来看,是否需要实际发生一些事情,才能使市场发展到他们能够真正做很多您希望他们做的事情的地步?
Ali Ghodsi:我认为有这些炒作周期,每个人都只关注某件事。所以那个时代是Hadoop炒作周期,他们对此非常痴迷。我们无论如何也无法告诉我们,AI更有趣。你打开报纸,所有的内容都是关于那个的。现在也在发生同样的事情,对吧?就像,我认为市场就是这样运作的。而要创建一个成功的公司,你必须押注一些东西。在当时,这是非共识的,你必须对此是正确的。所以对我们来说,那就是AI。那就是云。那就是开源。这些都是我们兴奋的事情,但当时并没有太多人对此感到兴奋。实际上,我们被告知这行不通。所有数据都将在本地,开源,你无法将其货币化,等等。所以我认为现在的情况也类似,对吧?
Logan Bartlett:我听说过一个故事,说您……说一个客户要给您,我不知道,七位数或八位数的报价,来构建一个本地版本的产品,而您在某个时间点拒绝了它,也许您现在可以用得上,但现在用得少,但在那个时间点,您肯定可以用得上那七位数或八位数,或者无论它是什么。您是否只是将此视为您正在构建的不可避免的路径,因此,除了它之外的任何事情都是一种干扰?或者,这是什么哲学上的决定?
Ali Ghodsi:是的,百分之百。我们的观点是,我们必须对一些其他人不相信的东西进行不对称的押注,而且我们最好对此是正确的,这是唯一的办法。所以,如果我们要在本地进行,并且做每个人都在做的事情,那么有比我们更大的鲨鱼可以做到这一点。然后这就会失败,而且不会成功。所以,是的,在我担任CEO大约一个月后,2016年,一家最大的银行告诉我,你需要把这些东西带到本地。然后我说,不,我们不会这样做。然后他们说,多少钱?我说,多少钱什么?他们说,我们会付你多少钱?我说,我们不会这样做。他们说,500万。我说,我们不会这样做。他们说,1000万。我说,我们不会这样做。2000万,我马上给你2000万。
当时,2016年,我想我们那年的收入是1000万美元。所以2000万美元的收入是很多。但我们的想法是,如果你在本地进行,他们是一家更大的公司。所以我们必须有一个我们相信的不对称的押注,并且我们继续加倍。然后一旦这个押注成真,我们就会足够大,以至于其他人很难赶上我们。同样的事情,正如我所说的,现在将在AI和LLM时代发生,对吧。我认为你必须选择一些你认为与市场上其他人不同的东西,然后押注它。然后希望你是对的。
07 关于Databricks
Logan Bartlett:当您回顾这段旅程时,我听到的一个故事是,Ben Horowitz在将它变成一家企业方面功不可没。您能讲讲这个故事吗?通常情况下,我不允许其他风险投资公司的宣传。但我认为这是一个有趣的故事,他实际上是在推动你们思考更大的格局,并将它变成一个商业产品。
Ali Ghodsi:是的。我的意思是,看,我们来自研究实验室。我们真的只想筹集20万美元、30万美元、40万美元的种子资金,然后编写代码一年左右。他是那个大力推动的人。不,让我们做A轮融资,我想成为独家投资者。我们实际上对此并不太兴奋。但后来他给了我们一个我们无法拒绝的价格。然后他说,不,做大。他给了我们1400万美元,在当时,这是一大笔钱。我知道现在不算什么。然后他说,冲冲冲。所以他真的推动了我们。积极进取。颠覆市场。雄心勃勃。他对Databricks的愿景总是比我们的大几个数量级。无论我们对Databricks的愿景多么宏伟,他总是领先几个数量级,并且积极推动,你想得太小了。我认为他也真的相信这一点。所以这从早期就为我们定下了基调。
Logan Bartlett:因为早期的创始人,我不知道你是否记得这些数字,但你们打赌……你记得实际的数字吗?
Ali Ghodsi:所以,在早期,赌注是什么?当我们创办公司的时候,我们围坐在桌子旁,然后说,嘿,对公司来说,一个好的结果是什么?我想,当我们围坐在桌子旁的时候,数字大概是1.5亿美元的退出,或者2亿美元,有人说2.5亿美元,等等。所以这就是我们的想法。而Ben马上就说,不,不,不,肯定是数十亿美元,我们要做到的。然后当我们达到这个目标时,他就说,这很容易就会成为我们公司的1000亿美元。现在,在我们现在所处的位置,他说,你肯定需要考虑1万亿美元。而且,我也要感谢Marc Andreessen,在一次会议上,我想是早期。我们说,他说,你最大的瓶颈是什么?我想这是2017年。我说,嘿,我们招不到工程师。我们无法从Facebook和谷歌那里挖到工程师。他们太贵了。然后他说,啊,所以FANG(Facebook、Amazon、Netflix、Google)是个问题?我说,是的,FANG是个问题。然后他说,好的,所以你只需要把自己添加到那个列表中。它需要是FANG DB(Facebook、Amazon、Netflix、Google、Databricks)。
Logan Bartlett:哈,就是这样。
Ali Ghodsi:然后他就继续下去了。但在那次会议之后,我们心想,是的,好吧,他说得对。我们应该真的……提供并聘用那些人,并成为那些科技磁铁之一。它改变了我们的心态。我们回去后改变了我们的薪酬。我们改变了我们的招聘方式,仅仅基于那一个评论。
Logan Bartlett:我很好奇,在战术层面上,我的意思是,这非常有抱负。听起来很棒。但在改变薪酬或思考更大的格局时,你接下来做了什么?
Ali Ghodsi:我们回去后,将工程师的薪酬提高到了市场的90%。我们做了计算,我们看到了这将花费我们多少钱。我们是否有能力做到这一点?这是……这是我们作为一家公司能够承受的事情吗?稀释程度会是多少?这是很久以前的事情了。实际上,当我们运行计算时,我们惊讶地发现,实际上我们可以做到这一点,而且这是可持续的。这让我们很惊讶。我们是数据公司。我们处理数据和所有数字。我们发现,它实际上是你的市值除以员工人数。这就是当你支付某人股权时,你的股权有多丰富。而这些公司有很多员工。
所以后来发现,实际上,我们比我们想象的要更富有。如果你把我们的市值除以员工人数。因为这不是你的财务状况。这与你的收入增长无关。而是关于你可以用股权向某人提供什么。结果表明,实际上我们完全有能力做到这一点。所以让我们来探讨一下。然后它就开始起作用了。然后我们就能聘用我们以前无法聘用的人。他们进来后,彻底改变了我们对产品的做法。我们只是可以大大提高Databricks的功能速度和创新周期。这实际上帮助我们慢慢地开始从大部队中脱颖而出。因为在2017年,如果你和我们谈过,我们就会是数百家初创公司中的一家。所以他们做的这些小事推动了我们,真的,真的要雄心勃勃,要走得更远。我们做到了。但我们总是谨慎地去做。我们不想疯狂地烧掉银行账户。我们想谨慎行事。
图片
Mark Blythhouse:Databricks成立于2013年?
Ali Ghodsi:没错。
Mark Blythhouse:在最初的几年里,您还不是CEO。在旅程的最初几年里,您在做什么?然后是什么促使您介入并成为CEO?
Ali Ghodsi:是的,我负责产品和工程,我喜欢这份工作。实际上,在那个阶段,这很有道理。因为一家公司的前两三年你会做什么?当你创办一家初创公司时,你希望获得产品市场契合度,构建一些有效的东西。所以这就是我们关注的重点。我们如何才能获得一个想要使用它的客户?然后我们如何才能获得一个想要重复使用它的客户?然后我们如何才能获得一个重复使用它并为之付费的客户?所以这就是前两三年的重点。我们用Spark进行创新的技术在2015年爆发了。
那时,我们觉得自己成功了,但我们没有任何盈利。所以在15年,我们经历了一段艰难的时期。我们必须弄清楚,好吧,如果我们无法盈利,也许这里什么都没有。公司进行了一些反思。然后我们说,好吧,让我们对一些事情进行重置,重新思考一些东西,并在2016年重新开始,这样他们就可以在2016年看到你了。我们做了一些改变,这些改变实际上开始帮助我们盈利。
Mark Mandelmann:最初,您是临时CEO,还是您是CEO,而他们仍在与其他潜在的外部候选人洽谈?
Ali Ghodsi:嗯,我以为我是……嗯,首先,我从小道消息听说他们在面试人。所以我发现,好吧,他们实际上在面试其他外部人员。所以这不是真的。
Mark Mandelmann:您当时是CEO吗?还是……
Ali Ghodsi:是的。
Mark Mandelmann:但他们好像在说,嘿,你想成为CEO吗?
Ali Ghodsi:我当时想,当然。然后我发现,好吧,他们实际上在面试其他人。好吧,他们没有告诉我这件事。但最终,我想,好吧,我想我是CEO。他们已经向公司宣布了。我是CEO。我在运营它。但后来我有点,我的薪酬没有改变。我很快就知道,嘿,我实际上是临时CEO。我不知道这一点。
Mark Mandelmann:你没有得到这个头衔,直到,是的。
Ali Ghodsi:所以后来发现,这只是一个测试期。然后最终,我想说一年后,他们真的有点像,好吧,不,我们要真正选择他。
Mark Mandelmann:所以,当你2016年上任时,你关注了三件事。听起来盈利也是其中之一。但你能谈谈这三件事是什么吗?我认为是提升管理团队,改变客户类型的重点,然后是盈利。
Ali Ghodsi:是的,企业销售,全面转向企业B2B。我们是PLG(Product-Led Growth,产品驱动增长)。我知道它现在仍然很热门。每个人都想建立PLG公司。但在两三年后,我们痛苦地认识到,PLG实际上行不通。可能只对极少数公司有效。这是一件好事。我们仍然在做PLG。但你猜怎么着?如果你想销售一个数据平台,我们想管理大型组织最敏感的数据,你需要获得该组织的认可。没有人会仅仅刷一下信用卡,然后开始把他们的数据给你,然后你就会成功。所以PLG在这种模式下行不通。在B2B领域,这很难。如果你想与大型企业签订大合同,PLG可能行不通,行不通。所以,第一,全力投入企业销售。我们之前曾尝试成为这种PLG产品主导的增长模式。第二件事是提升管理层。所以我们提升了整个执行团队。执行团队中的每个人都是新的。所以我基本上组建了一个新的执行团队,他们拥有更多的经验。他们知道自己在做什么。稍微偏向于经验,而不是仅仅,嘿,我们只是聪明的博士,可以自己解决这个问题。我们选择了在甲骨文从事销售20年、30年的人,或者在大规模从事市场营销的人,了解市场营销是如何运作的,等等。
所以这真的对执行也有帮助。因为我想说,我们在市场推广方面真的很薄弱。我们擅长产品、创新、研究。所以这些真的很有帮助。然后是我们如何在开源领域进行创新的改变。仅仅开源所有东西并将其赠送出去是行不通的。所以我们需要专有的秘密武器,我们不会仅仅将其赠送给超大规模企业。所以这对于改变也至关重要。这很难做到。如果你是一家纯粹的开源公司,你来自学术界,很难让所有员工都全力以赴。但这是成功的唯一途径。如果我们没有进行这种转变,我们就不会存在了。
Logan Bartlett:当您负责产品时,您是否有这些观点,并且您已经准备好这样做?或者是否有某种反思最终导致了这些结论?
Ali Ghodsi:是的,我想在15年,我们做得不是很好。在15年,有点像,好吧,我们正在尝试PLG。很明显,它行不通,对吧?是的,我们不想做企业B2B,因为我们不擅长它。我们在这方面没有经验。但是,。我们在2015年结束时的收入为160万美元,2015年。所以如果我们只有150万或160万美元的收入,从我们能从博客和其他地方收集到的信息来看,一个企业销售人员可以销售100万或150万美元的软件。那只是一个AE。为什么我们不雇佣三个这样的人来试试呢?我们有什么损失?所以这在2015年出现了。另一件事是,很明显,无论我们在创新周期方面做了什么,超大规模企业都会立即拥有同样的东西。他们只会选择它。
事实上,他们还会在上面添加一些东西。然后他们就拥有了整个平台,整个云。所以他们总是足够好的供应商。所以客户会说,嗯,你很棒。你的创新很棒,但我也可以从超大规模企业那里得到它。我要先尝试一下,因为我已经和这些人签订了合同。我已经获得了安全批准。我已经付给他们一大笔钱了。先试试那个。如果它不够好,我会再回来找你。所以很明显,我们必须能够清楚地表达,是的,你可以去那里,但如果你去那里,你就得不到XYZ。
比如,我们有他们没有的XYZ。所以如果你不能清楚地表达这一点,那么你就没有什么可以给你的销售人员去销售的东西。然后就是我们缺乏的经验。所以我认为,在2015年的艰难困苦中,我们非常清楚地认识到,我们必须尝试一些新的东西。这三个方向似乎是可行的。
Logan Bartlett:我的意思是,最突出的一点可能是单向门,即许可或盈利模式的转变。它与那些非常纯粹的开源人士的文化大相径庭。这是一个经过深思熟虑的决定吗?或者只是声明性的,“嘿,伙计们,为了能够建立一家企业,我们必须这样做”?
Ali Ghodsi:我认为当我接手的时候,我对需要做的事情只是稍微强硬一点。但这在内部是一个很大的争论。我明确表示。我想我用了这个比喻。我说,嘿,我们有一把枪。里面只剩下一颗子弹。我们不会做1000件事。我们只剩下一颗子弹。我们最好瞄准得非常清楚。而且我们最好击中目标。如果我们不这样做,我们就完蛋了。
所以我明确表示,这是生死攸关的,我们要做的事情。我认为当我让人们清醒过来的时候,因为在创业初期,你会很兴奋。你在做事。但如果没有人明确地告诉你,嘿,我们实际上会在几年内倒闭。并不是一切都很好,仅仅因为我们有很高的估值。我想人们开始排队,并开始思考,好吧,我们实际上可以做些什么?
Logan Bartlett:他们很快开始出现在业务中,还是花了几个季度?
Ali Ghodsi:没有。我认为很快,工程师们就开始思考,我向他们明确表示,你构建的这个东西很棒。它现在也可以在超大规模企业的云上使用。那么区别是什么?我向他们非常清楚地表明了这一点,并且我分享了它。我们有一种极度透明的文化,以使其非常清晰。所以让他们参与进来。让他们自己明白我们无法获胜。如果我们继续这样做,我们注定会失败。他们很快就明白了,我们希望在这里取得成功。所以他们开始提出一些创新,我们将……这个,也许我们不需要开源。
Logan Bartlett:现在,当您考虑扩展到新产品时,我听说您实际上会为每个产品组建不同的团队。随着规模的扩大和在这些不同产品领域的迭代,您在产品管理和组织方面学到了什么?
Ali Ghodsi:是的。我认为当你从零到一构建一个产品时,你必须做与你在公司最初的两三年里所做的同样的事情。所以任何公司一旦超过150名员工,更不用说数千名员工,都会有很多流程。所以你必须削减它。然后说,看,对于新产品,你不需要满足所有的安全要求。你不需要拥有所有的流程。组建一个小的核心团队,快速迭代。首先,找出你在这些早期初创公司中拥有的创新者类型的人。让他们参与这个项目。这些人不一定是公司规模扩大后领导成熟产品的优秀人选。你必须有一个这样的人作为核心人物,你把所有东西都围绕着他。你让他们负责。他们开始构建该产品。
然后你让他们快速迭代。所以让他们摆脱迭代周期。让大公司继续下去。但让他们进入这个更快、更小的周期。并鼓励他们在内部开发循环、外部开发循环中进行超快速迭代。并且只专注于获得用户和获得产品市场契合度。一旦这种情况发生,你就可以将其移回母公司。所以理想情况下,如果可以的话,甚至在整个产品之外进行。
所以我们现在有一个名为Genie的产品,它可以让你用英语提问,它可以立即回答。它理解你数据的所有语义。我们称之为数据智能。所以它理解你的数据。然后它会编程并提出问题,并直接给你答案。但为了知道它不是在胡说八道,你可以实际看到它是如何编码的,以及幕后的情况等等。那个产品,我们实际上是在Databricks代码库之外完全构建的。它不满足任何这些东西。我们没有在任何东西上构建。我们只是快速迭代。就在规范之外做,就像一个初创公司一样。
然后,只有当我们看到结果真的很好,人们喜欢它时,我们才经历了痛苦的过程,好的。让我们重写它。让我们把它移到母公司。所以它几乎就像一次收购。你必须将其整合到整个系统中,并确保其安全等等。
Mark Mandelmann:所以你会给人们自主权,让他们自己做决定,而不是共享基本原则。或者如果你们在下面使用某种类型的,我不知道,单点登录或任何云结构,你会给人们完全的自主权去做。然后你会在它真正找到产品市场契合度后回来协调它。
Ali Ghodsi:在一个单独的存储库中进行。在一个单独的GitHub存储库中进行,在大系统之外。并且这样做,快速迭代是最重要的事情。因为这就是你作为初创公司所做的。作为一家初创公司,你的运营速度是三到四倍。我见过这种情况。我们进行过收购。如果你衡量它,初创公司的行动速度比Databricks这样的公司快三到四倍。我认为我们的行动非常快。而且我们非常创新。
但即便如此,我们也要花三到四倍的时间。为什么?这是安全流程。这是法律签署。这是确保它在所有云环境中都能正常工作。而让你慢下来的最大原因是,你有成千上万的客户,你不能让他们倒退。所以你必须解放新产品。否则,你的行动就会太慢。这就是我们所看到的。老实说,那些真正的大公司,他们的运作方式就是这样。他们花了太长时间。这就是为什么生态系统中有初创公司的原因。所以你必须回到过去,并重现你拥有一家小型初创公司时的环境。
Logan Bartlett:我很好奇,现在您担任CEO一职已经大约9年了。对吗?当您回顾您的领导风格时,今天您看起来像是Databricks的典型领导者。这就像您一直都在做的工作一样。我猜想,领导风格在这段时间内以某种方式发生了变化。您是否有任何希望您可以,您是否有任何希望您可以回到过去告诉您早期的自己,第一次担任CEO时,或者您最早的创始人时期,当您即将上任时?
Ali Ghodsi:是的。我的意思是,我认为你会希望尽早培养领导者,比如与你培养的少数领导者建立信任,并继续这样做。因为你会发现在9年、10年后,我有很多很棒的联合创始人,他们仍然很活跃,并且他们一起经营公司,这几乎是一种合作关系。但人数并不多,即使我们有近8000名员工,有多少人真正,真正能帮助你一起建立公司?很难找到那些与你建立信任并与你一起发展公司的领导者。所以我会更积极地投入更多精力,并且始终在公司中寻找这类人才。
我们只是忙于执行,而可能没有过多关注这一点。所以这是一件我会做的事情。我会做得不一样。我要做的第二件事是,当这些权衡取舍的决定出现时,而且真的很难做出决定,我们是否要进行本地部署等等,要做出一个更面向未来的赌注。不要太担心它对我们的财务或收入的影响。不要让短期主义蔓延。现在说起来容易,但在早期,当你……还远不清楚你是否会成为一家成功的公司时。风险投资家会问你,进展如何?你有董事会会议,他们在关注你的收入目标。他们非常痴迷。想想,怎么样?它是否是曲棍球棒式的增长?它是否在上升?它与行业中的其他人相比如何?继续对未来下注,不要被这些数字冲昏头脑。这是我要给出的另一个建议,因为我们走了很多捷径,结果适得其反。它们不值得做。
我们有点知道,这是一条捷径,但它就像,它是值得的。因为如果我们走这条捷径,这将带来如此多的收入。我现在会避免很多这样的捷径。宁愿站在未来一边,而不是现在一边。当然,也许这是路径依赖的,我这么说只是因为我们现在所处的位置。如果我们做了我说的我们应该做的事情,我们就不会成功。但我仍然有点,总的来说,觉得我们本可以在我们的赌注中更具未来性。
Logan Bartlett:我感觉您专注于赋能组织内的个人领导者,并授权他们为组织做出最佳决策,而不是您作为每个部门的中心枢纽。这是一个公平的描述吗?
Ali Ghodsi:我认为两者兼而有之。我认为我也会对他们进行微观管理。
Logan Bartlett:好的。
Ali Ghodsi:也许他们会不同意。
Logan Bartlett:是的。您如何看待能够在整个组织范围内做出明确决策的中心人物与个人层面的去中心化和赋能之间的紧张关系?
Ali Ghodsi:是的。我的意思是,如果是一个人,你会更清晰,而且更一致。而且,这很好。缺点是它会减慢速度,而且会造成瓶颈。而且它可能不那么赋能。所以你必须取得平衡。你必须在某些地方这样做。比如,随着时间的推移,你会建立信任,你会弄清楚哪些部分你可以完全授权,而且他们会做得很好。而且,他们可能比你更擅长。所以不要假装你比他们更好。在哪些领域你真的需要深入研究?然后在某些领域,有些事情只有你作为CEO才能做。
比如,这实际上是打破僵局。这听起来可能很傻,但随着时间的推移,会出现重叠的产品领域。你会遇到一些领导者,他们正在构建类似的东西,而且维恩图相交。如果你把这件事留给他们,无论你告诉他们多少次,找出如何统一这一点。做一个。我们不会有两个类似的产品。他们将无法自己做到这一点。所以你必须介入并推动。所以你必须明智地使用CEO牌。我认为这很重要。而且你可以做出,构建一个更简单的产品。所以我认为,如果你想要一个真正简单、统一的产品,这很有意义,一个人做更有意义。只是要注意不要造成瓶颈,不要减慢速度。
Logan Bartlett:为什么您认为作为CEO,愿意一遍又一遍地重复同一件事很重要?
Ali Ghodsi:因为我认为人们没有注意到你在说什么。比如,我们都有忙碌的生活。我们都在关注自己的生活。我甚至没有注意到你说的这件事。我甚至不在那里。或者,也许你说了,但我并没有真正理解它。我当时在玩手机,那天我还有其他事情要处理。所以我并没有真正,我没有真正内化它。我没有真正理解它。
所以很多时候,你第三次告诉某人某件事。只有在那时,你才会注意到他们好像,然后他们会像自己想出来的一样重复给你听。那很好。我认为你只需要重复它。但我尝试做的是找到一种以不同的方式重复它的方法。不要总是以同样的方式重复它。这会变得无聊和老套。挑战自己,想出一个新的角度。找到一个说了你想说的同样事情的客户。或者一个有点不同的用例。使用不同的幻灯片。制作新的幻灯片。
你会感到惊讶,因为,人们第一次并没有真正理解它。他们会说,哦,你刚才说的太棒了。即使你心想,嗯,这实际上就是我一个月前说的,但我只是稍微修改了一下。所以我认为这非常重要。
Logan Bartlett:追求真理,我认为是您的价值观之一。对吗?您是如何在实践中贯彻这一点的?或者,这对你们来说是如何体现为一种文化实践的?
Ali Ghodsi:确保在招聘过程中,你对求职者进行追求真理的测试。实际上问某人,“告诉我你最大的错误是什么”并不难。“告诉我你什么时候真的犯了错误”。“你真的没有雇佣好谁”?“你为什么犯了那个错误”?“情况如何”?等等。不断追问他们,不断追问他们,直到他们感到不舒服。他们是否开始找很多借口?
嗯,我真的不想雇佣这个人,但我的老板让我雇佣了他们,那是一次糟糕的雇佣。我知道,但是的,那是我犯的一个错误,但严格来说是我老板的错误。所以,比如,不断追问他们,你可以在面试过程中弄清楚某人是否在追求真理,是否诚实,或者他们是否在试图稍微,让它看起来更好一些。
所以,这是,这是第一点。第二,不要提拔公司里那些不追求真理的人。比如,至少如果你犯了雇佣他们的错误,那么至少要确保你没有提拔他们。所以在公司的晋升中,确保你真的在评估文化价值观。真的这样做。很容易拥有文化价值观,但你在评估晋升吗?我有一个摇滚明星,摇滚明星做得很好。他们推动了业务的发展。他们应该得到晋升吗?你不想成为那个说,嗯,等等。我们能不能看看他们是否在追求真理?哦,他们没有。
我们不要提拔他们。这就像,你疯了吗?这个人对公司产生了巨大的影响。是的,但他们不追求真理。但如果你真的这么想,如果你想让这成为文化,你就必须在晋升中真正做到这一点。然后当然,如果是极端情况,我们可能不得不分道扬镳。你也必须这样做。你不能让不符合文化的人留在身边。所以这就是我想说的。
Logan Bartlett:您将30%、40%的时间花在招聘上。对吗?您说过的一件事是,当您招聘高管时,您会想方设法与他们保持联系,并找到-是的。许多不同的接触点。您能否谈谈这是一种理念,或者您是如何做的?
Ali Ghodsi:是的,我认为这实际上是一个更大的理念,那就是我不相信面试,因为我认为有些人面试表现很好,而他们可能根本不擅长。有些人面试表现很差,但他们可能很优秀。所以我实际上认为这是一个非常嘈杂的渠道。你不能,它没有那么大的价值。那么你能做什么呢?其中一件事,这是你提到的,但我们也使用其他方法,是我试图让他们实际做这项工作。
而且我认为我们认为,哦,在编程中,我们可以这样做。让他们编写这个程序。然后如果他们做得很好,但我们不能对任何其他工作这样做。我不同意这种观点。如果你要招聘市场营销主管,就与他们一起解决市场营销中现在存在的问题,无论是什么问题。如果是人事问题,或者是网页问题,或者是产品营销定位问题,就与他们一起工作,给他们打电话,在晚上,给他们打电话,在早上,问他们,经历它,就像与他们一起工作一样。基本上让他们做这项工作,就好像他们已经是公司的员工一样。你会对他们的文化有很好的了解,你们是否在同一个波长上?他们能否真正做好这项工作?这类事情,尤其要选择那些现在在你的公司里不起作用的事情。
因为,这些是他们进来后你会让他们解决的事情。如果他们能解决这些问题,他们显然是一个很好的雇员。所以我宁愿这样做,也不愿在面试中问他们,那些,他们可能已经练习过的刁钻的问题,“告诉我你自己的弱点”,“你最大的弱点是什么”等等。所以这是我们做的最重要的事情之一。另一个是背景调查。而且我认为你应该预先进行背景调查。已经知道你要雇佣谁。这样,当我第一次见到一个人时,我已经对他们有很多了解。我已经问过了。我还发现了这一点,如果你对五到十个人进行背景调查,他们的老板,以前的老板,你实际上在某些方面比他们更了解自己,而不是完全了解他们。因为他们经历过的所有事情,三四个人在之前的工作中看到他们身上发生的事情的看法。他们可能并没有完全理解每个人对这种情况的看法。
当然,他们有独特的视角。所以我认为背景调查非常重要,然后就是看看他们的工作轨迹。他们在哪里?他们是否见过伟大的……他们是否做过一些杰出的事情?他们是否经常跳槽?这些是我们招聘时强调的三件事。
Logan Bartlett:您在背景调查中有什么技巧?您喜欢问哪些具体问题,或者有哪些方法……没有人喜欢说别人的坏话。那么,您是如何深入挖掘以确保您获得真正的高质量信息的呢?
Ali Ghodsi:是的,这真的取决于你和谁谈话,而且他们都不一样。你可以立即判断出,有些人不会告诉你真相。这将是,他们只会说好话,或者他们什么都不想说。所以,就是这样。所以你只需要继续前进,结束通话。但是,我想我在这里透露了我的,秘诀,所以它再也不会起作用了。
但我认为,如果你能找到以前的,敞开心扉的人,我认为我喜欢问他们的一个问题是,对这个人的能力进行真正的排名。不要问,从一到十打分,然后他们说十。真的问他们,比如,它排第一、第二吗?你有多少……然后深入挖掘。谁是第一名,谁是你的名单上的第二名?顺便说一句,你当然也会去找那些人。然后真的问他们,经历各种场景。比如,只是后续问题。
比如,我做得怎么样?告诉我一些出了问题的事情。给我一个场景。那个场景是什么?真的要打破界限。你必须几乎达到让他们感到不舒服的地步。很多时候,我已经做到了这一点,以至于,他们会回电话说,这是,这是怎么回事?但是,是的,你想,但是你会发现,当你进行背景调查时,好吧,那个人和那个女孩,他们非常坦率。那是一个直言不讳的人。他们会告诉你所有的事情。而其他人则不会。正面推荐,候选人给你的推荐也类似,但有点相反。他们是,绝大多数是,实际上是这个人接下来要雇佣的人。如果是一个经理,他们只是给了你他们的……这也很有用,因为你可以面试那些人,他们接下来要雇佣谁。这样你就可以评估他们要雇佣的人的素质。但偶尔你会发现正面推荐也会告诉你真相,并告诉你真正发生了什么。
在那里你也能学到很多东西。当我做这些推荐时,我不是在寻找,嘿,你的一个缺点是什么,我会取消?我不会因为这个而不雇佣你。这只是为了获得一个完整的画面。你会有缺点。你会有优点。在你来之前,我想了解这个完整的画面。所以这就是我们的目标。但是,是的,对于一些高管来说,在我雇佣他们之前,我已经做了15次这样的背景调查。
Logan Bartlett:作为一名领导者,您必须在不同的职能领域提升自己。其中之一是企业销售。我认为您没有这方面的经验。您是如何学习这个领域的?而且我认为您复制了也许是最佳实践,或者说是内化的,将来自许多不同组织的东西拼凑在一起,以建立您自己的模型。也许您可以谈谈学习一个新的领域或学科,以及您是如何做的?
Ali Ghodsi:是的,但首先,我想说,我们雇佣了Ron Gabrisko(Databricks的首席营收官Chief Revenue Officer),他把我们从基本上零发展到现在的超过20亿美元的ARR(Annual Recurring Revenue,年度经常性收入,是SaaS或订阅业务中用于衡量公司年度经常性收入的关键指标),对吧,基本上是30亿美元的ARR。所以他非常出色。
Logan Bartlett:您在他身上看到了什么,或者……
Ali Ghodsi:是的,我认为他非常聪明。所以我认为他与许多销售人员不同。他是典型的企业B2B销售人员吗?所以他不像工程师类型的人,他是销售领导者的典型原型,吗?带着所有的热情洋溢和激励人心的演讲,让每个人都兴奋起来。所以就像,他拥有所有这些。所以这很好。这是我们不理解或没有的东西。他拥有大型企业的经验,因为有很多销售人员向中端市场SMB(Small and Medium-sized Business,针对中小型企业的销售活动),但他实际上向真正的大型企业销售过。所以这也是我们不了解的东西。
比如,他的想法非常宏大,当他进来的时候,他说,哦,我们要做一个1000万美元的合同,或者1亿美元。我们当时想,没有人会为Databricks支付1000万美元。这是我们的心态。所以这也很有用。但他也,他很有头脑,而且他非常聪明,并且遵循第一性原理。所以有一种兼容性。他拥有工程学位。
所以他有点像独角兽,那种,会说我们的语言,并且能够理解我们,而且非常聪明,但也拥有我们不理解的这整个其他东西。所以那次招聘很重要。我们花了一年时间才招聘到他。我们面试了很多候选人,我认为我们找到了合适的人选。这是运气。所以这很重要。我想说的另一件事是,在面试过程中,当你正在寻找的时候,就像我们花了一年时间才招聘到一名销售人员一样。认真对待高管招聘流程。这是一个学习过程。你基本上是在上学,学习销售主管是什么样的。所以在面试过程中,与所有顶尖的销售主管交谈,并询问他们,并关注他们,并在面试中使用他们,因为我不相信面试,正如我所说的,将面试稍微用作你自己的教程来学习。
所以这对你来说是一个小小的教程。对于你的公司来说,优秀的销售是什么样的,对于你的公司,对于你的公司?在与20个人交谈后,你对,好的,就是这样,有了一个很好的了解。这就是他们在做的事情。他们都有这个特点。所有优秀的人似乎都有这个共同点。这就是它的意义所在。你可以更深入地了解。
然后在背景调查过程中,你就能弄清楚谁是谁。你就能弄清楚这个行业中的顶尖人物是谁,你无法雇佣他们。也试着与他们接触,只是为了向他们学习,并与他们建立关系,或者让他们成为顾问。所以,真的把自己放在,“嘿,你要去大学学习”。这就是这个过程。你不是专家。并且相信那些在这个行业中是最好的人。试着找到第一名的人,并与他们合作。
Logan Bartlett:在为Databricks招聘时,您是否觉得您特别重视某些事情,或者在组织内取得成功的人员类型是Databricks独有的?
Ali Ghodsi:是的,嗯,我们的文化原则经过了逆向工程,正好可以回答你的问题。
Logan Bartlett:所以你不是从原则开始,然后反过来。你从成功的人开始,然后回来。
Ali Ghodsi:成功和失败。
Logan Bartlett:好的。
Ali Ghodsi:我们也研究了那些简历完美但我们雇佣了他们,结果他们失败了的人。为什么会这样?我们回过头来说,好吧,我们无法就招聘标准达成一致。他们会说,我和这10个人一起工作过。他们非常出色。然后我们心想,不,那看起来不像我们的标准。这是一个大问题。所以提高标准。不要妥协。
我们宁愿有更多的假阴性,也不要有假阳性。宁愿错误地拒绝一个真正优秀的人,也不要错误地雇佣一个不优秀的人,这很痛苦。我们通过这种方式学到了……追求真理,很多来自大公司的管理人员都有这样的态度,嗯,一切都很好,我搞定了这个,我的团队搞定了那个,我们正在做这个,这是一个漂亮的幻灯片,向上管理,没什么可看的,嗯,但这对我们来说行不通,这就是追求真理的原则的由来,我们真的需要知道,什么是坏的,你的团队中谁的表现不好,什么不……我们做得不好在哪里,我们在哪里没有满足客户,所以这是第二个原则。
第三个原则,我以前做过这个,我知道怎么做,这是一家更大更好的公司是怎么做的,我们应该这样做,所以这不是第一性原理,我们需要确切地知道如何以及为什么,并在每个决策上都从第一性原理出发,所以,嗯,所以第一性原理成为另一个文化原则,所以我们的文化原则是成功的秘诀在databricks,像高管们总是问我,在一天结束的时候,在databricks成功的秘诀是什么,在我们握手之前,我雇佣他们,然后说,嘿,所以你认为我会在这里成功吗?你认为需要什么?我的意思是,这超级简单。
Logan Bartlett:在Databricks内部寻找人才或招募人才时,我认为那些有点不服输的人。
Ali Ghodsi:是的。
Logan Bartlett:您是否……您是否会在谈话中试图找出这一点?您会问哪些类型的问题来试图弄清楚这一点?
Ali Ghodsi:是的,我的意思是,那些,真的,真的,真的不顾一切,真的努力的人,他们有毅力。我记得Ron在销售,面试中说过的一句话,我想是2015年11月,他说,嘿,如果有一笔交易失败了,我想知道,比如,因为地球上没有其他人能够赢得那笔交易。
比如,我只是知道这是不可能的,因为我会尽一切可能赢得那笔交易。所以我只想,这是他在做某事时的旁白,他很清楚,这个人会竭尽全力。然后,当然,与他协商雇用他的过程真的很痛苦。所以这也再次证实了,好吧,他可能会,很擅长这份工作。你不想让一个销售主管,在为自己谈判薪酬方面很糟糕。
所以,你想弄清楚,是否有什么,那些有事情要证明的人,他们是否试图向你证明?如果他们对事情非常满足和满意,那么它可能行不通。这可能是对于那些有点不完美的人来说,就像我们所有人一样。比如,我们都有事情要证明,而且我们会努力工作。我们会尽我们所能,你可以弄清楚这一点。在面试中,这并不难。
Logan Bartlett:您刚才提到了努力工作。我认为这曾经一度过时了,努力工作。它又重新流行起来。我很好奇,我听说您说过类似这样的话。你从未见过不努力工作的成功人士。您能详细说明这一点吗?
Ali Ghodsi:在研究领域,在学术界,比如天才教授,他们获得了惊人的奖项,这就像,你可以在研究中非常非常聪明,也许你不需要努力工作。但我遇到的所有人,他们都,比我们更努力地工作。我们很震惊。他们一天24小时都在那里。然后在工业界,也是一样。
所以我从来没有,从来没有见过一个只是敷衍了事,而且他们超级成功的人。你会发现有才华的人,但他们并不成功。这必须与极其努力的工作有关。所以我们从第一天起在Databricks就有这样的理念,我们从未偏离过。无论它是否流行,我们从第一天起就是一个超级努力工作的文化。
我们继续保持这种状态,我们说,看,我们有远大的目标。为了实现这些目标,我们将非常努力地工作。如果你不想这样做,完全可以理解,因为也许你有家庭,也许你在生活中还有其他想做的事情。这完全可以理解。但也许Databricks不适合你。所以在Databricks,这一直都是事实。事实上,我们有,我们的工作与生活平衡得分在调查中并不高。而且,我试图坦诚相待。我们实际上并不想拥有糟糕的工作与生活平衡。我们实际上关注那些得分很差的团队,并试图,改变一些事情。我们在这些团队中取得了一些进步。但我也坦诚相待。我不想成为一流的,拥有业内最高的工作与生活平衡得分。那不是,我们不会以这种方式获胜。
所以就这么简单。现在,我自己也试着做到这一点。所以我不想让任何人比我更努力地工作。比如,所以我必须自己做到这一点,但它必须是可持续的。我的意思是,我已经这样做了十年多了,我希望员工也能这样做。所以如果他们真的把自己累垮了,而且他们不能再做很多年,那不是。我不希望他们这样做。我希望他们能够做到这一点,而且它是可持续的,然后希望我们能够一起取得伟大的成就。如果他们不这样做,那也没关系。没有怨恨。。或者也许不是。也许在他们人生的某个阶段,他们想这样做,但他们不想再做了。那也没关系。
Logan Bartlett:我们公司在规模扩张过程中遇到的最困难的事情之一是,那些帮助你走到今天的人,他们开始质疑他们是否是能够帮助你走到旅程的下一步的人。听起来,当您上任时,您做出了提升许多领导层的决定。我相信一路走来,您留下了Ron,而且他在自己的职位上继续成长。但我相信还有其他职能领域,您决定进行升级。您是如何做出这样的决定的,嘿,也许是时候和一个……一直做得很好的人分道扬镳了,但您可能需要一个新人来带领您进入下一个阶段。
Ali Ghodsi:我认为你必须对自己诚实。所以,第一点是,比如,你什么时候知道自己,我认为我们有点知道有这些信号,但我们只是不想看到真相。我们想忽略它,因为它太难了,因为这个人和你一起建立了公司。这是如此……你不想向自己承认,但在内心深处,在内心深处,内心深处,内心深处。所以,当它出现时,立即识别它,并面对真相。对自己诚实。不要对自己撒谎,至少作为一名高管。好的。一旦你自己知道了,现在你必须采取行动。
我发现最简单的方法是,如果你能向这个人解释,并让他们加入进来,这是行不通的。不要把它说成,只是把它说成,它是否有效?你是否赢了?你是否赢了?只关注这一点。如果他们意识到,嘿,好吧,我没有赢。嗯,让我们讨论一下为什么。然后我认为其他一切都变得简单多了。这就像,好吧,但那我们对你怎么办呢?所以在,比如,好吧,我没有赢。它不太管用。有很多原因。好的。让我们想办法让它管用。然后你可以改变,将谈话转向。
好的。对你来说,你的职业生涯,什么是最好的?我想帮助你。我希望你成功。我发现,人们可以继续在新职位上大放异彩。我见过一些人,他们在那个职位上,它不再有效了。我们找到了领导它的人,或者,你进行分层,或者其他什么,但你为这个人找到了一个新职位,他们做得很好,而且他们非常擅长,而且他们会更快乐。实际上,过了一段时间后,他们会说,嘿,Ali不再烦我了,关于它不起作用的事情。第二。我实际上……。当我成功的时候,当我赢的时候,我比我不断地,它不起作用,而且一切都进展不顺的时候更快乐,我每天都过得很糟糕。
所以我实际上发现,这些人中的很多,你可以让他们留在公司里。但你也应该分道扬镳,如果他们只是在敷衍了事,而且他们不再感兴趣了。而且他们只是为了回忆早期一切都美好的时光而留在那里。你最好也分道扬镳。我们不要浪费他们的时间和我们的时间。
Logan Bartlett:也许在我们结束的时候,稍微放大一下,嗯,如果有人在几年后听到这个,我们有点展望未来,用您声称没有的水晶球,但我认为您很擅长预测。嗯,在Databricks周围的世界中,或者你们正在运营的领域中,您认为哪些因素在未来五年内即将成为可能,只是那些让您每天都充满激情地起床并从事这份工作的事情,以及这种潜力,也许是在行业层面,而不是在公司层面,您认为我们即将看到?
Ali Ghodsi:是的。我认为将会发生的事情是,我们将看到我们今天看到的很多东西都会被颠覆,而且未来会有某种AI应用程序来做这些事情。我们甚至不知道它们会是什么样子,但是,嗯,它们的核心都需要什么?比如,在过去的10年、20年、30年、40年里,应用程序需要什么,它们需要一个Oracle数据库作为底层。笑话是,你把所有复杂的,你的东西,所有的复杂性都放进一个数据库里,然后你在上面构建工作流和你的眼睛,或者两层或三层模型?嗯,我认为在未来。你需要AI数据库作为底层。如果你有一个数据AI数据库,你拥有所有的交易数据。你拥有所有的分析和AI,包括模型,然后你可以在上面创造奇迹。
所以我,我认为我们将看到一个在AI领域构建的这些应用程序的生态系统,它们都需要一个AI数据库作为底层。而这基本上就是Databricks。Databricks基本上就是AI数据库。我们不这样称呼它,我们不这样营销它,但本质上它是一个AI数据库。每个应用程序都需要它,地球上的每个公司都需要它。而且,我希望我们能够成为为未来所有这些应用程序提供动力的公司。也会有其他人这样做。嗯,但是,嗯,这就是目标。我认为,我们已经看到了这种情况发生的种子。它的种子。
Logan Bartlett:我,我想我很好奇,只是想详细说明一下。比如,这种情况发生的种子,您是否看到了特别令人兴奋的用例,或者只是客户?
Ali Ghodsi:看,有很多,看,在同一个领域,他们需要安全地进行大规模日志处理,并检测零日攻击。好的。听起来这有点像Databricks的看家本领,实时处理带有内置AI的大规模日志,在可观察性领域。同样的事情。你需要观察,你的日志处理,获取,理解指标、检测异常等等,在客户360度领域,CDP(Customer Data Platform,客户数据平台)和理解你的客户在做什么。
同样的事情,在那里,就像,你必须从许多不同的地方收集海量数据,然后获得遥测数据。这是巨大的数据处理。你需要实时进行。你需要做AI来获得洞察力。好的。所以这就是我们正在做的事情。所以我认为这些领域中的每一个都将建立在基本上是AI数据库的基础上,我希望我们能够成为为所有这些领域提供动力的AI数据库。我认为这种颠覆将在接下来的两三年内发生。
Logan Bartlett:这很令人兴奋。嗯,感谢您参加我们的节目。
Ali Ghodsi:不客气。
Logan Bartlett:感谢您收听本期The Logan Bartlett Show,我们邀请到了Databricks的联合创始人兼首席执行官Ali Ghodsi。如果您喜欢本次对话,请分享给您认为可能感兴趣的其他人,并在您正在收听的播客平台上订阅我们。我们期待下周在The Logan Bartlett Show上与另一位嘉宾再次与您见面。祝大家周末愉快。