查看: 365|回复: 3

当直接从BI转到生成式AI时，是否意味着跳过了机器学习 [复制链接]

see122

军衔等级：

上尉

注册：2007-10-29 点赞数

11

电梯直达

1^# 大中小

发表于 2025-3-20 13:04:14 |只看该作者 |倒序浏览

当今世界，人们都在谈论生成式人工智能。全世界都知道所有最新的GenAI概念和术语——因此，你会比以往听到更多这样的话：“这个词不等于token”。全世界都开始实施至少一个或两个GenAI用例，当然——我引用它的意思是“改变生活”。

因为GenAI是BI之后的下一个新事物。整个世界不知何故跳过了ML。

机器学习意味着什么？

从我在分析开发前线工作的日子里，我了解数据分析积压的现实情况。

这些大量的业务需求都要求新的见解来简化决策，并且有一个共同的验收标准：

“必须与利益相关者一起验证模型/管道及其输出，以确保它们满足业务要求和决策需求。”

现在想象一下这种情况：

您正在参加UAT会议，向您的利益相关者——一位电子商务CEO展示您的新预测模型。

您使用相同的查询对您的模型进行了三次实时测试：“明年前5个垂直行业的收入预测是多少？”

每次都会得到不同的输出。对于兔子食品，第一次运行显示增长12%，第二次增长8.5%，第三次增长15.2%。

首席执行官身体前倾，明显有些担忧。她问道：“哪一个是正确的？”

你解释说，根据GenAI流程，所有输出都被视为有效结果。然后你开始解释你的流程架构和其中的LLM—最少的数据预处理，以及对快速工程的大量依赖以及一些LLM参数调整（温度、top-p、top-k）。

然而，她的表情说明了一切：您的管道产生的这种程度的变化无法产生可靠的战略规划。

她需要一个数字，而您为她提供了这批数字。您的解决方案无法指导她或其他业务同事将每个垂直行业预测增长的20%分配给明年的营销预算——这个数字通常上限为500万美元。

经历这次惨败后，她知道最好请你做一个BI模型，让你“手动”计算每个垂直行业的历史月收入增长百分比，并据此推断未来的增长。然后，依靠这些见解和内部人员的市场专业知识，她可以获得更可靠的预算数字。

就这样，从GenAI你又回到了BI+human模型。

您了解我这个简短且戏剧性场景的要点。

由于涉及大笔资金，我怀疑任何CEO都不会愿意使用GenAI来预测重要的财务KPI。当然，他们知道每次他们向LLM询问市场预测时，都会得到不同的答复。

尽管如此，这就是我最近在热议的内容——客户要求数据、分析、机器学习和人工智能专家为机器学习问题实施GenAI解决方案。

这证实了我最近对这个问题的怀疑：

该行业是否以某种方式忽视了一系列最有可能解决其当前大多数业务问题的机器学习模型？

这些模型，除其他外，广告a最有可能更便宜，并且广告b具有确定性。谁不想将两者与可以提高生产力的“其他”模型结合起来呢？

带着这个想法，让我们回归本源，了解何时使用ML。

*脚注：GenAI是ML的一个“专业分支”。从处理数据到优化模型参数，其核心原理仍然植根于ML基本原理。

GenAI的独特之处在于，它主要能够生成全新的内容（如图像、文本或其他创意输出），而不是仅仅关注分析和根据历史模式预测结果。

这种区别并不否定GenAI属于更广泛的ML领域；它只是强调不同的ML方法适合不同的业务目标。那么什么时候使用？也许更恰当的说法是“什么时候不使用？”

在广泛的商业问题领域中，传统机器学习都发挥了作用，并且其表现优于GenAI：

<ol>

当您需要一致、确定性的输出时。
</ol>
确定性：相同输入=相同输出。传统ML模型通常会在给定相同输入数据的情况下提供相同的结果。

<ol>

当你拥有具有清晰模式的结构化历史数据
</ol>
，并且想要基于它进行预测时，可以获得基于过去数据的精确分类和预测。

<ol>

当可解释性很重要时。
</ol>
一些ML模型（尤其是线性模型、决策树及其集成）可以告诉您它们做出预测的原因。“收入将增长12%，因为因素X、Y和Z分别贡献了3%、5%和4%。”与“语言模型说是12%。或8%。或15%。”

<ol>

除了准确性之外，您还需要考虑成本。
</ol>
使用专门构建的算法处理较小、集中的数据集通常需要较少的计算资源，这也反映在成本中。

但根本的区别是：预测和生成是用不同的模型解决不同的问题。

你应该相应地利用它们：

机器学习模型适用于需要从结构化数据中获取可靠结果的

业务问题——无论是收入增长、客户流失率，还是其他类似的场景，您都应该提供“一个数字”作为答案。

GenAI模型

可用于执行诸如集思广益、快速起草Python代码来为您的ML管道制作原型，以及随后创建面向用户的内容以更“业务可接近”的方式传达您的ML见解等任务。

因为这两组模型都有各自的价值，并且其中一组可以增强另一组。

那么，现在该怎么办？

如果您是一名数据专业人士，面临着“使用GenAI做点什么”的压力，请退一步考虑几个问题，这些问题可以帮助您为坚持实施GenAI的利益相关者准备论据。

我们要解决什么问题？

我们是否需要预测特定的KPI，在[客户]数据集中寻找模式，或者集思广益如何向CEO展示见解？换句话说，这个问题是需要确定性输出还是创造性探索？

更重要的是，我们是否计划用我们的产出来分配数百万的预算？

我们已经拥有哪些类型的数据可用于解决此问题？是具有清晰模式的结构化历史数据，还是非结构化/基于文本的信息？

在这种情况下，可解释性有多重要？利益相关者是否需要准确了解我们如何得出特定的预测，还是最终结果就足够了？

除此之外，你还可以通过参考人工智能大咖对机器学习的看法来构建自己的论点。例如，吴恩达指出的是：

“监督学习等技术背后仍有巨大的发展势头，尤其是因为正确标记数据如此有价值。这种上升势头告诉我，在未来几年，监督学习将比生成式人工智能创造更多的价值。”

最后，重要的是，您的利益相关者要充分理解为什么为每项特定任务选择正确的工具对于成功至关重要。确定性、可解释性、数据准备、成本和业务需求等因素应指导这一决策过程。

这并不意味着你会忽视GenAI的存在。

您将使用它来完成更具创造性的任务，例如起草文档、快速制作原型或用您最初不会想到的例子解释见解。

这种组合将帮助您更快地解决分析积压问题，同时确保利益相关者获得他们可以信赖的数字。

来源：36kr

本主题由版主或管理员于 2025-3-20 13:05 审核通过

0 举报本楼

本帖有 3 个回帖，您需要登录后才能浏览登录 | 注册

返回列表

版规|手机版|C114 ( 沪ICP备12002291号-1 )|联系我们 |网站地图

GMT+8, 2025-3-25 23:23 , Processed in 0.160493 second(s), 16 queries , Gzip On.

Discuz Licensed

		自动登录	找回密码
密码			注册