找回密码
 立即注册
搜索
热搜: 活动 交友 discuz
查看: 84|回复: 0

Rexer Analytics 调查——数据挖掘者是否过于关注他们的模型?

[复制链接]

1

主题

0

回帖

5

积分

新手上路

积分
5
发表于 2023-9-21 13:54:16 | 显示全部楼层 |阅读模式
Rexer Analytics 刚刚发布了 2011 年调查结果,这是第 5 次年度调查,2011 年第一次调查来自 60 个国家/地区的 1,300 多名数据挖掘者进行了回答。调查继续显示 CRM/营销、金融和保险是主要的商业领域数据挖掘的重点领域。它还重申了最重要的三种算法——回归、决策树和聚类分析,同时显示文本挖掘显着增加,大约 1/3 的人已经使用它,另外 1/3 的人计划使用。 Rexer Analytics 刚刚发布了 2011 年调查结果,这是第 5 次年度调查,2011 年第一次调查来自 60 个国家的 1,300 多名数据挖掘者进行了回答。调查继续显示 CRM/营销、金融和保险是主要的商业领域数据挖掘的重点领域。它还重申了最重要的三种算法——回归、决策树和聚类分析,同时显示文本挖掘显着增加,大约 1/3 已经使用它,另外 1/3 计划使用。基于云的平台仍然只占 12%,大多数工作在台式机或笔记本电脑上本地完成,并且 R 等开源数据挖掘工具正在快速增长。 一些以决策管理为中心的观察结果: 以客户为中心的目标占主导地位,前 8 个目标中有 6 个与客户直接相关。

提高对客户的了解是首要目标(有点被动的目标),但留住客户、销售更多产品以及改善他们的体验都得分很高,这些也是决策管理的经典目标(这就是为什么今年的决策管理峰会将重点关注以下 决策 )顾客)。 对分析建模工具满意度的关键驱动因素是变量发现/分析、易于解释、模型质量指标和可视化。遗 巴拿马电话号码表 憾的是,模型部署的简易性并未进入前 10 名。分析建模者仍然更关心完善他们的模型,而不是确保它们可以部署和使用,这是遗憾的,正如我之前指出的。 模型性能仍然是衡量分析成功与否的首要衡量标准,超过了财务绩效/投资回报率。另一个迹象表明,太多模型只关心他们的模型,而不关心他们的模型改进的业务绩效(决策管理的重点)。 不部署模型的原因主要是工作/成本太高以及结果不被理解,但紧随其后的是模型失败、政治/缺乏支持和不断变化的业务情况(至少有时是花费太长时间的结果)。想要部署和使用更多模型的建模者也许应该花更多的时间来选择能够很好地处理部署并快速部一辆 2012 款奥迪 S8 几乎可以自动驾驶和停止。




如今处理大数据仍然很像驾驶 1971 年的奥迪。很快(比 40 年快得多!)就像乘坐 2012 年 S8 一样。太快了?2-3年。到那时,我们还会称其为“大数据”吗? 大数据至少依赖于一些业务用户了解数据的位置和命名约定(在最好的情况下)以及语义,即使不是查询制作的复杂性。这是进步的巨大障碍。商界人士需要用自己的方式定义他们的工作。设计和维护结构需要业务建模环境。针对这些结构中不可避免的变化建立业务模型尤其重要。同样重要的是,通过分析工作来利用这些结构的潜在价值,而分析工作可以通过与业务人员相关且有用的可理解模型来增强。署的工具(请参阅 2),并将更多的时间专注于业务成果以构建管理支持(请参阅 3)! 综上所述,我担心数据挖掘者仍然过于关注他们的模型和构建完美的模型,而不是创建可部署、可理解并具有业务支持的模型,从而推动业务价值。我之前写过关于工业化分析的博客,并发布了有关商业友好数据挖掘的幻灯片,我认为这两件事都是解决这个问题所必需的。 您可以在Rexer Analytics 网站上找到有关该调查的更多信息。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|手机版|小黑屋|爱零愛菁 ( 粤ICP备2022038107号 )

GMT+8, 2025-1-23 14:51 , Processed in 0.016826 second(s), 19 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表