为什么数据质量对集成分析平台至关重要-一个医疗案例

作者: Roger Morrison
创建日期: 19 九月 2021
更新日期: 19 六月 2024
Anonim
一小时精益数据治理实操框架
视频: 一小时精益数据治理实操框架

内容


资料来源:Everythingpossible / Dreamstime.com

带走:

只有高质量的数据才能生成高质量的分析,因此,正确构造数据至关重要。

在适当的地方实施集成分析平台的想法正在迅速获得认可。随着组织意识到集成分析平台的重要性,许多公司都在争先恐后地实施一个平台。但是在此过程中,数据质量问题并未引起足够的重视。重要的是要注意,数据质量是确定分析平台提供的分析的相关性和质量的最重要因素。在这种情况下,数据质量意味着应将正确格式的正确数据提供给集成分析平台,以便能够提供有意义的分析。但是,诸如系统不兼容,数据结构问题和人员效率低下之类的一些问题,甚至阻止了高质量的集成分析平台提供高质量的分析。

不用说,如果不解决数据质量问题,集成分析平台上的投资回报(ROI)将无法达到预期水平。在这里,我们以医疗保健行业为例,分析影响分析平台使用的数据质量的问题,其中医疗保健行业是数据质量差的最严重的行业之一。

妨碍Analytics平台性能的数据质量问题

数据质量问题可以归纳为以下内容:数据格式记录和捕获不正确,上游系统与分析平台不兼容以及分析不准确。

当没有人关心软件质量时,您就无法提高编程技能。

捕获是人们将数据(例如医学检查报告数据)输入系统的阶段。识别所有相关数据并将其输入系统非常重要。

结构是需要以正确的格式和字段输入正确的数据的阶段。例如,患者体重被认为是数字数据,但是如果将其输入到字段中,则会影响分析质量。

数据传输是将数据加载到分析系统进行分析的阶段。在此阶段数据质量受损的主要原因是缺少与数据库的直接连接。当数据库直接与数据供应链连接时,必填字段将以正确的结构和格式捕获。

下面给出了一些改善数据质量的方法。

当人类用户输入数据时,很可能需要输入大量重复数据。例如,如果输入了有关心脏病患者的数据,则不同的特定条件可能具有不同的代码。每次输入密码;系统应提供建议或自动填写相应的代码。要实现这样的系统,只需要进行一些良好的编程或对代码进行一些调整即可。这样,您将在很大程度上减少人为错误的可能性。如果可能的话,还应该进行验证,以防人类用户输入错误的代码。


缩小供应商和分析系统之间的差距

如前所述,由于供应商和分析引擎之间的设计和实施问题,数据质量受到影响。组织需要努力创建数据提供者系统(例如EHR系统)的最小通用结构,以便以正确的格式将基本数据提供给分析引擎。鉴于有许多不同供应商制造的供应商系统,因此要实现一个通用结构是一个挑战。但是,应该努力建立数据提供者系统的通用最小结构。

结论

提高分析引擎数据质量的最重要步骤似乎是数据供应商系统的通用最小结构。尽管其他步骤(例如使人类更有效地使用数据输入系统)很重要,但它们自然也很容易出错。但是,数据输入和数据传输的标准可以确保将正确格式和结构的正确数据输入到分析引擎中。为此,需要为开发系统和用户界面提供通用的标准和协议。