技术正在迅速发展,并且随之而来的是社会日常运作的信息。然而,需要组织,分析和交叉数据量以预测某些模式。这是所谓的“大数据”的主要功能之一,21世纪的水晶球能够预测对特定医疗的反应,智能建筑的运作甚至基于某些变量的太阳行为。

来自科尔多瓦大学计算机科学与数值分析系的KIDS研究小组的研究人员能够根据同一组输入变量改进同时预测多个变量的模型,从而减少预测所需数据的大小。精确。这方面的一个例子是根据一系列变量预测与土壤质量有关的若干参数的方法,例如种植作物,耕作和使用杀虫剂。“当您处理大量数据时,有两种解决方案。您要么提高计算机性能,要么非常昂贵,要么减少正确完成流程所需的信息量,”研究员Sebastian Ventura说。该研究文章的作者之一。在构建预测模型时,需要处理两个问题:发挥作用的变量数量以及为获得最可靠结果而输入系统的示例数量。有了更少的想法,该研究已经能够通过消除那些冗余或“嘈杂”的例子来减少示例的数量,因此不会为创建更好的预测模型贡献任何有用的信息。

正如该研究的第一作者奥斯卡雷耶斯所指出的那样,“我们已经开发出一种技术,可以告诉你需要哪些例子,这样预测不仅可靠,而且甚至可能更好。”在一些数据库中,在分析的18个数据库中,他们能够在不影响预测性能的情况下将信息量减少80%,这意味着不到原始数据的一半使用。所有这些,雷耶斯说,“意味着在模型建设中节省能源和资金,因为需要更少的计算能力。”此外,它还意味着节省时间,这对于实时工作的应用程序来说很有意义,因为“如果您需要每五分钟进行一次预测,那么模型运行半小时就没有意义。”正如该研究的作者所指出的那样,基于几个变量 - 多输出回归模型 - 同时预测多个变量(可能彼此相关)的这些系统由于范围广而变得越来越显着“可以在这种自动学习模式下进行分析”的应用范围,例如与医疗保健,水质,建筑物冷却系统和环境研究相关的应用。