葡萄京官方网站|www.370.com[官网首页]

高性能计算

高性能计算集群(英语:High-PerformanceComputingCluster,简称HPCC),也被称为数据分析超级计算机,是一个由律商联讯风险解决方案发展的开放源代码数据密集型计算系统平台。

HPCC(高性能计算集群)也称为DAS(数据分析超级计算机),是由LexisNexis风险解决方案开发的开源,数据密集型计算系统平台。HPCC平台整合了在商品计算集群上实现的软件架构,为使用大数据的应用程序提供高性能的数据并行处理。HPCC平台包括支持并行批处理数据处理(Thor)和使用索引数据文件(Roxie)的高性能在线查询应用程序的系统配置。HPCC平台还包含一个以数据为中心的并行数据处理声明性编程语言ECL。

HPCC系统体系结构包括两个不同的集群处理环境,每个集群处理环境都可以独立进行优化,以实现并行数据处理目的。这些平台中的第一个被称为数据精炼厂,其总体目的是用于任何目的的大量的任何类型的原始数据的一般处理,但通常用于数据清理和卫生,提取,转换,原始数据的加载处理,记录链接和实体解析,大规模特设的复杂分析以及创建键控数据和索引以支持高性能结构化查询和数据仓库应用程序。数据精炼厂也被称为Thor,这个大锤象征着把大量的原始数据压缩成有用的信息。Thor集群的功能,执行环境,文件系统和功能与Google和Hadoop MapReduce平台类似。

中文/英文