请问大数据平台容器化之后,flink、spark等计算任务运行到容器上了,那相应原有部署模式下计算任务读写数据存储的HDFS运行在哪里?读写性能相对原有物理机部署模式有多大差异?
在大数据平台容器化后,计算任务如flink、spark等可能会运行在容器中,而原有部署模式下的HDFS(Hadoop分布式文件系统)可以选择以下几种方式运行:
总体而言,大数据平台容器化后,计算任务读写数据存储的HDFS的性能可能会相对原有物理机部署模式有一定的差异。具体差异的大小取决于容器化部署的具体方式以及网络传输的性能。为了最大程度地减少性能损失,可以考虑将HDFS作为一个容器运行在同一集群中,或者将HDFS部署在宿主机上,并且尽量减少计算任务与HDFS之间的网络传输。