当前位置: Oracle DBA培训网-优技培训 >> Hadoop大数据 > Hadoop培训教程 >

Hadoop大数据培训:HDFS空间回收

Hadoop大数据培训:HDFS空间回收

Hadoop大数据培训:HDFS空间回收,1.文件的删除和恢复,2.减小副本系数

1.文件的删除和恢复

当用户或应用删除某个文件时,这个文件并没有立刻从HDFS中被删除。相反,HDFS将这个文件重命名,并转移到trash目录下。当文件还在trash目录下时,该文件可以被迅速恢复。文件在trash目录中保存的时间是可设置的,当超过设定的时间后,NameNode就会将该文件从namespace中删除。文件被删除的同时也将释放关联该文件的数据块。可以看到,在文件被用户删除和HDFS空闲空间的增加之间会有一个等待时间延迟。

当被删除的文件还保留在trash目录中时,如果用户想恢复这个文件,可以在trash目录下检索该文件。trash目录仅仅保存被删除文件的最近一次副本。trash目录与其他文件目录没有什么不同,除了HDFS在该目录上应用了一个特殊的策略来自动删除文件,目前的默认策略是删除保留超过6小时的文件。这个策略可以定义成可设置的。

2.减小副本系数

在减小某个文件的副本系数后,NameNode会选择要删除的过剩的副本。下次心跳检测就将该信息传递给DataNode,DataNode就会移除相应的Block并释放空间。同样,在调用setReplication API结束和集群中的空闲空间增加时会有一个时间延迟。

技术沙龙MORE+

Oracle技术沙龙:【数据保护顶尖技术-MAA】首次全国首播12c MAA技术 云数据库加上MAA技术组成最豪华的技...
Oracle技术沙龙第49期:【Oracle 数据库云技术分享】Oracle技术沙龙第49期:【Oracle 数据库云技术分享】本次技术沙...
Oracle技术沙龙第48期:【Oracle 12c RAC安装】小编:今天讲什么内容呢?以后有什么用呢? 大师:今天讲的是12c...
我要参加技术沙龙