En este tema, aprenderemos sobre los comandos básicos y avanzados del Sistema de Archivos Distribuido de Hadoop (HDFS). Estos comandos son esenciales para interactuar con HDFS, permitiéndonos realizar operaciones como crear directorios, copiar archivos, eliminar datos y más.

  1. Introducción a los Comandos de HDFS

HDFS proporciona una serie de comandos que se pueden utilizar desde la línea de comandos para gestionar archivos y directorios. Estos comandos son similares a los comandos de Unix/Linux, pero están diseñados para trabajar en el entorno distribuido de Hadoop.

1.1. Sintaxis General

La sintaxis general para ejecutar comandos de HDFS es:

hdfs dfs -<comando> <opciones>

Donde:

  • hdfs dfs es el prefijo que indica que estamos ejecutando un comando de HDFS.
  • <comando> es el comando específico que queremos ejecutar.
  • <opciones> son los argumentos adicionales que el comando puede requerir.

  1. Comandos Básicos de HDFS

2.1. Listar Contenidos de un Directorio

Para listar los contenidos de un directorio en HDFS, utilizamos el comando ls:

hdfs dfs -ls <ruta_del_directorio>

Ejemplo:

hdfs dfs -ls /user/hadoop

2.2. Crear un Directorio

Para crear un nuevo directorio en HDFS, utilizamos el comando mkdir:

hdfs dfs -mkdir <ruta_del_directorio>

Ejemplo:

hdfs dfs -mkdir /user/hadoop/nuevo_directorio

2.3. Copiar Archivos desde el Sistema de Archivos Local a HDFS

Para copiar archivos desde el sistema de archivos local a HDFS, utilizamos el comando copyFromLocal:

hdfs dfs -copyFromLocal <ruta_local> <ruta_hdfs>

Ejemplo:

hdfs dfs -copyFromLocal /home/usuario/archivo.txt /user/hadoop/

2.4. Copiar Archivos desde HDFS al Sistema de Archivos Local

Para copiar archivos desde HDFS al sistema de archivos local, utilizamos el comando copyToLocal:

hdfs dfs -copyToLocal <ruta_hdfs> <ruta_local>

Ejemplo:

hdfs dfs -copyToLocal /user/hadoop/archivo.txt /home/usuario/

2.5. Eliminar Archivos o Directorios

Para eliminar archivos o directorios en HDFS, utilizamos el comando rm:

hdfs dfs -rm <ruta_del_archivo_o_directorio>

Para eliminar un directorio y su contenido de manera recursiva, utilizamos la opción -r:

hdfs dfs -rm -r <ruta_del_directorio>

Ejemplo:

hdfs dfs -rm /user/hadoop/archivo.txt
hdfs dfs -rm -r /user/hadoop/nuevo_directorio

2.6. Ver el Contenido de un Archivo

Para ver el contenido de un archivo en HDFS, utilizamos el comando cat:

hdfs dfs -cat <ruta_del_archivo>

Ejemplo:

hdfs dfs -cat /user/hadoop/archivo.txt

  1. Comandos Avanzados de HDFS

3.1. Mover Archivos o Directorios

Para mover archivos o directorios dentro de HDFS, utilizamos el comando mv:

hdfs dfs -mv <ruta_origen> <ruta_destino>

Ejemplo:

hdfs dfs -mv /user/hadoop/archivo.txt /user/hadoop/archivos/

3.2. Cambiar Permisos de Archivos o Directorios

Para cambiar los permisos de archivos o directorios en HDFS, utilizamos el comando chmod:

hdfs dfs -chmod <permisos> <ruta_del_archivo_o_directorio>

Ejemplo:

hdfs dfs -chmod 755 /user/hadoop/archivo.txt

3.3. Ver el Espacio Utilizado

Para ver el espacio utilizado por los archivos y directorios en HDFS, utilizamos el comando du:

hdfs dfs -du <ruta_del_directorio>

Ejemplo:

hdfs dfs -du /user/hadoop

3.4. Ver el Estado de un Archivo

Para ver el estado de un archivo en HDFS, utilizamos el comando stat:

hdfs dfs -stat <ruta_del_archivo>

Ejemplo:

hdfs dfs -stat /user/hadoop/archivo.txt

  1. Ejercicios Prácticos

Ejercicio 1: Crear y Listar Directorios

  1. Crea un directorio llamado practica en tu directorio de usuario en HDFS.
  2. Lista el contenido del directorio practica.

Solución:

hdfs dfs -mkdir /user/hadoop/practica
hdfs dfs -ls /user/hadoop/practica

Ejercicio 2: Copiar y Ver Archivos

  1. Copia un archivo llamado datos.txt desde tu sistema de archivos local a HDFS en el directorio practica.
  2. Verifica el contenido del archivo datos.txt en HDFS.

Solución:

hdfs dfs -copyFromLocal /home/usuario/datos.txt /user/hadoop/practica/
hdfs dfs -cat /user/hadoop/practica/datos.txt

Ejercicio 3: Eliminar Archivos y Directorios

  1. Elimina el archivo datos.txt del directorio practica.
  2. Elimina el directorio practica.

Solución:

hdfs dfs -rm /user/hadoop/practica/datos.txt
hdfs dfs -rm -r /user/hadoop/practica

  1. Conclusión

En esta sección, hemos aprendido los comandos básicos y avanzados de HDFS que son esenciales para gestionar archivos y directorios en el Sistema de Archivos Distribuido de Hadoop. Estos comandos nos permiten realizar operaciones como crear, copiar, mover y eliminar archivos y directorios, así como cambiar permisos y ver el estado de los archivos. Con esta base, estamos preparados para manejar datos en HDFS de manera eficiente y efectiva.

En el próximo tema, profundizaremos en la Replicación de Datos en HDFS, donde aprenderemos cómo HDFS asegura la disponibilidad y la tolerancia a fallos mediante la replicación de datos.

© Copyright 2024. Todos los derechos reservados