En este tema, aprenderemos sobre los comandos básicos y avanzados del Sistema de Archivos Distribuido de Hadoop (HDFS). Estos comandos son esenciales para interactuar con HDFS, permitiéndonos realizar operaciones como crear directorios, copiar archivos, eliminar datos y más.
- Introducción a los Comandos de HDFS
 
HDFS proporciona una serie de comandos que se pueden utilizar desde la línea de comandos para gestionar archivos y directorios. Estos comandos son similares a los comandos de Unix/Linux, pero están diseñados para trabajar en el entorno distribuido de Hadoop.
1.1. Sintaxis General
La sintaxis general para ejecutar comandos de HDFS es:
Donde:
hdfs dfses el prefijo que indica que estamos ejecutando un comando de HDFS.<comando>es el comando específico que queremos ejecutar.<opciones>son los argumentos adicionales que el comando puede requerir.
- Comandos Básicos de HDFS
 
2.1. Listar Contenidos de un Directorio
Para listar los contenidos de un directorio en HDFS, utilizamos el comando ls:
Ejemplo:
2.2. Crear un Directorio
Para crear un nuevo directorio en HDFS, utilizamos el comando mkdir:
Ejemplo:
2.3. Copiar Archivos desde el Sistema de Archivos Local a HDFS
Para copiar archivos desde el sistema de archivos local a HDFS, utilizamos el comando copyFromLocal:
Ejemplo:
2.4. Copiar Archivos desde HDFS al Sistema de Archivos Local
Para copiar archivos desde HDFS al sistema de archivos local, utilizamos el comando copyToLocal:
Ejemplo:
2.5. Eliminar Archivos o Directorios
Para eliminar archivos o directorios en HDFS, utilizamos el comando rm:
Para eliminar un directorio y su contenido de manera recursiva, utilizamos la opción -r:
Ejemplo:
2.6. Ver el Contenido de un Archivo
Para ver el contenido de un archivo en HDFS, utilizamos el comando cat:
Ejemplo:
- Comandos Avanzados de HDFS
 
3.1. Mover Archivos o Directorios
Para mover archivos o directorios dentro de HDFS, utilizamos el comando mv:
Ejemplo:
3.2. Cambiar Permisos de Archivos o Directorios
Para cambiar los permisos de archivos o directorios en HDFS, utilizamos el comando chmod:
Ejemplo:
3.3. Ver el Espacio Utilizado
Para ver el espacio utilizado por los archivos y directorios en HDFS, utilizamos el comando du:
Ejemplo:
3.4. Ver el Estado de un Archivo
Para ver el estado de un archivo en HDFS, utilizamos el comando stat:
Ejemplo:
- Ejercicios Prácticos
 
Ejercicio 1: Crear y Listar Directorios
- Crea un directorio llamado 
practicaen tu directorio de usuario en HDFS. - Lista el contenido del directorio 
practica. 
Solución:
Ejercicio 2: Copiar y Ver Archivos
- Copia un archivo llamado 
datos.txtdesde tu sistema de archivos local a HDFS en el directoriopractica. - Verifica el contenido del archivo 
datos.txten HDFS. 
Solución:
hdfs dfs -copyFromLocal /home/usuario/datos.txt /user/hadoop/practica/ hdfs dfs -cat /user/hadoop/practica/datos.txt
Ejercicio 3: Eliminar Archivos y Directorios
- Elimina el archivo 
datos.txtdel directoriopractica. - Elimina el directorio 
practica. 
Solución:
- Conclusión
 
En esta sección, hemos aprendido los comandos básicos y avanzados de HDFS que son esenciales para gestionar archivos y directorios en el Sistema de Archivos Distribuido de Hadoop. Estos comandos nos permiten realizar operaciones como crear, copiar, mover y eliminar archivos y directorios, así como cambiar permisos y ver el estado de los archivos. Con esta base, estamos preparados para manejar datos en HDFS de manera eficiente y efectiva.
En el próximo tema, profundizaremos en la Replicación de Datos en HDFS, donde aprenderemos cómo HDFS asegura la disponibilidad y la tolerancia a fallos mediante la replicación de datos.
Curso de Hadoop
Módulo 1: Introducción a Hadoop
- ¿Qué es Hadoop?
 - Visión General del Ecosistema Hadoop
 - Hadoop vs Bases de Datos Tradicionales
 - Configuración del Entorno Hadoop
 
Módulo 2: Arquitectura de Hadoop
- Componentes Principales de Hadoop
 - HDFS (Sistema de Archivos Distribuido de Hadoop)
 - Marco de Trabajo MapReduce
 - YARN (Yet Another Resource Negotiator)
 
Módulo 3: HDFS (Sistema de Archivos Distribuido de Hadoop)
Módulo 4: Programación MapReduce
- Introducción a MapReduce
 - Flujo de Trabajo de un Job MapReduce
 - Escribiendo un Programa MapReduce
 - Técnicas de Optimización de MapReduce
 
Módulo 5: Herramientas del Ecosistema Hadoop
Módulo 6: Conceptos Avanzados de Hadoop
- Seguridad en Hadoop
 - Gestión de Clústeres Hadoop
 - Ajuste de Rendimiento de Hadoop
 - Serialización de Datos en Hadoop
 
Módulo 7: Aplicaciones del Mundo Real y Estudios de Caso
- Hadoop en Almacenamiento de Datos
 - Hadoop en Aprendizaje Automático
 - Hadoop en Procesamiento de Datos en Tiempo Real
 - Estudios de Caso de Implementaciones de Hadoop
 
