Supongamos que tienes una lista de URLs de sitios web y deseas extraer el título de cada página para realizar un análisis posterior. En lugar de procesar cada URL secuencialmente, puedes aprovechar el procesamiento en paralelo para acelerar el proceso. Aquí hay un ejemplo de cómo podrías hacerlo,
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 |
#!/bin/bash # Lista de URLs urls=( "https://www.ejemplo1.com" "https://www.ejemplo2.com" "https://www.ejemplo3.com" # Añadir más URLs según sea necesario ) # Función para extraer el título de una página web extract_title() { url="$1" title=$(curl -s "$url" | grep -o "<title>.*</title>" | sed -e 's/<[^>]*>//g') echo "Título de $url: $title" } # Exportar la función para que esté disponible para xargs export -f extract_title # Utilizar xargs para ejecutar la función extract_title en paralelo printf "%s\n" "${urls[@]}" | xargs -I {} -P 4 bash -c 'extract_title "$@"' _ {} echo "Proceso de extracción de títulos completado." |