UNIX – Ejemplos y trucos para el lenguaje de programación AWK.-

Ejemplo para sumar el tamaño total ocupado por los ficheros de un directorio:

ls -l /var/log/httpd | awk '{ sum += $5 } END { print sum }'

1	ls -l /var/log/httpd \| awk '{ sum += $5 } END { print sum }'

Podemos hacer mas flexible la suma de columnas en AWK∞ añadiendo una condición, en este ejemplo limitamos la suma del tamaño de los ficheros a aquellos en los que el usuario «apache» sea el propietario del mismo:

ls -l /var/log/httpd | awk ' $3 == "apache" { sum += $5 } END { print sum }'

1	ls -l /var/log/httpd \| awk ' $3 == "apache" { sum += $5 } END { print sum }'

Tip! Obtener el tamaño total ocupado por un determinado tipo de ficheros: con find filtramos por el tipo de extensión, con esta obtenemos el tamaño total de cada fichero y finalmente hacemos la suma con AWK:

awk '/Invalid user/ { count+=1 } END { print count }' /var/log/secure

1	awk '/Invalid user/ { count+=1 } END { print count }' /var/log/secure

También podemos utilizar AWK para sacar la media de los valores que sumamos en una columna dividiendo el total entre NR (Number of Records). Ejemplo para obtener el RSS medio que consumen los procesos nginx:

ps aux | grep nginx | awk '{ sum += $6 } END { print "Average = ", sum/NR }'

1	ps aux \| grep nginx \| awk '{ sum += $6 } END { print "Average = ", sum/NR }'

Ejemplo para imprimir con AWK un determinado rango de columnas, en este caso se procesa un log de Apache para imprimir únicamente el contenido entre la primera y quinta columna:

cat /var/log/apache2/woop.es-access.log | awk '{ for (x=1; x<=5; x++) {  printf "%s ", $x } printf "\n" }'

1	cat /var/log/apache2/woop.es-access.log \| awk '{ for (x=1; x<=5; x++) { printf "%s ", $x } printf "\n" }'

Utilizando NF (Number of Fields, número de campos en la línea actual) podemos imprimir el contenido desde una determinada columna hasta el final, en este ejemplo analizamos el log del servicio CRON para imprimir el último campo (que se corresponde al comando ejecutado), posteriormente lo filtramos con sort + uniq para listar de mayor a menor la frecuencia de los crontabs que mas se ejecutan:

 awk '$7 == "CMD" { for (x=8; x<=NF; x++) { printf "%s ", $x } printf "\n" }' /var/log/cron | sort  | uniq -c | sort -nr

1	awk '$7 == "CMD" { for (x=8; x<=NF; x++) { printf "%s ", $x } printf "\n" }' /var/log/cron \| sort \| uniq -c \| sort -nr

Con este sencillo hack para AWK∞ podemos imprimir el contenido entre dos determinados patrones; Por ejemplo, vamos a analizar un caso donde nos interesa extraer el contenido que se encuentra entre los caracteres [ y ]:

$ cat example.txt
[noop] anticipatory deadline cfq
noop anticipatory deadline [cfq]
noop anticipatory [prueba
multilinea]

$ awk '$0=$2' FS=[ RS=] example.txt
noop
cfq
prueba
multilinea

$ cat example.txt

[noop] anticipatory deadline cfq

noop anticipatory deadline [cfq]

noop anticipatory [prueba

multilinea]

$ awk '$0=$2' FS=[ RS=] example.txt

noop

cfq

prueba

multilinea

Establecemos la variable FS (Field Separator, o separador de campos, similar al IFS de BASH∞) al valor [. Es decir, FS contiene el primer patrón.

Al utilizar [ como FS tendremos el contenido separado en X partes: la variable $1 contendrá lo que se queda a la «izquierda» del patrón, $2 contiene lo que queda a la derecha, y así sucesivamente. Con la asignación $0=$2 la línea completa pasa a tener el valor que está a la «derecha» del patrón que hemos utilizado como FS.

Utilizamos RS=[ (Input Record Separator) para marcar el final del contenido que buscamos, así cuando AWK∞ se encuentra con el patrón ] lo toma como el final del contenido, es decir, RS contiene el segundo patrón.

En este otro ejemplo, vamos a extraer las cadenas que se encuentran entre las etiquetas HTML

<a href=" y ">

1	<a href=" y ">

de la página de un usuario del servicio Twitter, de modo que obtendremos un listado de enlaces que este ha publicado:

$ curl -s -o - http://twitter.com/santisaez | awk -v FS='<a href="' -v RS='">' '$0=$2'
http://tr.im/D9JQ
http://tr.im/Cduv
http://tr.im/BHg9
http://tr.im/BCIu
http://tr.im/AdYR
(..)

$ curl -s -o - http://twitter.com/santisaez | awk -v FS='<a href="' -v RS='">' '$0=$2'

http://tr.im/D9JQ

http://tr.im/Cduv

http://tr.im/BHg9

http://tr.im/BCIu

http://tr.im/AdYR

(..)

UNIX – Ejemplos y trucos para el lenguaje de programación AWK.-

Una respuesta en “UNIX – Ejemplos y trucos para el lenguaje de programación AWK.-”

Deja una respuesta Cancelar la respuesta

Si te gusta este contenido, se agradece tu apoyo en su mantenimiento. Cualquier cantidad por pequeña que sea será bien recibida.

Comentarios recientes

Archivos