domingo, 26 de noviembre de 2023

Estadísticas de Libros en el INE

Aprovechando mi reciente aprobado en el Cuerpo Superior de Estadísticos del Estado, no veo mejor manera de empezar con las tareas de la asignatura de matemáticas del Máster en Cultura Científica que con esta entrada tan relacionada con el futuro trabajo que voy a realizar a partir de ahora.

El cometido es elegir una de las estadísticas del Instituto Nacional de Estadística y resumir la información que hay sobre ella. No es fácil elegir una estadística para analizar ya que hay 462 operaciones del Plan Estadístico Nacional vigentes. De esas operaciones, 137 de ellas le corresponden al INE (que se note que tengo reciente el curso selectivo de la oposición).

Tras leer por encima el índice de operaciones estadísticas me he decantado por una que, en realidad, ya no la realiza el INE, pero que voy a analizar por si tengo suerte y me sale plaza en el ministerio que quiero. La estadística elegida es la relacionada con la producción editorial de libros. Esta estadística fue realizada hasta el año 2019 por el INE y la realiza actualmente el Ministerio de Cultura (y aquí se notan mis preferencias). Vamos a analizarla a continuación.

La Estadística de Producción Editorial de Libros consiste, como bien anticipa su nombre, en contar las primeras ediciones y reediciones de los libros y folletos editados en España independientemente de dónde hayan sido impresas y excluye las publicaciones de carácter efímero, las publicaciones editadas con fines publicitarios, las obras musicales,  la producción cartográfica (aunque si incluye los atlas) y, en general, cualquier publicación con menos de 5 páginas. Puede encontrarse en el siguiente enlace: Estadística de producción editorial de libros.

Como en todas las estadísticas, y aunque de todos es bien conocido que la página del INE no es la mejor página para encontrar la información que uno quiere, la mejor forma de analizarla es por medio del Informe Metodológico Estandarizado, que incluye todos los datos relevantes de la estadística en cuestión.

En ese informe metodológico podemos encontrar los principales datos de la estadística como la unidad estadística (los títulos de los libros y folletos editados en España), la clasificación utilizada (clasificación temática de la UNESCO), el ámbito geográfico (todo el territorio nacional y con desagregación hasta el nivel provincial), la cobertura temporal (realizada hasta el año 2019 como ya he comentado) y el periodo base (en donde indica que, aunque la serie temporal empieza en 1998, se realizó un cambio de la serie en 2012 contando ahora publicaciones editadas en vez de publicaciones impresas). Debido a esto, presentaremos las gráficas que resumen la estadística con los datos de 2012 y posteriores, ya que los datos de periodos anteriores no son comparables con los datos nuevos.

Aparte de estos elementos, en la metodología hay muchos otros conceptos relacionados con las leyes y políticas que rigen al INE y que permiten el intercambio de información con la Biblioteca Nacional de España (que ha sido necesaria para poder realizar la estadística). Ya que estos elementos son de ámbito legislativo, no vamos a mencionarlos. Lo único relevante de esta parte es que, como es una estadística exhaustiva, no hay errores de muestreo en ella.

Veamos ahora las principales gráficas que nos resumen la información de la estadística de producción editorial de libros.

En primer lugar, podemos observar el número de títulos por año:

En esta gráfica observamos un descenso pronunciado del año 2012 al 2013 y luego una lenta subida hasta el año 2019, aunque sin alcanzar los datos que se tenían del año 2012.

También, para un año, podemos ver la distribución de los libros por temática:

Podemos observar que el mayor número de títulos pertenecen a la categoría de Literatura (para sorpresa de nadie si pensamos en los libros que se venden normalmente en las librerías).

Además, podemos estudiar la evolución de los libros de cierta temática entre varios años. Como no podía ser de otro modo (y aunque seguramente la temática de Literatura sea más interesante al contener más datos) he decidido mostrar está gráfica con los libros sobre matemáticas:

Lo interesante de esta gráfica es observar que la evolución por año sigue una distribución completamente distinta a la que veíamos con todos los libros en total.

Si lo hacemos para literatura (que como idea principal debería ser más parecida a esta gráfica inicial) obtenemos esto:

Podemos observar que, menos en el año 2012, la distribución de los datos sigue la misma distribución que en la gráfica general. Estos datos me llevan a pensar, entonces, qué tipo de libros se imprimieron en el año 2012:

Observamos que sigue la misma distribución que para los libros del año 2019.

Al observar la tabla de los valores exactos de los libros por temática entre 2012 y 2019 se llega a un resultado interesante: había más libros en 2012 que en 2019, pero esas diferencias no se deben a los libros de literatura (de hecho, hay más libros de este tipo en 2019), si no a la mayor cantidad de libros en el resto de temáticas en 2012 que en 2019. Un resumen de los datos más relevantes de esa tabla es la siguiente:

Tema

Núm. 2019

Núm. 2012

TOTAL

64.154

69.668

Literatura

26.679

21.684

Derecho y AAPP

3.422

4.683

Sanidad

2.995

4.471

Historia

4.213

3.465

Filosofía/Psicología

2.160

3.385

Política/Economía

2.187

3.164

Ciencias naturales

2.131

3.142

Artes y fotografía

2.938

3.060

OTROS

17.429

22.614

 Resuelto este misterio, solo queda decir que existen otros datos y gráficas para esta estadística, como la distribución de los libros por idioma y año, cuántos libros son primeras ediciones o rediciones por año o la distribución de los libros editados por comunidades. El último ejemplo da una gráfica con el mapa de España, como podemos ver a continuación para el año 2019:

Creo que, de forma general, se ha mostrado un resumen de lo que puede llegar a ofrecer la Estadística de Producción Editorial de Libros. Además, se ha realizado un pequeño estudio estadístico jugando con los resultados que han dado estos gráficos para dos años distintos (2012 y 2019).

A mi modo de ver, para una persona menos familiarizada con las estadísticas o las matemáticas, esto es lo mejor que puede ofrecer el INE: una serie de datos abiertos sobre un montón de temáticas y la posibilidad de jugar con estos datos para obtener resultados interesantes sobre temas conocidos a través de gráficas, que para el público general son más fáciles de entender que los datos en bruto. Yo, al menos, me lo he pasado en grande realizando esta tarea (y eso que de matemáticas y estadísticas sé un rato).

No hay comentarios:

Publicar un comentario

¿Qué medio de transporte es mejor en una ciudad grande como Madrid?

Un año más he sobrevivido a los contenidos de las asignaturas del Máster en Cultura Científica de la UPNA. He entregado todas las tareas (au...